首页 \ 教程 \ hadoop

知识点

hadoop

Hadoop学习全程记录——Hadoop入门

Hadoop学习全程记录——使用sqoop将MySQL中数据导入到Hive中

Hadoop学习全程记录——在Eclipse中运行第一个MapReduce程序

Hadoop Hive入门学习笔记

fw：Hadoop、Pig、Hive、Storm、NOSQL 学习资源收集【Updating】

Hive入门之Hive与HBase整合

顶 Hadoop、Pig、Hive、Storm、NOSQL 学习资源收集【Updating】

Hadoop Hive与Hbase整合

Hadoop和Hive的实践应用

Hive 和 Hadoop 关系

Hadoop数据迁入到Hive

[Hadoop] Hive 性能+特性

Hadoop学习总结之三：Map-Reduce入门

phpHiveAdmin是如何通过Hive/Hadoop工作的

Hadoop学习全程记录——Hive入门

2019-03-28 14:08|来源: 网络

hive是Facebook的产品，很不错。
官方文档：http://wiki.apache.org/hadoop/Hive/GettingStarted有很详细说明。

基本上根据文档能对hive快速入门。在使用过程中可能会出现以下问题：

当执行下面命令时：

       Java代码 
         
$ $HIVE_HOME/bin/hive

可能会出现Invalid maximum heap size: -Xmx4096m提示。

那是因为hive默认Hadoop heap size为4096m。如果出现这个提示，你需要修改hadoop heap size的大小。方法如下：

1.执行命令。

       Java代码 
         
$ sudo gedit $HIVE_HOME/bin/ext/util/execHiveCmd.sh

2.在打开的sh文件中修改HADOOP_HEAPSIZE的值（如将默认的4096改为1024），保存，退出。

将

       Java代码 
         
     
# increase the threashold for large queries  
HADOOP_HEAPSIZE=4096   

改为

       Java代码 
         
     
# increase the threashold for large queries  
HADOOP_HEAPSIZE=1024   

相关问答

hadoop学习之hbase和hive的区别[2022-10-20]

这个要根据自己处理数据的方式来选择。 1、Hive是支持SQL语句的，执行会调用mapreduce，所以延迟比较高； 2、HBase是面向列的分布式数据库，使用集群环境的内存做处理，效率会比hive要高，但是不支持sql语句。 Hadoop开发和运行处理大规模数据，需要用hbase做数据库，但由于hbase没有类sql查询方式，所以操作和计算数据非常不方便，于是整合hive，让hive支撑在hbase数据库层面的 hql查询，hive也即做数据仓库。
哪个不是Hadoop 的核心组件 hbase hive zookeeper riak[2022-04-10]

riak 华师大的吧- - 下面来简单介绍各个组件的作用： HDFS(Hadoop distribute file system)——Hadoop生态系统的基础组件Hadoop分布式文件系统。它是其他一些工具的基础HDFS的机制是将大量数据分布到计算机集群上，数据一次写入，但可以多次读取用于分析。HDFS让Hadoop可以最大化利用磁盘。 HBase—— 一个构建在HDFS之上的面向列的NoSql数据库，HBase用于对打量数据进行快速读取/写入。HBase将Zookeeper用于自身的管理，以保证其所有组 ...
hadoop之hive开发入门,谁有好的实例(带讲解)，视频，书籍什么的求助[2022-01-15]

深入浅出Hive企业级架构优化、Hive Sql优化、压缩和分布式缓存(企业Hadoop应用核心产品) LS的Q
oracle 中的 nulls last 在 hadoop 的 hive 上怎么写。。[2022-05-08]

order by nulls last 不是标准sql,oracle设计的可以这么写,再指定一个虚拟列来辅助排序 order by case when col is null then 0 else 1 end , col desc
学习hadoop和spark怎么入门[2024-02-16]

不一定，如果你不用Hadoop的HDFS和YARN，完全可以在学习Spark的时候从本地载入数据，部署用standlone模式。Spark替代的是Hadoop中的MapReduce编程范式，不包括存储和资源管理模块。 Spark的算子很多，写程序来看比HadoopMapReduce要灵活很多
hadoop单机模式可以安装hive吗?[2022-07-09]

当然可以了。hive只是一个数据仓库的工具。运行一些HQL语句。不一定非得分布式。
安装了HADOOP HIVE后hive无法运行[2023-09-27]

①hive中的hive*-site.xml需要添加一些内容（方便的话，可以贴出配置文件） ②需要将相应的lib下的jar和conf下的xml配置文件拷贝到hive中
何时使用Hadoop，HBase，Hive和Pig？(When to use Hadoop, HBase, Hive and Pig?)[2023-03-06]

MapReduce只是一个计算框架。 HBase与此无关。也就是说，您可以通过编写MapReduce作业来有效地将数据提取到/从HBase中获取。或者，您可以使用其他HBase API（如Java）编写顺序程序来放置或获取数据。但是我们使用Hadoop，HBase等来处理大量的数据，所以没有什么意义。当您的数据太大时，使用正常的顺序程序将非常低效。回到你问题的第一部分，Hadoop基本上是两件事：一个分布式文件系统（HDFS） +一个计算或处理框架（MapReduce）。像所有其他FS一样， ...
如何避免Hadoop PIG和Hive中的不良记录？(How to avoid bad records in Hadoop PIG and Hive?)[2023-04-05]

Hive中的记录处理不当要筛选配置单元中的错误记录，可以在查询中启用跳过模式。跳过模式的Hive配置是： SET mapred.skip.mode.enabled = true; 您需要在hive查询之前设置上面的命令。您还可以通过提供以下参数来限制配置： SET mapred.map.max.attempts = 100; SET mapred.reduce.max.attempts = 100; SET mapred.skip.map.max.skip.records = 30000; SET ...
如何在VM框中的Ubuntu Linux中安装Hadoop和Hive？(How Install Hadoop and Hive in Ubuntu Linux in VM box?)[2022-10-08]

既然你是Hadoop和Hive的新手，你最好继续使用他们的.tar.gz档案，恕我直言。如果事情不顺利，你不必一次又一次地完成整个卸载并重新安装。只需下载hadoop-1.1.2.tar.gz，解压缩，将解压缩的文件夹放在一个方便的位置，然后继续进行配置。如果您需要有关配置的一些帮助，可以访问此帖子。我试图用所有细节解释完整的程序。配置Hive非常简单。下载.tar.gz文件。解压缩就像你使用Hadoop一样。然后按照此处显示的步骤操作。 Since you are new to both ...

知识点

相关文章

最近更新

Hadoop学习全程记录——Hive入门

相关问答

hadoop学习之hbase和hive的区别[2022-10-20]

哪个不是Hadoop 的核心组件 hbase hive zookeeper riak[2022-04-10]

hadoop之hive开发入门,谁有好的实例(带讲解)，视频，书籍什么的求助[2022-01-15]

oracle 中的 nulls last 在 hadoop 的 hive 上怎么写。。[2022-05-08]

学习hadoop和spark怎么入门[2024-02-16]

hadoop单机模式可以安装hive吗?[2022-07-09]

安装了HADOOP HIVE后hive无法运行[2023-09-27]

何时使用Hadoop，HBase，Hive和Pig？(When to use Hadoop, HBase, Hive and Pig?)[2023-03-06]

如何避免Hadoop PIG和Hive中的不良记录？(How to avoid bad records in Hadoop PIG and Hive?)[2023-04-05]

如何在VM框中的Ubuntu Linux中安装Hadoop和Hive？(How Install Hadoop and Hive in Ubuntu Linux in VM box?)[2022-10-08]

知识点

相关文章

最近更新

Hadoop学习全程记录——Hive入门

相关问答

hadoop学习之hbase和hive的区别[2022-10-20]

哪个不是Hadoop 的核心组件 hbase hive zookeeper riak[2022-04-10]

hadoop之hive开发入门,谁有好的实例(带讲解)，视频，书籍什么的求助[2022-01-15]

oracle 中的 nulls last 在 hadoop 的 hive 上 怎么写。。[2022-05-08]

学习hadoop和spark怎么入门[2024-02-16]

hadoop单机模式可以安装hive吗?[2022-07-09]

安装了HADOOP HIVE后hive无法运行[2023-09-27]

何时使用Hadoop，HBase，Hive和Pig？(When to use Hadoop, HBase, Hive and Pig?)[2023-03-06]

如何避免Hadoop PIG和Hive中的不良记录？(How to avoid bad records in Hadoop PIG and Hive?)[2023-04-05]

如何在VM框中的Ubuntu Linux中安装Hadoop和Hive？(How Install Hadoop and Hive in Ubuntu Linux in VM box?)[2022-10-08]

oracle 中的 nulls last 在 hadoop 的 hive 上怎么写。。[2022-05-08]