3赞

蜂巢插入与蜂巢负载:有什么权衡？

作者：拾味湖 | 2023-09-06 13:29

如何解决《蜂巢插入与蜂巢负载:有什么权衡？》经验，为你挑选了1个好方法。

我正在学习Hadoop /大数据技术.我想将数据大量摄取到hive中.我开始使用一个简单的CSV文件,当我尝试使用INSERT命令按记录加载每个记录时,一个记录插入本身大约需要1分钟.当我将文件放入HDFS然后使用该LOAD命令时,它是瞬间的,因为它只是将文件复制到hive的仓库中.我只是想知道当他们选择LOAD代替时,必须要面对的是什么INSERT.

1> Subash..：

Load - Hive在将数据加载到表中时不进行任何转换.加载操作当前是纯复制/移动操作,它将数据文件移动到与Hive表对应的位置.

Insert -Query结果可以通过使用insert子句插入到表中,然后运行map reduce job.因此执行需要一些时间.

如果你想优化/调整插入语句.下面是一些技巧:

1.将hive-site.xml中的执行引擎设置为Tez(如果已安装)

 set hive.execution.engine=tez;

2.USE ORCFILE

CREATE TABLE A_ORC (

customerID int, name string, age int, address string

) STORED AS ORC tblproperties (“orc.compress" = “SNAPPY”);

INSERT INTO TABLE A_ORC SELECT * FROM A;

3.在hive中并发作业可以节省整个作业的运行时间.要实现hive-default.xml,需要更改下面的config:

set hive.exec.parallel=true;
set hive.exec.parallel.thread.number=;

有关详细信息,请访问http://hortonworks.com/blog/5-ways-make-hive-queries-run-faster/ 希望这会有所帮助.

推荐阅读

程序员
不包含拆分方法

如何解决《不包含拆分方法》经验，为你挑选了1个好方法。 ... [详细]
程序员
在Java8函数样式中,如何将值映射到现有的键值对

如何解决《在Java8函数样式中,如何将值映射到现有的键值对》经验，为你挑选了1个好方法。 ... [详细]
程序员
列出仅在当前目录中超过x天的所有文件

如何解决《列出仅在当前目录中超过x天的所有文件》经验，为你挑选了1个好方法。 ... [详细]
程序员
重新启动后，Kafka主题不再存在

如何解决《重新启动后，Kafka主题不再存在》经验，为你挑选了1个好方法。 ... [详细]
程序员
有没有办法将现有的"特征"分配给史诗？

如何解决《有没有办法将现有的"特征"分配给史诗？》经验，为你挑选了1个好方法。 ... [详细]
程序员
BEM与SASS和:悬停

如何解决《BEM与SASS和:悬停》经验，为你挑选了2个好方法。 ... [详细]
程序员
如何使用FOSHttpCacheBundle和Varnish进行缓存标记？

如何解决《如何使用FOSHttpCacheBundle和Varnish进行缓存标记？》经验，为你挑选了1个好方法。 ... [详细]
程序员
tableview使用swift 2.0在ios开发中不显示单元分隔符行.xcode 7

如何解决《tableview使用swift2.0在ios开发中不显示单元分隔符行.xcode7》经验，为你挑选了1个好方法。 ... [详细]
程序员
如何在elixir的Ecto查询中使用"case-when"？

如何解决《如何在elixir的Ecto查询中使用"case-when"？》经验，为你挑选了1个好方法。 ... [详细]
程序员
使用未部署在Azure中的应用程序访问Azure Key Vault存储的密钥

如何解决《使用未部署在Azure中的应用程序访问AzureKeyVault存储的密钥》经验，为你挑选了1个好方法。 ... [详细]
程序员
并行计算:仅在每个线程中加载一次包

如何解决《并行计算:仅在每个线程中加载一次包》经验，为你挑选了1个好方法。 ... [详细]
程序员
如何在std :: map中创建新条目而不复制条目值 - 没有指针

如何解决《如何在std::map中创建新条目而不复制条目值-没有指针》经验，为你挑选了1个好方法。 ... [详细]
程序员
在Scala 2.11中进行模式匹配的穷举检查

如何解决《在Scala2.11中进行模式匹配的穷举检查》经验，为你挑选了1个好方法。 ... [详细]
程序员
如何更改Rails 4中的按钮文本？

如何解决《如何更改Rails4中的按钮文本？》经验，为你挑选了1个好方法。 ... [详细]
程序员
"Objective-C生成的接口标题名称"中的错误

如何解决《"Objective-C生成的接口标题名称"中的错误》经验，为你挑选了1个好方法。 ... [详细]
程序员
列表中的对元素计数

如何解决《列表中的对元素计数》经验，为你挑选了1个好方法。 ... [详细]
程序员
(Array/List/Seq).groupBy是否维护组内的排序顺序？

如何解决《(Array/List/Seq).groupBy是否维护组内的排序顺序？》经验，为你挑选了1个好方法。 ... [详细]
程序员
ASP.NET 5 MVC 6中的web.config

如何解决《ASP.NET5MVC6中的web.config》经验，为你挑选了1个好方法。 ... [详细]
程序员
Java 9或更高版本中的预计泛型专业化,与List <int>:.remove()将如何工作？

如何解决《Java9或更高版本中的预计泛型专业化,与List<int>:.remove()将如何工作？》经验，为你挑选了1个好方法。 ... [详细]
程序员
将PDF文件系统加载到Ionic(Cordova)+ Android + pdf.js应用程序中

如何解决《将PDF文件系统加载到Ionic(Cordova)+Android+pdf.js应用程序中》经验，为你挑选了1个好方法。 ... [详细]

拾味湖

这个屌丝很懒，什么也没留下！

关注作者

Tags | 热门标签

RankList | 热门文章