10赞

Bigtable CSV导入

作者：帆侮听我悄悄说星星 | 2023-09-11 07:30

如何解决《BigtableCSV导入》经验，为你挑选了1个好方法。

我在多个文件(存储在存储桶中)中有一个大的csv数据集(> 5TB),我需要将其导入到Google Bigtable中.文件格式如下:

rowkey,s1,s2,s3,s4
text,int,int,int,int
...

有一个带有hbase的importtsv函数是完美的但是在Windows中使用Google hbase shell时似乎没有这个功能.可以使用这个工具吗？如果没有,实现这一目标的最快方法是什么？我对hbase和Google Cloud几乎没有经验,所以一个简单的例子会很棒.我已经看到一些使用DataFlow的类似示例,但除非必要,否则不愿意学习如何执行此操作.

谢谢

1> Les Vogel - ..：

将这么大的内容导入Cloud Bigtable的理想方法是将您的TSV放在Google云端存储上.

gsutil mb

gsutil -m cp -r gs:///

然后使用Cloud Dataflow.

使用HBase shell创建表,Column Family和输出列.

编写一个小的Dataflow作业来读取所有文件,然后创建一个键,然后编写表.(请参阅此示例以开始使用.)

更简单的方法是:(注意 - 未经测试)

将文件复制到Google云端存储

使用Google Cloud Dataproc,该示例显示了如何创建群集和连接Cloud Bigtable.

ssh 到您的集群主机 - wordcount-mapreduce示例中的脚本将接受 ./cluster ssh

使用HBase TSV导入程序启动Map Reduce作业.

hbase org.apache.hadoop.hbase.mapreduce.ImportTsv -Dimporttsv.columns=a,b,c gs:///

/**

推荐阅读

程序员
如何在使用MySQL的Yii2迁移中实现AUTO_INCREMENT？

如何解决《如何在使用MySQL的Yii2迁移中实现AUTO_INCREMENT？》经验，为你挑选了1个好方法。 ... [详细]
程序员
LinkedIn登录基本示例不起作用

如何解决《LinkedIn登录基本示例不起作用》经验，为你挑选了0个好方法。 ... [详细]
程序员
Spark SQL的where子句排除空值

如何解决《SparkSQL的where子句排除空值》经验，为你挑选了1个好方法。 ... [详细]
程序员
Breakpoint命中Hashmap.put()一个简单的Hello World程序

如何解决《Breakpoint命中Hashmap.put()一个简单的HelloWorld程序》经验，为你挑选了2个好方法。 ... [详细]
程序员
子查询where子句中的MYSQL别名

如何解决《子查询where子句中的MYSQL别名》经验，为你挑选了0个好方法。 ... [详细]
程序员
tsconfig.json - 仅从文件夹构建ts文件

如何解决《tsconfig.json-仅从文件夹构建ts文件》经验，为你挑选了2个好方法。 ... [详细]
程序员
RecylerView无需动画即可滚动到所需位置

如何解决《RecylerView无需动画即可滚动到所需位置》经验，为你挑选了0个好方法。 ... [详细]
程序员
执行上下文和调度程序 - 最佳实践,有用的配置和文档

如何解决《执行上下文和调度程序-最佳实践,有用的配置和文档》经验，为你挑选了0个好方法。 ... [详细]
程序员
Android Google SignIn无法在调试模式下运行:GoogleSignInResult为false

如何解决《AndroidGoogleSignIn无法在调试模式下运行:GoogleSignInResult为false》经验，为你挑选了2个好方法。 ... [详细]
程序员
如何在Sublime Text 3中为ruby设置高亮显示的端到端块？

如何解决《如何在SublimeText3中为ruby设置高亮显示的端到端块？》经验，为你挑选了1个好方法。 ... [详细]
程序员
PhoneGap中Android Marshmallow的应用权限

如何解决《PhoneGap中AndroidMarshmallow的应用权限》经验，为你挑选了1个好方法。 ... [详细]
程序员
如何在laravel 5.1迁移中使用外键

如何解决《如何在laravel5.1迁移中使用外键》经验，为你挑选了1个好方法。 ... [详细]
程序员
iOS蓝牙背景模式

如何解决《iOS蓝牙背景模式》经验，为你挑选了1个好方法。 ... [详细]
程序员
Javascript调整大小不同的图像,只有宽度很重要

如何解决《Javascript调整大小不同的图像,只有宽度很重要》经验，为你挑选了0个好方法。 ... [详细]
程序员
com.datastax.driver.core.exceptions.InvalidQueryException:unconfigured table schema_keyspaces

如何解决《com.datastax.driver.core.exceptions.InvalidQueryException:unconfiguredtableschema_keyspaces》经验，为你挑选了2个好方法。 ... [详细]
程序员
为什么我必须明确告诉Spark要缓存什么？

如何解决《为什么我必须明确告诉Spark要缓存什么？》经验，为你挑选了1个好方法。 ... [详细]
程序员
为什么(int i = 0 ;; i ++)被认为是无限循环？

如何解决《为什么(inti=0;;i++)被认为是无限循环？》经验，为你挑选了1个好方法。 ... [详细]
程序员
C＃和Unity 3D：当用户移动鼠标时，如何使相机在对象周围移动

如何解决《C＃和Unity3D：当用户移动鼠标时，如何使相机在对象周围移动》经验，为你挑选了1个好方法。 ... [详细]
程序员
在Kubernetes API中启用CORS

如何解决《在KubernetesAPI中启用CORS》经验，为你挑选了1个好方法。 ... [详细]
程序员
PHP7 + Symfony 2.8,无法写入会话数据

如何解决《PHP7+Symfony2.8,无法写入会话数据》经验，为你挑选了1个好方法。 ... [详细]

帆侮听我悄悄说星星

这个屌丝很懒，什么也没留下！

关注作者

Tags | 热门标签

RankList | 热门文章