HBase条件查询（多条件查询）

作者：kikokikolove | 2021-09-11 01:31

文中可能涉及到的API：HadoopHDFS:hadoop.apache.orgcommondocscurrentapiHBase:hbase.apache.orgapido

文中可能涉及到的API： Hadoop/HDFS:http://hadoop.apache.org/common/docs/current/api/ HBase: http://hbase.apache.org/apido

文中可能涉及到的API：

Hadoop/HDFS:

HBase: ?overview-summary.html

Begin！

HBase的查询实现只提供两种方式：

1、按指定RowKey获取唯一一条记录，get方法（org.apache.hadoop.hbase.client.Get）

2、按指定的条件获取一批记录，scan方法（org.apache.hadoop.hbase.client.Scan）

实现条件查询功能使用的就是scan方式，scan在使用时有以下几点值得注意：

1、scan可以通过setCaching与setBatch方法提高速度（以空间换时间）；

2、scan可以通过setStartRow与setEndRow来限定范围。范围越小，性能越高。

通过巧妙的RowKey设计使我们批量获取记录集合中的元素挨在一起（应该在同一个Region下），可以在遍历结果时获得很好的性能。

3、scan可以通过setFilter方法添加过滤器，这也是分页、多条件查询的基础。

下面举个形象的例子：

我们在表中存储的是文件信息，每个文件有5个属性：文件id（long，全局唯一）、创建时间（long）、文件名（String）、分类名（String）、所有者（User）。

我们可以输入的查询条件：文件创建时间区间（比如从20120901到20120914期间创建的文件），，文件名（“中国好声音”），分类（“综艺”），所有者（“浙江卫视”）。

假设当前我们一共有如下文件：

内容列表

IDCreateTimeNameCategoryUserID

1 20120902 中国好声音第1期综艺 1

2 20120904 中国好声音第2期综艺 1

3 20120906 中国好声音外卡赛综艺 1

4 20120908 中国好声音第3期综艺 1

5 20120910 中国好声音第4期综艺 1

6 20120912 中国好声音选手采访综艺花絮 2

7 20120914 中国好声音第5期综艺 1

8 20120916 中国好声音录制花絮综艺花絮 2

9 20120918 张玮独家专访花絮 3

10 20120920 加多宝凉茶广告综艺广告 4

这里UserID应该对应另一张User表，暂不列出。我们只需知道UserID的含义：

1代表浙江卫视； 2代表好声音剧组； 3代表 XX微博； 4代表赞助商。
调用查询接口的时候将上述5个条件同时输入find(20120901,20121001,"中国好声音","综艺","浙江卫视")。

此时我们应该得到记录应该有第1、2、3、4、5、7条。第6条由于不属于“浙江卫视”应该不被选中。

我们在设计RowKey时可以这样做：采用UserID + CreateTime + FileID组成rowKey，这样既能满足多条件查询，又能有很快的查询速度。

推荐阅读

程序员
如何在ViewController中为UIButton创建事件？

如何解决《如何在ViewController中为UIButton创建事件？》经验，为你挑选了1个好方法。 ... [详细]
程序员
webpack umd lib和外部文件

如何解决《webpackumdlib和外部文件》经验，为你挑选了1个好方法。 ... [详细]
程序员
PHP:重新加载时重置会话生存期

如何解决《PHP:重新加载时重置会话生存期》经验，为你挑选了1个好方法。 ... [详细]
程序员
是否有可能在另一个请求中有一个Angular js $ http请求？

如何解决《是否有可能在另一个请求中有一个Angularjs$http请求？》经验，为你挑选了1个好方法。 ... [详细]
程序员
C#任务未完成(命令提示符中没有结果)

如何解决《C#任务未完成(命令提示符中没有结果)》经验，为你挑选了1个好方法。 ... [详细]
程序员
Android数据绑定后备/默认值

如何解决《Android数据绑定后备/默认值》经验，为你挑选了2个好方法。 ... [详细]
程序员
Visual Studio 2015挂起然后:'XamarinIOSPackage'包未正确加载

如何解决《VisualStudio2015挂起然后:'XamarinIOSPackage'包未正确加载》经验，为你挑选了1个好方法。 ... [详细]
程序员
位置固定100父母

如何解决《位置固定100父母》经验，为你挑选了2个好方法。 ... [详细]
程序员
新ASP.NET MVC 6标识中AspNetUsers表中ConcurrencyStamp列的用途是什么？

如何解决《新ASP.NETMVC6标识中AspNetUsers表中ConcurrencyStamp列的用途是什么？》经验，为你挑选了3个好方法。 ... [详细]
程序员
Array.create和锯齿状数组

如何解决《Array.create和锯齿状数组》经验，为你挑选了1个好方法。 ... [详细]
程序员
多态，参数多态，临时多态

如何解决《多态，参数多态，临时多态》经验，为你挑选了1个好方法。 ... [详细]
程序员
不能使用Asp MVC 6 Web Api的HttpClient

如何解决《不能使用AspMVC6WebApi的HttpClient》经验，为你挑选了1个好方法。 ... [详细]
程序员
Handlebarsjs检查字符串是否等于值

如何解决《Handlebarsjs检查字符串是否等于值》经验，为你挑选了2个好方法。 ... [详细]
程序员
ES2015在相同范围内两次构造对象

如何解决《ES2015在相同范围内两次构造对象》经验，为你挑选了1个好方法。 ... [详细]
程序员
在多个uWSGI进程中使用Flask-SQLAlchemy

如何解决《在多个uWSGI进程中使用Flask-SQLAlchemy》经验，为你挑选了1个好方法。 ... [详细]
程序员
来自RStudio的编织PDf文件

如何解决《来自RStudio的编织PDf文件》经验，为你挑选了2个好方法。 ... [详细]
程序员
使用javapackager将图标添加到包中

如何解决《使用javapackager将图标添加到包中》经验，为你挑选了1个好方法。 ... [详细]
程序员
是否可以在Cloud9 IDE上显示选项卡和空格？

如何解决《是否可以在Cloud9IDE上显示选项卡和空格？》经验，为你挑选了1个好方法。 ... [详细]
程序员
通过Angularjs更新textarea行

如何解决《通过Angularjs更新textarea行》经验，为你挑选了1个好方法。 ... [详细]
程序员
在React Native中循环Json和显示

如何解决《在ReactNative中循环Json和显示》经验，为你挑选了1个好方法。 ... [详细]

kikokikolove

这个屌丝很懒，什么也没留下！

关注作者

Tags | 热门标签

RankList | 热门文章