为什么像Vertica/InfoBright/GreenPlum这样的面向列的数据库会对Hadoop大做文章？

作者：LEEstarmmmmm | 2023-06-17 10:48

如何解决《为什么像Vertica/InfoBright/GreenPlum这样的面向列的数据库会对Hadoop大做文章？》经验，为你挑选了1个好方法。

为Hadoop集群提供数据并使用该集群将数据输入Vertica/InfoBright数据仓库有什么意义？

所有这些供应商都在说"我们可以与Hadoop联系",但我不明白这是什么意思.在Hadoop中存储并转移到InfoBright有什么兴趣？为什么不将应用程序直接存储在Infobright/Vertica DW中？

谢谢 !

1> 小智..：

为何结合解决方案？Hadoop有一些很棒的功能(见下面的URL).这些功能虽然不包括允许业务用户运行快速分析.使用Infobright,在10秒内交付Hadoop需要30分钟到几小时的查询.

顺便说一句,你最初的问题并没有以MPP架构为前提,这是有充分理由的.Infobright的客户Liverail,AdSafe Media和InMobi等公司将IEE与Hadoop结合使用.

如果您注册了行业白皮书http://support.infobright.com/Support/Resource-Library/Whitepapers/,您将看到当前市场的视图,其中列出了四个建议的Hadoop用例.它由TechTarget的业务应用和架构组研究总监Wayne Eckerson于2011年9月撰写.

1)创建在线存档.
使用Hadoop,组织不必删除或将数据发送到离线存储; 他们可以通过添加商品服务器来无限期地保持在线,以满足存储和处理要求.Hadoop成为满足在线存档要求的低成本替代方案.

2)提供数据仓库.
组织还可以使用Hadoop来解析,集成和聚合大量Web或其他类型的数据,然后将其发送到数据仓库,临时和高级用户都可以使用熟悉的BI工具查询和分析数据.在这里,Hadoop成为一个ETL工具,用于在大量Web数据进入企业数据仓库之前处理它们.

3)支持分析.
大数据人群(即互联网开发人员)主要将Hadoop视为用于运行针对大量数据的分析计算的分析引擎.为了查询Hadoop,分析师目前需要用Java或其他语言编写程序,并了解MapReduce,这是一个用于编写分布式(或并行)应用程序的框架.这里的优点是分析人员在制定查询时不受SQL的限制.SQL不支持多种类型的分析,尤其是那些涉及行间计算的分析,这在Web流量分析中很常见.缺点是Hadoop是面向批处理的,不利于迭代查询.

4)运行报告.
但是,Hadoop的批量定位使其适合于执行定期报告.组织现在可以针对原始数据运行报告,而不是针对摘要数据运行报告,从而保证最准确的结果.

推荐阅读

程序员
Schedulers.io()没有返回主线程

如何解决《Schedulers.io()没有返回主线程》经验，为你挑选了2个好方法。 ... [详细]
程序员
PHP相对路径:我可以配置吗？

如何解决《PHP相对路径:我可以配置吗？》经验，为你挑选了1个好方法。 ... [详细]
程序员
具有相等参数类型的可变参数模板函数

如何解决《具有相等参数类型的可变参数模板函数》经验，为你挑选了0个好方法。 ... [详细]
程序员
无法从Google官方网页获取Google Analytics配置文件

如何解决《无法从Google官方网页获取GoogleAnalytics配置文件》经验，为你挑选了1个好方法。 ... [详细]
程序员
只有CSS发生变化时,Gulp livereload会重新加载整个页面

如何解决《只有CSS发生变化时,Gulplivereload会重新加载整个页面》经验，为你挑选了1个好方法。 ... [详细]
程序员
基于UIlabel行计数扩展tableviewcell

如何解决《基于UIlabel行计数扩展tableviewcell》经验，为你挑选了1个好方法。 ... [详细]
程序员
使用Eclipse时,Maven编译失败并显示"找不到符号",它编译

如何解决《使用Eclipse时,Maven编译失败并显示"找不到符号",它编译》经验，为你挑选了0个好方法。 ... [详细]
程序员
数组初始化需要括号括起的初始化列表lambda

如何解决《数组初始化需要括号括起的初始化列表lambda》经验，为你挑选了1个好方法。 ... [详细]
程序员
Firefox:"此页面的某些部分不安全,例如图片." 什么算不安全？

如何解决《Firefox:"此页面的某些部分不安全,例如图片."什么算不安全？》经验，为你挑选了2个好方法。 ... [详细]
程序员
使用Chart.js设计条形图和线条

如何解决《使用Chart.js设计条形图和线条》经验，为你挑选了2个好方法。 ... [详细]
程序员
ASP.NET成员资格HashAlgorithmType默认为HMACSHA256,密码哈希键是否也是如此？

如何解决《ASP.NET成员资格HashAlgorithmType默认为HMACSHA256,密码哈希键是否也是如此？》经验，为你挑选了1个好方法。 ... [详细]
程序员
TSQL中的日期比较

如何解决《TSQL中的日期比较》经验，为你挑选了1个好方法。 ... [详细]
程序员
Android RecyclerView StaggeredGrid项在滚动顶部时更改位置

如何解决《AndroidRecyclerViewStaggeredGrid项在滚动顶部时更改位置》经验，为你挑选了1个好方法。 ... [详细]
程序员
使用python/django进行日期时间本地化

如何解决《使用python/django进行日期时间本地化》经验，为你挑选了0个好方法。 ... [详细]
程序员
newScheduledThreadPool（）方法的参数“ corePoolSize”是什么意思？

如何解决《newScheduledThreadPool（）方法的参数“corePoolSize”是什么意思？》经验，为你挑选了1个好方法。 ... [详细]
程序员
在PHP 7中键入提示 - 对象数组

如何解决《在PHP7中键入提示-对象数组》经验，为你挑选了3个好方法。 ... [详细]
程序员
为什么此导航栏上方有空格

如何解决《为什么此导航栏上方有空格》经验，为你挑选了2个好方法。 ... [详细]
程序员
是否可能在一个反应组件中有两个状态

如何解决《是否可能在一个反应组件中有两个状态》经验，为你挑选了0个好方法。 ... [详细]
程序员
如何在R包传单中添加比例尺？

如何解决《如何在R包传单中添加比例尺？》经验，为你挑选了1个好方法。 ... [详细]
程序员
Plivo红宝石宝石类冲突

如何解决《Plivo红宝石宝石类冲突》经验，为你挑选了1个好方法。 ... [详细]

LEEstarmmmmm

这个屌丝很懒，什么也没留下！

关注作者

Tags | 热门标签

RankList | 热门文章