首页技术笔记网址导航 Json在线解析二维码 Ip地址查询在线流程图

新用户注册 | 会员登录

19赞

339

当前位置: 开发笔记 > 数据库 > 正文

.Net和Hadoop - 知道/学习什么,有什么可用？

作者：雯颜哥_135 | 2023-06-17 12:08

如何解决《.Net和Hadoop-知道/学习什么,有什么可用？》经验，为你挑选了1个好方法。

这是一个模糊的问题,所以这里有一个模糊的答案:)

Hadoop本身就是一个在集群中运行map-reduce作业的工具,它针对性能进行了高度优化,并且通过以一种易于使用而不会产生I/O的方式分发数据来完成大量此类优化.处罚.

为此,您应该阅读有关HDFS和内部解释如何完成的内容,简而言之,输入数据在节点中聚集在一起以在本地运行进程并按顺序读取(这是HDFS的属性/限制) .

通过这种方式,您可以输入"BigData",并在集群内部以最有效的方式进行拆分和处理.

现在,除了Hadoop本身之外,还有一些工具可以在其上工作,允许您对数据执行高级抽象(map-reduce是最简单的过程之一).

那些包括:

Pig http://pig.apache.org/这是一种使用map-reduce流程并构建更复杂操作的语言

Hive http://hive.apache.org/类似于以前但更多面向SQL的

级联http://www.cascading.org/另一个,更关注数据流而不是查询

基于Cascading的Cascalog https://github.com/nathanmarz/cascalog,用Clojure编写

HBase http://hbase.apache.org/一种基于HDFS的NoSQL数据库

ElephantDB https://github.com/nathanmarz/elephantdb另一个用于Hadoop的NoSQL数据库

.Net的细节

对于Azure上的Hadoop(.Net),这里有msdn的介绍,这里有更多信息.与通过其平台构建Hadoop应用程序相关.它现在只是CTP,但当然这会改变.

下面是关于另一个很好的博客帖子的Hadoop和MapReduce与代码

此外,还有一家公司经常提供有关Hadoop的信息:Cloudera,您应该经常查看那里以获取更多信息.有关更多信息,请查看上面链接的cloudera页面,您可以查看有关Hadoop的所有概念(虽然它非常先进)

我很确定这不是你想要的,但我不知道你想要什么,所以至少我希望你能检查一些可能有用的新项目.

还检查Storm:https://github.com/nathanmarz/storm它与Hadoop无关,但适用于Hadoop不适合的实时场景.

1> Samus_..：

这是一个模糊的问题,所以这里有一个模糊的答案:)

Hadoop本身就是一个在集群中运行map-reduce作业的工具,它针对性能进行了高度优化,并且通过以一种易于使用而不会产生I/O的方式分发数据来完成大量此类优化.处罚.

为此,您应该阅读有关HDFS和内部解释如何完成的内容,简而言之,输入数据在节点中聚集在一起以在本地运行进程并按顺序读取(这是HDFS的属性/限制) .

通过这种方式,您可以输入"BigData",并在集群内部以最有效的方式进行拆分和处理.

现在,除了Hadoop本身之外,还有一些工具可以在其上工作,允许您对数据执行高级抽象(map-reduce是最简单的过程之一).

那些包括:

Pig http://pig.apache.org/这是一种使用map-reduce流程并构建更复杂操作的语言

Hive http://hive.apache.org/类似于以前但更多面向SQL的

级联http://www.cascading.org/另一个,更关注数据流而不是查询

基于Cascading的Cascalog https://github.com/nathanmarz/cascalog,用Clojure编写

HBase http://hbase.apache.org/一种基于HDFS的NoSQL数据库

ElephantDB https://github.com/nathanmarz/elephantdb另一个用于Hadoop的NoSQL数据库

.Net的细节

对于Azure上的Hadoop(.Net),这里有msdn的介绍,这里有更多信息.与通过其平台构建Hadoop应用程序相关.它现在只是CTP,但当然这会改变.

下面是关于另一个很好的博客帖子的Hadoop和MapReduce与代码

此外,还有一家公司经常提供有关Hadoop的信息:Cloudera,您应该经常查看那里以获取更多信息.有关更多信息,请查看上面链接的cloudera页面,您可以查看有关Hadoop的所有概念(虽然它非常先进)

我很确定这不是你想要的,但我不知道你想要什么,所以至少我希望你能检查一些可能有用的新项目.

还检查Storm:https://github.com/nathanmarz/storm它与Hadoop无关,但适用于Hadoop不适合的实时场景.

推荐阅读

程序员
MySQL - 查询平均行长度

如何解决《MySQL-查询平均行长度》经验，为你挑选了1个好方法。 ... [详细]
程序员
Swagger Editor集成到Git或GitHub

如何解决《SwaggerEditor集成到Git或GitHub》经验，为你挑选了0个好方法。 ... [详细]
程序员
使用java测量网页的总加载时间

如何解决《使用java测量网页的总加载时间》经验，为你挑选了1个好方法。 ... [详细]
程序员
graphql可以返回聚合计数吗？

如何解决《graphql可以返回聚合计数吗？》经验，为你挑选了4个好方法。 ... [详细]
程序员
将两个unordered_maps与重叠键合并

如何解决《将两个unordered_maps与重叠键合并》经验，为你挑选了1个好方法。 ... [详细]
程序员
使用OpenWeatherMap API密钥

如何解决《使用OpenWeatherMapAPI密钥》经验，为你挑选了1个好方法。 ... [详细]
程序员
获取具有特定值的数组元素的索引

如何解决《获取具有特定值的数组元素的索引》经验，为你挑选了1个好方法。 ... [详细]
程序员
Elasticsearch按内部命中排序父级doc count

如何解决《Elasticsearch按内部命中排序父级doccount》经验，为你挑选了1个好方法。 ... [详细]
程序员
Oracle(+)外连接和常量值

如何解决《Oracle(+)外连接和常量值》经验，为你挑选了1个好方法。 ... [详细]
程序员
有关加载Google地图的问题 - SensorNotRequired

如何解决《有关加载Google地图的问题-SensorNotRequired》经验，为你挑选了1个好方法。 ... [详细]
程序员
Linq Select许多包括父项

如何解决《LinqSelect许多包括父项》经验，为你挑选了0个好方法。 ... [详细]
程序员
使用自定义日期检索最近3年的数据

如何解决《使用自定义日期检索最近3年的数据》经验，为你挑选了1个好方法。 ... [详细]
程序员
Python - 正在更改参数

如何解决《Python-正在更改参数》经验，为你挑选了1个好方法。 ... [详细]
程序员
在sqlalchemy字段中强制值为大写的最佳方法

如何解决《在sqlalchemy字段中强制值为大写的最佳方法》经验，为你挑选了1个好方法。 ... [详细]
程序员
如何在Python中在后台运行长时间运行的作业

如何解决《如何在Python中在后台运行长时间运行的作业》经验，为你挑选了3个好方法。 ... [详细]
程序员
scala数据帧到RDD [array [String]]

如何解决《scala数据帧到RDD[array[String]]》经验，为你挑选了1个好方法。 ... [详细]
程序员
Nginx-rtmp模块和mpeg-dash(Dash行业dash.js)

如何解决《Nginx-rtmp模块和mpeg-dash(Dash行业dash.js)》经验，为你挑选了1个好方法。 ... [详细]
程序员
在Python3中将图像复制到剪贴板

如何解决《在Python3中将图像复制到剪贴板》经验，为你挑选了1个好方法。 ... [详细]
程序员
如何将Android Spinner下拉箭头移近它的发射文本

如何解决《如何将AndroidSpinner下拉箭头移近它的发射文本》经验，为你挑选了1个好方法。 ... [详细]
程序员
在Django中实现python类的位置？

如何解决《在Django中实现python类的位置？》经验，为你挑选了0个好方法。 ... [详细]

雯颜哥_135

这个屌丝很懒，什么也没留下！

关注作者

Tags | 热门标签

RankList | 热门文章

DevBox开发工具箱 | 专业的在线开发工具网站

京公网安备 11010802040832号 | 京ICP备19059560号-6
Copyright © 1998 - 2020 DevBox.CN. All Rights Reserved devBox.cn 开发工具箱版权所有