尝试从apache的sharedRDD中检索数据点燃上下文

作者：linjiabin43 | 2023-09-09 21:31

如何解决《尝试从apache的sharedRDD中检索数据点燃上下文》经验，为你挑选了1个好方法。

我正在尝试将apache点燃与火花融合,而且我是apache点燃的新手.我想将数据保存在分布式缓存中并检索它.

我通过在spark中加载文件并尝试使用Apache Ignite的sharedRDD.savePairs(key,value)保存在缓存中来创建数据框.键的类型为string,value的类型为spark dataframe.现在我想检索存储的数据并打印出来.我甚至不确定它是否实际上与类型数据帧一起保存.

1> dmagda..：

要从RDD检索数据,您可以使用以下方法中的至少一种:

1)sharedRDD.filter(...).collect()方法.作为示例,下面的代码从名为"testCache"的缓存中获取包含单词"river"的所有值

val cache = igniteContext.fromCache("testCache")
val result = cache.filter(_._2.contains("river")).collect()

使用'filter'方法读取值

2)sharedRDD.sql(...)方法.

val cacheRdd = igniteContext.fromCache("personsCache")
val result = cacheRdd.sql(
  "select name from Person where id > ? and id < ?", 10, 100)

使用SQL获取值

@Srini可以在缓存中安全地使用DataFrame,但我认为没有任何意义.IgniteRDD是一个共享的**键值**RDD,它在一个集群中统一存储键值元组.当DataFrame作为值存储时,它将被放置到单个节点的单个分区,就像任何其他值(int,String等)一样.因此,如果您希望从中受益,如果IgniteRDD应该存储实际值而不是数据帧.如果您仍想使用IgniteRDD存储DataFrame,则可以使用Spark的rdd.collect()方法将其恢复.

推荐阅读

程序员
尝试确定在干净安装的Windows 10 + vs2015上托管应用程序的DNX进程的进程ID时发生错误

如何解决《尝试确定在干净安装的Windows10+vs2015上托管应用程序的DNX进程的进程ID时发生错误》经验，为你挑选了1个好方法。 ... [详细]
程序员
为什么具有相同哈希码的对象不相等

如何解决《为什么具有相同哈希码的对象不相等》经验，为你挑选了3个好方法。 ... [详细]
程序员
Slack Bitbucket集成

如何解决《SlackBitbucket集成》经验，为你挑选了1个好方法。 ... [详细]
程序员
Sql查询 - 搜索包含通配符的varchar

如何解决《Sql查询-搜索包含通配符的varchar》经验，为你挑选了1个好方法。 ... [详细]
程序员
ImportError:没有名为cycler的模块

如何解决《ImportError:没有名为cycler的模块》经验，为你挑选了2个好方法。 ... [详细]
程序员
键盘覆盖屏幕而不是推高布局？

如何解决《键盘覆盖屏幕而不是推高布局？》经验，为你挑选了0个好方法。 ... [详细]
程序员
contentful api markdown转换为HTML

如何解决《contentfulapimarkdown转换为HTML》经验，为你挑选了1个好方法。 ... [详细]
程序员
Javascript在Python中给出了相同算法的不同答案

如何解决《Javascript在Python中给出了相同算法的不同答案》经验，为你挑选了2个好方法。 ... [详细]
程序员
如何用"yyyyMMdd Hmm"格式将字符串解析为DateTime？

如何解决《如何用"yyyyMMddHmm"格式将字符串解析为DateTime？》经验，为你挑选了1个好方法。 ... [详细]
程序员
詹金斯（Jenkins）存档失败说：“您必须提供营销或技术版本的价值。两者都找不到。”

如何解决《詹金斯（Jenkins）存档失败说：“您必须提供营销或技术版本的价值。两者都找不到。”》经验，为你挑选了0个好方法。 ... [详细]
程序员
适用于Android 4.0.3(API 15)及以下版本的TextView.getMaxLines()的替代方法

如何解决《适用于Android4.0.3(API15)及以下版本的TextView.getMaxLines()的替代方法》经验，为你挑选了1个好方法。 ... [详细]
程序员
在copytree()完成之前,print()不会打印

如何解决《在copytree()完成之前,print()不会打印》经验，为你挑选了1个好方法。 ... [详细]
程序员
pandas.DataFrame可以有列表类型列吗？

如何解决《pandas.DataFrame可以有列表类型列吗？》经验，为你挑选了1个好方法。 ... [详细]
程序员
如何使用Spark Java返回静态html页面？

如何解决《如何使用SparkJava返回静态html页面？》经验，为你挑选了2个好方法。 ... [详细]
程序员
在Java的流中,Haskell的scanl相当于什么？

如何解决《在Java的流中,Haskell的scanl相当于什么？》经验，为你挑选了1个好方法。 ... [详细]
程序员
使用静态或非静态类

如何解决《使用静态或非静态类》经验，为你挑选了1个好方法。 ... [详细]
程序员
NET :: ERR_CERT_AUTHORITY_INVALID https为红色

如何解决《NET::ERR_CERT_AUTHORITY_INVALIDhttps为红色》经验，为你挑选了1个好方法。 ... [详细]
程序员
使用公共属性创建动态对象

如何解决《使用公共属性创建动态对象》经验，为你挑选了1个好方法。 ... [详细]
程序员
不使用https的chrome 47中的getUserMedia()

如何解决《不使用https的chrome47中的getUserMedia()》经验，为你挑选了1个好方法。 ... [详细]
程序员
Symfony 3.0嵌套实体不保存

如何解决《Symfony3.0嵌套实体不保存》经验，为你挑选了1个好方法。 ... [详细]

linjiabin43

这个屌丝很懒，什么也没留下！

关注作者

Tags | 热门标签

RankList | 热门文章