5赞

如何从单个RDD添加2个RDD列,然后根据PySpark中的日期数据进行行聚合

作者：贾志军 | 2023-09-10 19:32

如何解决《如何从单个RDD添加2个RDD列,然后根据PySpark中的日期数据进行行聚合》经验，为你挑选了0个好方法。

我RDDs在PySpark中有两个:

RDD1集:

[(u'2013-01-31 00:00:00', u'a', u'Pab', u'abc', u'd'),(u'2013-01-31 00:00:00', u'a', u'ab', u'abc', u'g'),.....]

RDD2:

[(u'41',u'42.0'),(u'24',u'98.0'),....]

两者RDDs都有相同的数字或行.现在我想做的是把所有的列从RDD1集的每一行(从转换中unicode正常string),并从RDD2每一行(从转换的第2列unicode string到float),并形成新的RDD这一点.所以新的RDD将如下所示:

RDD3:

[('2013-01-31 00:00:00', 'a', 'Pab', 'abc', 'd',42.0),('2013-01-31 00:00:00', 'a', 'ab', u'abc', 'g',98.0),.....]

完成后,我想通过第1列中的值在aggregation此新行中的每一行(浮点值)中执行最后一个值.那芒在所有行的,他们最后的数值应予以补充.RDD3datedate2013-01-31 00:00:00

我怎么能在PySpark中做到这一点？

推荐阅读

程序员
使用nodejs aws sdk将生成的pdf上传到AWS S3

如何解决《使用nodejsawssdk将生成的pdf上传到AWSS3》经验，为你挑选了1个好方法。 ... [详细]
程序员
我们如何确定IP地址的类别？

如何解决《我们如何确定IP地址的类别？》经验，为你挑选了1个好方法。 ... [详细]
程序员
Phalcon Micro应用程序无法使用查询字符串正确路由

如何解决《PhalconMicro应用程序无法使用查询字符串正确路由》经验，为你挑选了1个好方法。 ... [详细]
程序员
找一个GameObjects Vector3

如何解决《找一个GameObjectsVector3》经验，为你挑选了1个好方法。 ... [详细]
程序员
打印预格式化的数组,不带<pre>标签

如何解决《打印预格式化的数组,不带<pre>标签》经验，为你挑选了1个好方法。 ... [详细]
程序员
除以0后,在numpy数组中将NaN替换为0

如何解决《除以0后,在numpy数组中将NaN替换为0》经验，为你挑选了2个好方法。 ... [详细]
程序员
这与ObjectWrap :: Unwrap的持有人

如何解决《这与ObjectWrap::Unwrap的持有人》经验，为你挑选了0个好方法。 ... [详细]
程序员
如何通过字符串键获取嵌套JavaScript对象属性的值

如何解决《如何通过字符串键获取嵌套JavaScript对象属性的值》经验，为你挑选了1个好方法。 ... [详细]
程序员
是否可以(或有效)使用AWS Lambda运行完整的后端(比如说,Elastic Beanstalk)

如何解决《是否可以(或有效)使用AWSLambda运行完整的后端(比如说,ElasticBeanstalk)》经验，为你挑选了3个好方法。 ... [详细]
程序员
Apache NIFi MergeContent处理器 - 将分界符设置为新行

如何解决《ApacheNIFiMergeContent处理器-将分界符设置为新行》经验，为你挑选了1个好方法。 ... [详细]
程序员
如何使用python win32gui启用制表符和箭头键

如何解决《如何使用pythonwin32gui启用制表符和箭头键》经验，为你挑选了0个好方法。 ... [详细]
程序员
在Spring中区分未经身份验证的用户

如何解决《在Spring中区分未经身份验证的用户》经验，为你挑选了1个好方法。 ... [详细]
程序员
为什么我的RxJava Observable不会发出或完成,除非它被阻止？

如何解决《为什么我的RxJavaObservable不会发出或完成,除非它被阻止？》经验，为你挑选了0个好方法。 ... [详细]
程序员
OCaml地图上的元组

如何解决《OCaml地图上的元组》经验，为你挑选了2个好方法。 ... [详细]
程序员
有没有办法在React中访问父组件实例？

如何解决《有没有办法在React中访问父组件实例？》经验，为你挑选了2个好方法。 ... [详细]
程序员
为什么在MVC中单独使用模型和控制器？

如何解决《为什么在MVC中单独使用模型和控制器？》经验，为你挑选了1个好方法。 ... [详细]
程序员
将两个向量<bool>与SSE进行比较

如何解决《将两个向量<bool>与SSE进行比较》经验，为你挑选了0个好方法。 ... [详细]
程序员
Angular UI-Router - 在状态更改时刷新延迟加载的嵌套ui-view

如何解决《AngularUI-Router-在状态更改时刷新延迟加载的嵌套ui-view》经验，为你挑选了0个好方法。 ... [详细]
程序员
Laravel使用新值复制记录和复制

如何解决《Laravel使用新值复制记录和复制》经验，为你挑选了3个好方法。 ... [详细]
程序员
<audio>元素上的onclick事件

如何解决《<audio>元素上的onclick事件》经验，为你挑选了1个好方法。 ... [详细]

贾志军

这个屌丝很懒，什么也没留下！

关注作者

Tags | 热门标签

RankList | 热门文章