当前位置:  开发笔记 > 编程语言 > 正文

Spark Dataframe更改列值

如何解决《SparkDataframe更改列值》经验,为你挑选了1个好方法。

我得到了一些170列的数据帧.在一列中,我有一个"名称"字符串,当我将它们写入Postgres时,这个字符串有时会有一些特殊符号,如"'",这些符号是不合适的.我可以做那样的事情:

Df[$'name']=Df[$'name'].map(x => x.replaceAll("'","")) ?

我不想解析完整的DataFrame,因为它非常庞大.请帮助我



1> Tzach Zohar..:

您不能改变DataFrame,只能将它们转换为具有更新值的新DataFrame.在这种情况下 - 您可以使用该regex_replace函数在name列上执行映射:

import org.apache.spark.sql.functions._
val updatedDf = Df.withColumn("name", regexp_replace(col("name"), ",", ""))

推荐阅读
可爱的天使keven_464
这个屌丝很懒,什么也没留下!
DevBox开发工具箱 | 专业的在线开发工具网站    京公网安备 11010802040832号  |  京ICP备19059560号-6
Copyright © 1998 - 2020 DevBox.CN. All Rights Reserved devBox.cn 开发工具箱 版权所有