8赞

处理Spark Scala中的微秒

作者：帆侮听我悄悄说星星 | 2023-09-06 13:26

如何解决《处理SparkScala中的微秒》经验，为你挑选了1个好方法。

我使用Scala将PostgreSQL表导入spark作为数据帧.数据框看起来像

user_id | log_dt  
--------| -------    
96      | 2004-10-19 10:23:54.0    
1020    | 2017-01-12 12:12:14.931652

我正在转换此数据帧以使log_dt的数据格式为yyyy-MM-dd hh:mm:ss.SSSSSS.为了实现这一点,我使用以下代码使用unix_timestamp函数将log_dt转换为时间戳格式.

  val tablereader1=tablereader1Df.withColumn("log_dt",unix_timestamp(tablereader1Df("log_dt"),"yyyy-MM-dd hh:mm:ss.SSSSSS").cast("timestamp"))

当我打印使用命令打印tablereader1数据帧时,tablereader1.show()我得到以下结果

user_id | log_dt  
--------| -------
96      | 2004-10-19 10:23:54.0
1020    | 2017-01-12 12:12:14.0

如何将微秒保留为时间戳的一部分？任何建议表示赞赏.

1> mrsrinivas..：

千禧年 `date_format()`

您可以使用date_format()接受Java SimpleDateFormat模式的Spark SQL .SimpleDateFormat只能使用模式"S"解析直到milleseconds .

import org.apache.spark.sql.functions._
import spark.implicits._ //to use $-notation on columns

val df = tablereader1Df.withColumn("log_dt", date_format($"log_dt", "S"))

更新:使用Java 8的LocalDateTime的微秒

//Imports
import java.time.LocalDateTime;
import java.time.format.DateTimeFormatter;
import java.time.temporal.ChronoField;

/* //Commented as per comment about IntelliJ
spark.udf.register("date_microsec", (dt: String) => 
   val dtFormatter = DateTimeFormatter.ofPattern("yyyy-MM-dd HH:mm:ss.n")
   LocalDateTime.parse(dt, dtFormatter).getLong(ChronoField.MICRO_OF_SECOND)
)
*/

import org.apache.spark.sql.functions.udf

val date_microsec = udf((dt: String) => {
    val dtFormatter = DateTimeFormatter.ofPattern("yyyy-MM-dd HH:mm:ss.n")
    LocalDateTime.parse(dt, dtFormatter).getLong(ChronoField.MICRO_OF_SECOND)
})

检查:帮助构建DateTimeFormatter模式

使用ChronoField.NANO_OF_SECOND而不是ChronoField.MICRO_OF_SECOND在UDF中获取纳秒.

val df = tablereader1Df.withColumn("log_date_microsec", date_microsec($"log_dt"))

推荐阅读

程序员
如何从npm运行的bash脚本中打印$ 2 BEFORE？

如何解决《如何从npm运行的bash脚本中打印$2BEFORE？》经验，为你挑选了1个好方法。 ... [详细]
程序员
Kubernetes kubelet原木在哪里？

如何解决《Kuberneteskubelet原木在哪里？》经验，为你挑选了2个好方法。 ... [详细]
程序员
AngularJS的$ routeProvider templateUrl总是使用Express返回404

如何解决《AngularJS的$routeProvidertemplateUrl总是使用Express返回404》经验，为你挑选了0个好方法。 ... [详细]
程序员
如何使用Elixir语言将模块加载到另一个模块中？

如何解决《如何使用Elixir语言将模块加载到另一个模块中？》经验，为你挑选了0个好方法。 ... [详细]
程序员
如何在CSS中设置超薄"font-weight"(小于100)？

如何解决《如何在CSS中设置超薄"font-weight"(小于100)？》经验，为你挑选了1个好方法。 ... [详细]
程序员
如何将梯形转向对面？

如何解决《如何将梯形转向对面？》经验，为你挑选了0个好方法。 ... [详细]
程序员
Kubernetes NFS卷安装失败,退出状态为32

如何解决《KubernetesNFS卷安装失败,退出状态为32》经验，为你挑选了1个好方法。 ... [详细]
程序员
如何在Node.JS中向自定义函数添加响应对象

如何解决《如何在Node.JS中向自定义函数添加响应对象》经验，为你挑选了1个好方法。 ... [详细]
程序员
为什么Python在尝试计算非常大的数字时会"先发制人"地挂起？

如何解决《为什么Python在尝试计算非常大的数字时会"先发制人"地挂起？》经验，为你挑选了2个好方法。 ... [详细]
程序员
如何在Android Studio中为Kotlin设置自动导入？

如何解决《如何在AndroidStudio中为Kotlin设置自动导入？》经验，为你挑选了0个好方法。 ... [详细]
程序员
使用Swift将精灵旋转到精灵位置不精确的SpriteKit中

如何解决《使用Swift将精灵旋转到精灵位置不精确的SpriteKit中》经验，为你挑选了0个好方法。 ... [详细]
程序员
Web API和取消令牌

如何解决《WebAPI和取消令牌》经验，为你挑选了0个好方法。 ... [详细]
程序员
在Centos 7中,mysqld.service的作业失败了

如何解决《在Centos7中,mysqld.service的作业失败了》经验，为你挑选了1个好方法。 ... [详细]
程序员
Slimframwork中的singleton和set之间有什么不同？

如何解决《Slimframwork中的singleton和set之间有什么不同？》经验，为你挑选了1个好方法。 ... [详细]
程序员
HttpContext.Current.Session - NullReferenceException

如何解决《HttpContext.Current.Session-NullReferenceException》经验，为你挑选了1个好方法。 ... [详细]
程序员
Angular 2的Http服务不暴露map()和其他RxJS函数

如何解决《Angular2的Http服务不暴露map()和其他RxJS函数》经验，为你挑选了3个好方法。 ... [详细]
程序员
AngularJS:代码属于哪里,在解析承诺后更新表单字段？

如何解决《AngularJS:代码属于哪里,在解析承诺后更新表单字段？》经验，为你挑选了1个好方法。 ... [详细]
程序员
需要更快地制作PowerShell脚本

如何解决《需要更快地制作PowerShell脚本》经验，为你挑选了1个好方法。 ... [详细]
程序员
连接和中继如何在MCSession中工作？

如何解决《连接和中继如何在MCSession中工作？》经验，为你挑选了0个好方法。 ... [详细]
程序员
PHP LDAPS提供的参数不是有效的ldap链接资源

如何解决《PHPLDAPS提供的参数不是有效的ldap链接资源》经验，为你挑选了1个好方法。 ... [详细]

帆侮听我悄悄说星星

这个屌丝很懒，什么也没留下！

关注作者

Tags | 热门标签

RankList | 热门文章

处理Spark Scala中的微秒

千禧年 date_format()

千禧年 `date_format()`