13赞

Dataframes Pyspark中Timestamp列的分区

作者：我我檬檬我我186 | 2023-09-06 22:00

如何解决《DataframesPyspark中Timestamp列的分区》经验，为你挑选了1个好方法。

我DataFrame在PSspark中有以下格式

Date        Id  Name    Hours   Dno Dname
12/11/2013  1   sam     8       102 It
12/10/2013  2   Ram     7       102 It
11/10/2013  3   Jack    8       103 Accounts
12/11/2013  4   Jim     9       101 Marketing

我想做基于分区的分区,dno并使用Parquet格式保存为Hive中的表.

df.write.saveAsTable(
    'default.testing', mode='overwrite', partitionBy='Dno', format='parquet')



该查询工作正常,并在Hive中使用Parquet输入创建了表.

现在我想根据日期列的年份和月份进行分区.时间戳是Unix时间戳

我们怎样才能在PySpark中实现这一目标.我已经在蜂巢中完成了它但无法做到PySpark


1> user6910411..：
只需提取您要使用的字段,并提供列列表作为编写器的参数partitionBy.如果timestampUNIX时间戳以秒表示:

df = sc.parallelize([
    (1484810378, 1, "sam", 8, 102, "It"),
    (1484815300, 2, "ram", 7, 103, "Accounts")
]).toDF(["timestamp", "id", "name", "hours", "dno", "dname"])


添加列:

from pyspark.sql.functions import year, month, col

df_with_year_and_month = (df
    .withColumn("year", year(col("timestamp").cast("timestamp")))
    .withColumn("month", month(col("timestamp").cast("timestamp"))))


和写:

(df_with_year_and_month
    .write
    .partitionBy("year", "month")
    .mode("overwrite")
    .format("parquet")
    .saveAsTable("default.testing"))



    

    

    
        推荐阅读
        
            
                                
                    
                        程序员
                        如何在AuthorizedAttribute中设置viewbag？
                    

                    
                                                
                        如何解决《如何在AuthorizedAttribute中设置viewbag？》经验，为你挑选了1个好方法。 ...
                        [详细]
                    
                    

                


                                
                    
                        程序员
                        Android将String转换为JSONObject
                    

                    
                                                
                        如何解决《Android将String转换为JSONObject》经验，为你挑选了0个好方法。 ...
                        [详细]
                    
                    

                


                                
                    
                        程序员
                        是否可以使用Mockito验证测试的对象方法调用？
                    

                    
                                                
                        如何解决《是否可以使用Mockito验证测试的对象方法调用？》经验，为你挑选了1个好方法。 ...
                        [详细]
                    
                    

                


                                
                    
                        程序员
                        如何在Visual Studio Online上生成构建器还原所有NuGet包？
                    

                    
                                                
                        如何解决《如何在VisualStudioOnline上生成构建器还原所有NuGet包？》经验，为你挑选了1个好方法。 ...
                        [详细]
                    
                    

                


                                
                    
                        程序员
                        创建没有开发人员证书的ipa进行远程分发
                    

                    
                                                
                        如何解决《创建没有开发人员证书的ipa进行远程分发》经验，为你挑选了0个好方法。 ...
                        [详细]
                    
                    

                


                                
                    
                        程序员
                        为什么不创建jdbc连接池？
                    

                    
                                                
                        如何解决《为什么不创建jdbc连接池？》经验，为你挑选了0个好方法。 ...
                        [详细]
                    
                    

                


                                
                    
                        程序员
                        根据列值删除pandas数据帧中的行
                    

                    
                                                
                        如何解决《根据列值删除pandas数据帧中的行》经验，为你挑选了1个好方法。 ...
                        [详细]
                    
                    

                


                                
                    
                        程序员
                        为什么按钮没有对齐？
                    

                    
                                                
                            
                        
                                                
                        如何解决《为什么按钮没有对齐？》经验，为你挑选了1个好方法。 ...
                        [详细]
                    
                    

                


                                
                    
                        程序员
                        C++ #define在main中,如何获取其他.cpp文件才能看到它？
                    

                    
                                                
                        如何解决《C++#define在main中,如何获取其他.cpp文件才能看到它？》经验，为你挑选了1个好方法。 ...
                        [详细]
                    
                    

                


                                
                    
                        程序员
                        如何在android中的单元测试和仪器测试之间共享资源？
                    

                    
                                                
                        如何解决《如何在android中的单元测试和仪器测试之间共享资源？》经验，为你挑选了1个好方法。 ...
                        [详细]
                    
                    

                


                                
                    
                        程序员
                        $ routeChangeSuccess的奇怪行为:第一次加载时没有触发(但没有抛出任何错误)
                    

                    
                                                
                        如何解决《$routeChangeSuccess的奇怪行为:第一次加载时没有触发(但没有抛出任何错误)》经验，为你挑选了0个好方法。 ...
                        [详细]
                    
                    

                


                                
                    
                        程序员
                        在OSX上通过docker-py连接到Docker-Machine
                    

                    
                                                
                        如何解决《在OSX上通过docker-py连接到Docker-Machine》经验，为你挑选了1个好方法。 ...
                        [详细]
                    
                    

                


                                
                    
                        程序员
                        装配ADC(附带进位)
                    

                    
                                                
                        如何解决《装配ADC(附带进位)》经验，为你挑选了1个好方法。 ...
                        [详细]
                    
                    

                


                                
                    
                        程序员
                        IAM用户可以在我的AWS账户上支付服务费用吗？
                    

                    
                                                
                        如何解决《IAM用户可以在我的AWS账户上支付服务费用吗？》经验，为你挑选了1个好方法。 ...
                        [详细]
                    
                    

                


                                
                    
                        程序员
                        Swift相当于Python切片赋值
                    

                    
                                                
                        如何解决《Swift相当于Python切片赋值》经验，为你挑选了1个好方法。 ...
                        [详细]
                    
                    

                


                                
                    
                        程序员
                        WatchKit Extension看不到带有App Group的NSUserDefaults中保存的数据
                    

                    
                                                
                            
                        
                                                
                        如何解决《WatchKitExtension看不到带有AppGroup的NSUserDefaults中保存的数据》经验，为你挑选了1个好方法。 ...
                        [详细]
                    
                    

                


                                
                    
                        程序员
                        使用python在revit中创建和分配子类别
                    

                    
                                                
                        如何解决《使用python在revit中创建和分配子类别》经验，为你挑选了0个好方法。 ...
                        [详细]
                    
                    

                


                                
                    
                        程序员
                        方法调用后字节大小不正确
                    

                    
                                                
                        如何解决《方法调用后字节大小不正确》经验，为你挑选了1个好方法。 ...
                        [详细]
                    
                    

                


                                
                    
                        程序员
                        unique_constraint无法识别2个字段
                    

                    
                                                
                        如何解决《unique_constraint无法识别2个字段》经验，为你挑选了1个好方法。 ...
                        [详细]
                    
                    

                


                                
                    
                        程序员
                        使用参数初始化本地静态
                    

                    
                                                
                        如何解决《使用参数初始化本地静态》经验，为你挑选了1个好方法。 ...
                        [详细]
                    
                    

                


                

            
        
    

    
        吐了个 "CAO" !
        
            
                吐个槽吧,看都看了
            
            
                
                                        会员登录 | 用户注册
























    

    
        
            
            
                
                    
                
            

            
                我我檬檬我我186            

            
                这个屌丝很懒，什么也没留下！            
            
            

                                
                    
                    关注作者
                            

        
    


    
        Tags | 热门标签
        
            
                                
                    actionscrip
                
                                
                    bash
                
                                
                    c#
                
                                
                    c++
                
                                
                    c语言
                
                                
                    erlang
                
                                
                    flutter
                
                                
                    go
                
                                
                    golang
                
                                
                    java
                
                                
                    javascript
                
                                
                    lua
                
                                
                    node.js
                
                                
                    perl
                
                                
                    php
                
                                
                    python
                
                                
                    scala
                
                                
                    typescript
                
                                
            
        
    


    
        RankList | 热门文章
        
            
                                
                    1为什么我的模式("yyyyMM")无法使用DateTimeFormatter进行解析(java 8)
                
                                
                    2android工具栏popupTheme vs主题
                
                                
                    3为什么在OpenShift V3环境中使用pod而不是直接使用容器
                
                                
                    4名称冲突时局部变量和类属性之间的优先级
                
                                
                    5Scala案例类在receive方法中不匹配(在akka actor中)
                
                                
                    6代码混淆 - 为什么一个工作,而另一个工作？
                
                                
                    7是否可以在Swift中访问阴影顶级函数？
                
                                
                    8C#等待问题
                
                                
                    9CSS悬停样式在不相关的元素上？
                
                                
                    10事件处理程序S100的方法名称
                
                                
                    11如何分发asdf/quicklisp依赖项以及使用Embeddable Common Lisp编译的应用程序？
                
                                
                    12Excel VBA保存截图
                
                                
                    13如何显示文本框重复值的警报
                
                                
                    14我可以在LINQ to Entities查询中使用CAST吗？
                
                                
                    15何时将配置放在file.properties或Jndi中
                
                                
                    16TreeView  - 单击空白区域
                
                                
                    17由Python 3.5破坏的Jupyter笔记本
                
                                
                    18使用ScalatraSuite（FunSuiteLike）进行独立sbt项目的Scalatra测试失败
                
                                
                    19我可以在AWS Cloudformation json模板的"参数"中使用"Fn :: Join"吗？
                
                                
                    20包含列表太慢,如何改进？