13赞

Flink流媒体事件时间窗口排序

作者：ifx0448363 | 2023-09-10 18:26

如何解决《Flink流媒体事件时间窗口排序》经验，为你挑选了1个好方法。

我遇到了一些麻烦,理解事件时间窗口周围的语义.以下程序生成一些带有时间戳的元组,这些时间戳用作事件时间并执行简单的窗口聚合.我希望输出与输入的顺序相同,但输出的排序方式不同.为什么输出与事件时间无关？

import java.util.concurrent.TimeUnit
import org.apache.flink.streaming.api.TimeCharacteristic
import org.apache.flink.streaming.api.windowing.time.Time
import org.apache.flink.streaming.api.scala._

object WindowExample extends App {
    val env = StreamExecutionEnvironment.getExecutionEnvironment
    env.setStreamTimeCharacteristic(TimeCharacteristic.EventTime)
    env.getConfig.enableTimestamps()
    env.setParallelism(1)

    val start = 1449597577379L
    val tuples = (1 to 10).map(t => (start + t * 1000, t))

    env.fromCollection(tuples)
      .assignAscendingTimestamps(_._1)
      .timeWindowAll(Time.of(1, TimeUnit.SECONDS))
      .sum(1)
      .print()

    env.execute()
}



输入:

 (1449597578379,1)
 (1449597579379,2)
 (1449597580379,3)
 (1449597581379,4)
 (1449597582379,5)
 (1449597583379,6)
 (1449597584379,7)
 (1449597585379,8)
 (1449597586379,9)
 (1449597587379,10)


结果:

[info] (1449597579379,2)
[info] (1449597581379,4)
[info] (1449597583379,6)
[info] (1449597585379,8)
[info] (1449597587379,10)
[info] (1449597578379,1)
[info] (1449597580379,3)
[info] (1449597582379,5)
[info] (1449597584379,7)
[info] (1449597586379,9)

    
  




  
  
  

    

      

        aljoscha..
         11
      
      
这种行为的原因是在Flink中,不考虑元素的排序(相对于时间戳).只有水印的正确性及其与元素时间戳的关系对于考虑时间的操作很重要,因为水印通常会触发基于时间的操作中的计算.

在您的示例中,窗口运算符将源中的所有元素存储在内部窗口缓冲区中.然后,源会发出一个水印,表示将来不会出现时间戳较小的元素.反过来,这会告诉窗口操作员使用低于水印的结束时间戳处理所有窗口(对于所有窗口都是如此).因此,它发出所有窗口(具有任意顺序),然后它自己发出水印.下游的操作本身将接收元素,并且一旦接收到水印就可以进行处理.

默认情况下,从源发出水印的时间间隔为200 ms.由于源发出的元素数量很少,所以在发出第一个水印之前会发出所有这些元素.在实际使用情况中,水印发射间隔比窗口大小小得多,您将获得按时间戳顺序发出的窗口的预期行为.例如,如果每500毫秒有1小时的窗口和水印.


1> aljoscha..：
这种行为的原因是在Flink中,不考虑元素的排序(相对于时间戳).只有水印的正确性及其与元素时间戳的关系对于考虑时间的操作很重要,因为水印通常会触发基于时间的操作中的计算.

在您的示例中,窗口运算符将源中的所有元素存储在内部窗口缓冲区中.然后,源会发出一个水印,表示将来不会出现时间戳较小的元素.反过来,这会告诉窗口操作员使用低于水印的结束时间戳处理所有窗口(对于所有窗口都是如此).因此,它发出所有窗口(具有任意顺序),然后它自己发出水印.下游的操作本身将接收元素,并且一旦接收到水印就可以进行处理.

默认情况下,从源发出水印的时间间隔为200 ms.由于源发出的元素数量很少,所以在发出第一个水印之前会发出所有这些元素.在实际使用情况中,水印发射间隔比窗口大小小得多,您将获得按时间戳顺序发出的窗口的预期行为.例如,如果每500毫秒有1小时的窗口和水印.



    

    

    
        推荐阅读
        
            
                                
                    
                        程序员
                        R:如何得到两个分布的总和？
                    

                    
                                                
                            
                        
                                                
                        如何解决《R:如何得到两个分布的总和？》经验，为你挑选了1个好方法。 ...
                        [详细]
                    
                    

                


                                
                    
                        程序员
                        如何在ReactiveCocoa 4中创建自定义信号？
                    

                    
                                                
                        如何解决《如何在ReactiveCocoa4中创建自定义信号？》经验，为你挑选了1个好方法。 ...
                        [详细]
                    
                    

                


                                
                    
                        程序员
                        任何状态更新,在Tensorflow的iOS示例上？
                    

                    
                                                
                        如何解决《任何状态更新,在Tensorflow的iOS示例上？》经验，为你挑选了1个好方法。 ...
                        [详细]
                    
                    

                


                                
                    
                        程序员
                        如何列出所有Presto工作人员？
                    

                    
                                                
                        如何解决《如何列出所有Presto工作人员？》经验，为你挑选了1个好方法。 ...
                        [详细]
                    
                    

                


                                
                    
                        程序员
                        在配置单元中,有没有办法指定添加新列的列之间？
                    

                    
                                                
                        如何解决《在配置单元中,有没有办法指定添加新列的列之间？》经验，为你挑选了1个好方法。 ...
                        [详细]
                    
                    

                


                                
                    
                        程序员
                        Android AWS S3 SDK TransferUtility在服务中不起作用
                    

                    
                                                
                        如何解决《AndroidAWSS3SDKTransferUtility在服务中不起作用》经验，为你挑选了1个好方法。 ...
                        [详细]
                    
                    

                


                                
                    
                        程序员
                        std :: transform命令保证
                    

                    
                                                
                        如何解决《std::transform命令保证》经验，为你挑选了1个好方法。 ...
                        [详细]
                    
                    

                


                                
                    
                        程序员
                        使用python将opencv图像传输到ffmpeg
                    

                    
                                                
                        如何解决《使用python将opencv图像传输到ffmpeg》经验，为你挑选了1个好方法。 ...
                        [详细]
                    
                    

                


                                
                    
                        程序员
                        序列化UTC时间c#
                    

                    
                                                
                        如何解决《序列化UTC时间c#》经验，为你挑选了0个好方法。 ...
                        [详细]
                    
                    

                


                                
                    
                        程序员
                        模型中的Laravel 5.1 bool属性在模型类中加入时返回空数组
                    

                    
                                                
                        如何解决《模型中的Laravel5.1bool属性在模型类中加入时返回空数组》经验，为你挑选了1个好方法。 ...
                        [详细]
                    
                    

                


                                
                    
                        程序员
                        等待使用异步方法的Task.Run不会在正确的线程上抛出异常
                    

                    
                                                
                        如何解决《等待使用异步方法的Task.Run不会在正确的线程上抛出异常》经验，为你挑选了1个好方法。 ...
                        [详细]
                    
                    

                


                                
                    
                        程序员
                        是否有可能将一个clojure矢量解构为最后两个项目,其余的？
                    

                    
                                                
                        如何解决《是否有可能将一个clojure矢量解构为最后两个项目,其余的？》经验，为你挑选了2个好方法。 ...
                        [详细]
                    
                    

                


                                
                    
                        程序员
                        不使用Marshmallow调用Spinner onItemSelected
                    

                    
                                                
                        如何解决《不使用Marshmallow调用SpinneronItemSelected》经验，为你挑选了0个好方法。 ...
                        [详细]
                    
                    

                


                                
                    
                        程序员
                        清除所有setIntervals
                    

                    
                                                
                        如何解决《清除所有setIntervals》经验，为你挑选了1个好方法。 ...
                        [详细]
                    
                    

                


                                
                    
                        程序员
                        如何在Visual Studio 2015中将c#csproj编译为exe  - 错误CS0579
                    

                    
                                                
                        如何解决《如何在VisualStudio2015中将c#csproj编译为exe-错误CS0579》经验，为你挑选了1个好方法。 ...
                        [详细]
                    
                    

                


                                
                    
                        程序员
                        RxSwift MVVM如何使用项目管理器设置视图模型？
                    

                    
                                                
                        如何解决《RxSwiftMVVM如何使用项目管理器设置视图模型？》经验，为你挑选了1个好方法。 ...
                        [详细]
                    
                    

                


                                
                    
                        程序员
                        如何使用3to2
                    

                    
                                                
                        如何解决《如何使用3to2》经验，为你挑选了1个好方法。 ...
                        [详细]
                    
                    

                


                                
                    
                        程序员
                        对staticMetaObject的未定义引用
                    

                    
                                                
                        如何解决《对staticMetaObject的未定义引用》经验，为你挑选了1个好方法。 ...
                        [详细]
                    
                    

                


                                
                    
                        程序员
                        C++有没有订购哈希？
                    

                    
                                                
                        如何解决《C++有没有订购哈希？》经验，为你挑选了0个好方法。 ...
                        [详细]
                    
                    

                


                                
                    
                        程序员
                        React Native  -  MapView  - 带有自定义图像的注释
                    

                    
                                                
                        如何解决《ReactNative-MapView-带有自定义图像的注释》经验，为你挑选了1个好方法。 ...
                        [详细]
                    
                    

                


                

            
        
    

    
        吐了个 "CAO" !
        
            
                吐个槽吧,看都看了
            
            
                
                                        会员登录 | 用户注册
























    

    
        
            
            
                
                    
                
            

            
                ifx0448363            

            
                这个屌丝很懒，什么也没留下！            
            
            

                                
                    
                    关注作者
                            

        
    


    
        Tags | 热门标签
        
            
                                
                    actionscrip
                
                                
                    bash
                
                                
                    c#
                
                                
                    c++
                
                                
                    c语言
                
                                
                    erlang
                
                                
                    flutter
                
                                
                    go
                
                                
                    golang
                
                                
                    java
                
                                
                    javascript
                
                                
                    lua
                
                                
                    node.js
                
                                
                    perl
                
                                
                    php
                
                                
                    python
                
                                
                    scala
                
                                
                    typescript
                
                                
            
        
    


    
        RankList | 热门文章
        
            
                                
                    1整数溢出异常
                
                                
                    2TypedFactory在组件将其用作依赖项之前进行处置
                
                                
                    3如何设置对象名称？
                
                                
                    4DataFrame到spark scala中的HDFS
                
                                
                    5在C中查找数组中最小数字的算法
                
                                
                    6使用(x,y)坐标对偏移进行排序会导致违反比较器合同
                
                                
                    7如何从浮点数中得到精确的小数部分作为整数？
                
                                
                    8正则表达式 - 将C#Regex转换为JavaScript Regex的量词的目标无效
                
                                
                    9如何将图标(Bitmap)转换为ImageSource？
                
                                
                    10UglifyJS选项只删除死代码
                
                                
                    11如何生成Firebase ID？
                
                                
                    12有没有一种可靠的方法来了解哪些库可以在elf二进制文件中进行dlopen()编辑？
                
                                
                    13箭头函数与函数声明/表达式:它们是等效/可交换的吗？
                
                                
                    14Google Adwords CSP(内容安全政策)img-src
                
                                
                    15在PHP中查找并从String中提取匹配值
                
                                
                    16"使用未分配的局部变量"错误的原因是什么？
                
                                
                    17声明函数并在jquery事件绑定上调用它
                
                                
                    18如何以编程方式撰写邮件？
                
                                
                    19如何使用jQuery/Javascript将0.0099999999999909舍入到0.01？
                
                                
                    20如何在React组件上管理状态,该组件可以从父级或事件中的事件更改状态？