如何使用SSIS从平面文件中删除重复的行？

作者：360691894_8a5c48 | 2023-09-04 17:32

如何解决《如何使用SSIS从平面文件中删除重复的行？》经验，为你挑选了2个好方法。

首先我要说的是,能够从平面文件中获取1700万条记录,推送到远程盒子上的数据库并花费7分钟是令人惊讶的.SSIS真的太棒了.但是现在我有那些数据,如何删除重复数据？

更好的是,我想获取平面文件,从平面文件中删除重复项并将它们放回另一个平面文件中.

我在考虑:

Data Flow Task

文件源(带有关联的文件连接)

一个for循环容器

一个脚本容器,包含一些逻辑来判断是否存在另一行

亲爱的,这个网站上的每个人都非常了解.

Update: 我找到了这个链接,可能有助于回答这个问题

1> Craig Warren..：

使用排序组件.

只需选择要对加载的行进行排序的字段,在左下角,您将看到一个复选框以删除重复项.此框仅根据排序条件删除任何重复的行,因此在下面的示例中,如果我们仅对第一个字段进行排序,则行将被视为重复:

1 | sample A |
1 | sample B |

2> Timothy Lee ..：

我建议使用SSIS将记录复制到临时表,然后创建一个根据您的情况使用Select Distinct或Rank的任务来选择将它们汇总到平面文件并从临时表中删除它们的重复项.最后一步是将临时表中的记录复制到目标表中.

确定重复是SQL擅长的,但平面文件不太适合.在你提出的情况下,脚本容器会加载一行,然后必须将它与1700万条记录进行比较,然后加载下一行并重复...性能可能不是那么好.

推荐阅读

程序员
将AWS开发工具包与Web Worker一起使用

如何解决《将AWS开发工具包与WebWorker一起使用》经验，为你挑选了0个好方法。 ... [详细]
程序员
PDFBox的.Java:如何只打印一页PDF而不是完整文档？

如何解决《PDFBox的.Java:如何只打印一页PDF而不是完整文档？》经验，为你挑选了0个好方法。 ... [详细]
程序员
使用Angular.js在一些值之后中断表行

如何解决《使用Angular.js在一些值之后中断表行》经验，为你挑选了0个好方法。 ... [详细]
程序员
空列表和空列表有什么区别？

如何解决《空列表和空列表有什么区别？》经验，为你挑选了1个好方法。 ... [详细]
程序员
perl基础知识 - SHIFT功能如何工作

如何解决《perl基础知识-SHIFT功能如何工作》经验，为你挑选了1个好方法。 ... [详细]
程序员
将Python Pandas数据帧上传到MySQL - InternalError:1366,"不正确的字符串值"

如何解决《将PythonPandas数据帧上传到MySQL-InternalError:1366,"不正确的字符串值"》经验，为你挑选了1个好方法。 ... [详细]
程序员
删除Realm中的列

如何解决《删除Realm中的列》经验，为你挑选了1个好方法。 ... [详细]
程序员
Symfony2-如何在准则2中查询带有条件的左联接

如何解决《Symfony2-如何在准则2中查询带有条件的左联接》经验，为你挑选了1个好方法。 ... [详细]
程序员
处理抽象类和类型参数固有的类

如何解决《处理抽象类和类型参数固有的类》经验，为你挑选了0个好方法。 ... [详细]
程序员
用户下订单时调用函数(实际上是API调用)

如何解决《用户下订单时调用函数(实际上是API调用)》经验，为你挑选了1个好方法。 ... [详细]
程序员
如何以编程方式禁用接近传感器

如何解决《如何以编程方式禁用接近传感器》经验，为你挑选了0个好方法。 ... [详细]
程序员
如何将指针作为迭代器返回？

如何解决《如何将指针作为迭代器返回？》经验，为你挑选了1个好方法。 ... [详细]
程序员
This()vs Target()aspectj

如何解决《This()vsTarget()aspectj》经验，为你挑选了1个好方法。 ... [详细]
程序员
django foreignkey(用户)的模特

如何解决《djangoforeignkey(用户)的模特》经验，为你挑选了1个好方法。 ... [详细]
程序员
如何添加EXIF信息以在.NET中对图像进行地理标记？

如何解决《如何添加EXIF信息以在.NET中对图像进行地理标记？》经验，为你挑选了1个好方法。 ... [详细]
程序员
尝试在Visual Studio 2013中引用静态库项目时出现链接器错误

如何解决《尝试在VisualStudio2013中引用静态库项目时出现链接器错误》经验，为你挑选了1个好方法。 ... [详细]
程序员
当页面在每页上空闲3秒钟时,移至下一页和后续页面

如何解决《当页面在每页上空闲3秒钟时,移至下一页和后续页面》经验，为你挑选了0个好方法。 ... [详细]
程序员
二进制搜索树优于C++中的向量

如何解决《二进制搜索树优于C++中的向量》经验，为你挑选了1个好方法。 ... [详细]
程序员
使用'_'React/React-native为函数名添加前缀是什么意思？

如何解决《使用'_'React/React-native为函数名添加前缀是什么意思？》经验，为你挑选了1个好方法。 ... [详细]
程序员
仅在特定设备上的SurfaceView中的ANR - 唯一的解决方案是短暂的睡眠时间

如何解决《仅在特定设备上的SurfaceView中的ANR-唯一的解决方案是短暂的睡眠时间》经验，为你挑选了1个好方法。 ... [详细]

360691894_8a5c48

这个屌丝很懒，什么也没留下！

关注作者

Tags | 热门标签

RankList | 热门文章