15赞

从对象数组中删除重复项

作者：拾味湖 | 2023-09-10 19:39

如何解决《从对象数组中删除重复项》经验，为你挑选了1个好方法。

我有一个叫Customer有几个字符串属性的类

firstName, lastName, email, etc.

我从一个csv创建该类数组的文件中读取客户信息:

Customer[] customers

我需要删除具有相同电子邮件地址的重复客户,每个特定电子邮件地址只留下1个客户记录.

我使用2个循环完成了这项工作,但由于通常有50,000多个客户记录,因此需要将近5分钟.完成删除重复项后,我需要将客户信息写入另一个csv文件(此处无需帮助).

如果我Distinct在循环中执行了一个循环,那么如何删除作为该特定客户的类的一部分的其他字符串变量？

谢谢,安德鲁

1> Arghya C..：

使用Linq,您可以在O(n)时间(单级循环)中使用a执行此操作GroupBy

var uniquePersons = persons.GroupBy(p => p.Email)
                           .Select(grp => grp.First())
                           .ToArray();

更新

一点点O(n)行为GroupBy.

GroupBy在Linq(Enumerable.cs)中实现为 -

该IEnumerable迭代一次创建分组.提供Hash的密钥的一个(例如,这里的"电子邮件")用于查找唯一密钥,并且元素被添加Grouping到与密钥对应的元素中.

请参阅此GetGrouping代码.还有一些旧帖子可供参考.

GroupBy操作的渐近复杂性是什么？

LINQ方法的运行时复杂性(Big-O)有什么保证？

然后Select显然是一个O(n)代码,O(n)整体上面的代码.

更新2

处理empty/ null值.

所以,如果存在这样的情况,其中的价值Email是null或empty,简单的GroupBy将刚刚从这些对象之一null与empty每个.

使用null/ emptyvalue 包含所有这些对象的一种快捷方法是在运行时为这些对象使用一些唯一键,例如

var tempEmailIndex = 0;
var uniqueNullAndEmpty = persons
                         .GroupBy(p => string.IsNullOrEmpty(p.Email) 
                                       ? (++tempEmailIndex).ToString() : p.Email)
                         .Select(grp => grp.First())
                         .ToArray();

推荐阅读

程序员
ipywidgets下拉小部件:onchange事件是什么？

如何解决《ipywidgets下拉小部件:onchange事件是什么？》经验，为你挑选了1个好方法。 ... [详细]
程序员
Javascript属性未更新

如何解决《Javascript属性未更新》经验，为你挑选了1个好方法。 ... [详细]
程序员
如何改变小吃店的背景颜色？

如何解决《如何改变小吃店的背景颜色？》经验，为你挑选了7个好方法。 ... [详细]
程序员
Visual Studio git同步抛出错误

如何解决《VisualStudiogit同步抛出错误》经验，为你挑选了1个好方法。 ... [详细]
程序员
为什么strings.HasPrefix比bytes.HasPrefix快？

如何解决《为什么strings.HasPrefix比bytes.HasPrefix快？》经验，为你挑选了1个好方法。 ... [详细]
程序员
ACTION_OPEN_DOCUMENT在MIUI上不起作用

如何解决《ACTION_OPEN_DOCUMENT在MIUI上不起作用》经验，为你挑选了1个好方法。 ... [详细]
程序员
如何将文本参数传递给`IN`运算符的存储函数

如何解决《如何将文本参数传递给`IN`运算符的存储函数》经验，为你挑选了1个好方法。 ... [详细]
程序员
带有Open vSwitch的LXC

如何解决《带有OpenvSwitch的LXC》经验，为你挑选了0个好方法。 ... [详细]
程序员
在Java中解析异常

如何解决《在Java中解析异常》经验，为你挑选了1个好方法。 ... [详细]
程序员
返回true然后从for循环中断

如何解决《返回true然后从for循环中断》经验，为你挑选了1个好方法。 ... [详细]
程序员
如何在getJSON()函数中检查文件？

如何解决《如何在getJSON()函数中检查文件？》经验，为你挑选了1个好方法。 ... [详细]
程序员
将嵌套数组转换为对象

如何解决《将嵌套数组转换为对象》经验，为你挑选了0个好方法。 ... [详细]
程序员
两个不同的OWIN应用程序可以授权OAuth2承载访问令牌吗？

如何解决《两个不同的OWIN应用程序可以授权OAuth2承载访问令牌吗？》经验，为你挑选了1个好方法。 ... [详细]
程序员
Github错误：无法连接到443端口

如何解决《Github错误：无法连接到443端口》经验，为你挑选了1个好方法。 ... [详细]
程序员
C++ lambda两个复制构造函数调用

如何解决《C++lambda两个复制构造函数调用》经验，为你挑选了1个好方法。 ... [详细]
程序员
可捕获的致命错误:传递给"...\FormType :: __ construct()的参数1必须实现接口

如何解决《可捕获的致命错误:传递给"\FormType::__construct()的参数1必须实现接口》经验，为你挑选了0个好方法。 ... [详细]
程序员
线条图用灰色和黑色虚线

如何解决《线条图用灰色和黑色虚线》经验，为你挑选了1个好方法。 ... [详细]
程序员
Json.Net序列化类名而不是内部属性

如何解决《Json.Net序列化类名而不是内部属性》经验，为你挑选了1个好方法。 ... [详细]
程序员
MATLAB对数组值表达式的所有元素求和

如何解决《MATLAB对数组值表达式的所有元素求和》经验，为你挑选了1个好方法。 ... [详细]
程序员
如何在Jinja扩展中解析和注入其他节点？

如何解决《如何在Jinja扩展中解析和注入其他节点？》经验，为你挑选了1个好方法。 ... [详细]

拾味湖

这个屌丝很懒，什么也没留下！

关注作者

Tags | 热门标签

RankList | 热门文章