算法对产品列表进行分类？

作者：ERIK又 | 2023-08-28 17:41

如何解决《算法对产品列表进行分类？》经验，为你挑选了1个好方法。

我有一个代表大致相同的产品的清单.例如,在下面的列表中,它们都是希捷硬盘.

希捷硬盘500Go

希捷硬盘120Go笔记本电脑

希捷Barracuda 7200.12 ST3500418AS 500GB 7200 RPM SATA 3.0Gb/s硬盘

希捷新推出的500G硬盘

希捷Barracuda 7200.12

希捷FreeAgent Desk 500GB外置硬盘银7200RPM USB2.0零售

对于人类而言,硬盘驱动器3和5是相同的.我们可以更进一步,并假设产品1,3,4和5是相同的,并将产品2和6放在其他类别中.

我们有很多我想要分类的产品清单.有没有人知道做这种事情的最佳算法是什么.有什么建议？

我虽然使用贝叶斯分类器,但我不确定它是否是最佳选择.任何帮助,将不胜感激!

谢谢.

1> Manuel..：

您至少需要两个组件:

首先,您需要进行"特征"提取的内容,即获取项目并提取相关信息.例如,"new and shinny"与"500Go硬盘"和"seagate"不相关.(非常)简单的方法包括简单的启发式提取制造商,技术名称如"USB2.0"和每个项目的"GB","RPM"等模式.

然后,您最终会为每个项目提供一组功能.一些机器学习的人喜欢把它放到"特征向量"中,即每个特征有一个条目,设置为0或1,具体取决于特征是否存在.这是您的数据表示.在此向量上,您可以进行距离比较.

请注意,最终可能会有数千个条目的向量.即便如此,您还必须对结果进行聚类.

可能有用的维基百科文章:

特征提取

推荐阅读

程序员
SQL-Server Time数据类型

如何解决《SQL-ServerTime数据类型》经验，为你挑选了1个好方法。 ... [详细]
程序员
NSPredicate有多个参数和"AND行为"

如何解决《NSPredicate有多个参数和"AND行为"》经验，为你挑选了2个好方法。 ... [详细]
程序员
Node.js和sqlite,SQLITE_RANGE:绑定或列索引超出范围

如何解决《Node.js和sqlite,SQLITE_RANGE:绑定或列索引超出范围》经验，为你挑选了0个好方法。 ... [详细]
程序员
参考两个项目

如何解决《参考两个项目》经验，为你挑选了1个好方法。 ... [详细]
程序员
RabbitMQ def回调（通道，方法，属性，主体）

如何解决《RabbitMQdef回调（通道，方法，属性，主体）》经验，为你挑选了1个好方法。 ... [详细]
程序员
为什么Node fs.writeFile()方法成功,但是一个空文件然后被发送到浏览器？

如何解决《为什么Nodefs.writeFile()方法成功,但是一个空文件然后被发送到浏览器？》经验，为你挑选了1个好方法。 ... [详细]
程序员
为什么css"text-decoration"继承不适用于"inline-block"？

如何解决《为什么css"text-decoration"继承不适用于"inline-block"？》经验，为你挑选了1个好方法。 ... [详细]
程序员
PowerShell是否编译脚本？

如何解决《PowerShell是否编译脚本？》经验，为你挑选了1个好方法。 ... [详细]
程序员
Spring JpaRepository如何查询@ManyToMany实体

如何解决《SpringJpaRepository如何查询@ManyToMany实体》经验，为你挑选了1个好方法。 ... [详细]
程序员
基于两个标准从列表中检索项目的"最佳"pythonic方法

如何解决《基于两个标准从列表中检索项目的"最佳"pythonic方法》经验，为你挑选了1个好方法。 ... [详细]
程序员
批处理文件:检查是否存在带有模式的文件

如何解决《批处理文件:检查是否存在带有模式的文件》经验，为你挑选了2个好方法。 ... [详细]
程序员
AWS Data Pipeline RedShift"未找到分隔符"错误

如何解决《AWSDataPipelineRedShift"未找到分隔符"错误》经验，为你挑选了1个好方法。 ... [详细]
程序员
VBA:将Variable Array转换为String

如何解决《VBA:将VariableArray转换为String》经验，为你挑选了2个好方法。 ... [详细]
程序员
为什么Xcode 7.2崩溃'无法实例化名为IBNSLayoutConstraint的类'？

如何解决《为什么Xcode7.2崩溃'无法实例化名为IBNSLayoutConstraint的类'？》经验，为你挑选了2个好方法。 ... [详细]
程序员
INT 0x13/AH = 0x02适用于软盘映像,但不能在闪存驱动器上刻录

如何解决《INT0x13/AH=0x02适用于软盘映像,但不能在闪存驱动器上刻录》经验，为你挑选了1个好方法。 ... [详细]
程序员
如何自动更新所有Node.js模块？

如何解决《如何自动更新所有Node.js模块？》经验，为你挑选了1个好方法。 ... [详细]
程序员
编译ISO SQL-2003 ANTLR语法

如何解决《编译ISOSQL-2003ANTLR语法》经验，为你挑选了0个好方法。 ... [详细]
程序员
如何停止ScheduledExecutorService？

如何解决《如何停止ScheduledExecutorService？》经验，为你挑选了1个好方法。 ... [详细]
程序员
创建Hive表以从镶木地板/ avro模式中读取镶木地板文件

如何解决《创建Hive表以从镶木地板/avro模式中读取镶木地板文件》经验，为你挑选了1个好方法。 ... [详细]
程序员
Openlayer 3 - 检查功能是否在范围的范围内

如何解决《Openlayer3-检查功能是否在范围的范围内》经验，为你挑选了1个好方法。 ... [详细]

ERIK又

这个屌丝很懒，什么也没留下！

关注作者

Tags | 热门标签

RankList | 热门文章