如何在分类机器学习算法中发现新类？

作者：个性2402852463 | 2023-09-10 13:11

如何解决《如何在分类机器学习算法中发现新类？》经验，为你挑选了1个好方法。

我正在使用多类分类器(支持向量机,通过One-Vs-All)来分类数据样本.假设我目前有n不同的课程.

但是,在我面临的场景中,新数据样本可能属于之前未见过的新类n+1.

所以我想你可以说我需要一种在线学习的形式,因为在开始时没有适合所有数据出现的明显训练集.相反,我需要SVM动态适应未来可能出现的新类.

所以我想知道我是否以及如何......

确定新数据样本不完全适合现有类,但应该导致创建新类.

将该新类集成到现有分类器中.

我可以模糊地想到一些可能解决这个问题的方法:

如果没有二进制SVM分类器(因为我在OVA情况下对每个类有一个)预测新数据样本的相当高的概率(例如> 0.5),我可以假设这个新数据样本可以代表新类.

我可以为该新类训练一个新的二进制分类器并将其添加到多类SVM中.

然而,这些只是我天真的想法.我想知道是否有一些"适当的"方法,例如使用聚类算法来查找所有类.

或许我尝试使用SVM的方法甚至不适合这种问题？

非常感谢帮助.

1> David Dale..：

与任何其他机器学习问题一样,如果您没有质量标准,那么您很糟糕.

当人们说"分类"时,他们会在脑海中监督学习:有一些基本的事实可以训练和检查你的算法.如果出现新的类,这个基本事实是模棱两可的.想象一下,一类是"马",你会看到许多马:黑马,棕马,甚至是白马.突然间你看到一只斑马了.哇!这是一个新的阶级还是一匹不寻常的马？答案取决于您将如何使用您的班级标签.SVM本身无法决定,因为SVM不使用这些标签,它只生成它们.决定取决于人(或某种决策算法,它知道什么是"好"和"坏",即有自己的"损失函数"或"效用函数").

所以你需要一个主管.但是你怎么能协助这位主管呢？我想到两个选择:

异常检测.这可以帮助您尽早出现新课程.在您的算法看到第一只斑马之后,它会发出警报:"有一些不寻常的东西!".例如,在sklearn中,从随机森林到单类SVM的各种算法可用于检测异常观察.然后你的主管可以看看他们并决定他们是否应该组建一个全新的班级.

聚类.它可以帮助您决定拆分类.例如,在第一个斑马之后,你决定不值得一个新的课程.但随着时间的推移,您的算法已累积了数十个图像.因此,如果您在标记为"马"的所有观察上运行聚类算法,则最终可能会得到两个分离良好的聚类.并且由主管决定是否应该将条纹马从普通的马分离成新的类.

如果您希望此决策纯粹是自动的,则如果群集内平均距离与群集间距离的比率足够低,则可以拆分类.但只有当你有一个良好的距离指标时,它才会运作良好.什么是"好"再次由您如何使用算法以及您的最终目标定义.

推荐阅读

程序员
在扇形图中R与其他包比fanplot

如何解决《在扇形图中R与其他包比fanplot》经验，为你挑选了0个好方法。 ... [详细]
程序员
在Smalltalk中,如果x是一个数组,并且x at:3 put:123将起作用,那么(x at:3)+ 1如何工作？

如何解决《在Smalltalk中,如果x是一个数组,并且xat:3put:123将起作用,那么(xat:3)+1如何工作？》经验，为你挑选了2个好方法。 ... [详细]
程序员
str_replace"NA"出现意外行为

如何解决《str_replace"NA"出现意外行为》经验，为你挑选了0个好方法。 ... [详细]
程序员
向活动添加按钮以打开浏览器URL

如何解决《向活动添加按钮以打开浏览器URL》经验，为你挑选了1个好方法。 ... [详细]
程序员
CakePHP 3.1 patchEntity在清理时始终将belongsToMany关联标记为脏

如何解决《CakePHP3.1patchEntity在清理时始终将belongsToMany关联标记为脏》经验，为你挑选了0个好方法。 ... [详细]
程序员
删除R中的反斜杠和引号

如何解决《删除R中的反斜杠和引号》经验，为你挑选了1个好方法。 ... [详细]
程序员
使用SpreadsheetApp脚本重置范围颜色

如何解决《使用SpreadsheetApp脚本重置范围颜色》经验，为你挑选了1个好方法。 ... [详细]
程序员
PostgreSQL子字符串在括号之间获取字符串

如何解决《PostgreSQL子字符串在括号之间获取字符串》经验，为你挑选了1个好方法。 ... [详细]
程序员
当使用::？指定模块时,为什么Ruby不能在更高的范围内查找类？

如何解决《当使用::？指定模块时,为什么Ruby不能在更高的范围内查找类？》经验，为你挑选了1个好方法。 ... [详细]
程序员
Sublime Text 3:将文本写入输出面板

如何解决《SublimeText3:将文本写入输出面板》经验，为你挑选了0个好方法。 ... [详细]
程序员
如何在使用composer省略选择文件的同时需要包

如何解决《如何在使用composer省略选择文件的同时需要包》经验，为你挑选了0个好方法。 ... [详细]
程序员
DataTable未加载SqlDataReader

如何解决《DataTable未加载SqlDataReader》经验，为你挑选了1个好方法。 ... [详细]
程序员
显示隐藏文本与淡入淡出效果以及背景div？

如何解决《显示隐藏文本与淡入淡出效果以及背景div？》经验，为你挑选了1个好方法。 ... [详细]
程序员
与Route.php中的身份验证一起授权:Laravel 5.1

如何解决《与Route.php中的身份验证一起授权:Laravel5.1》经验，为你挑选了1个好方法。 ... [详细]
程序员
在编译时填充std :: array并使用const_cast填充可能的未定义行为

如何解决《在编译时填充std::array并使用const_cast填充可能的未定义行为》经验，为你挑选了1个好方法。 ... [详细]
程序员
如何设置karma/jasmine与ionic2一起使用？

如何解决《如何设置karma/jasmine与ionic2一起使用？》经验，为你挑选了1个好方法。 ... [详细]
程序员
使用python设置组权限

如何解决《使用python设置组权限》经验，为你挑选了1个好方法。 ... [详细]
程序员
ACRA发送自定义数据REPORTFIELD

如何解决《ACRA发送自定义数据REPORTFIELD》经验，为你挑选了1个好方法。 ... [详细]
程序员
SQL Server - 来自简单愚蠢查询的差异结果？

如何解决《SQLServer-来自简单愚蠢查询的差异结果？》经验，为你挑选了1个好方法。 ... [详细]
程序员
如何将此连接值分配回其表？

如何解决《如何将此连接值分配回其表？》经验，为你挑选了1个好方法。 ... [详细]

个性2402852463

这个屌丝很懒，什么也没留下！

关注作者

Tags | 热门标签

RankList | 热门文章