我是机器学习的新手学习者,并且对调整感到困惑.调整机器学习的目的是什么?要为算法选择最佳参数?调整如何工作?
如果没有进入适合Stackoverflow的技术演示,这里有一些一般性的想法.从本质上讲,人们可以争辩说,机器学习的最终目标是使机器系统能够自动地从数据建立模型,而不需要繁琐和耗时的人工参与.如您所知,其中一个难点是学习算法(例如决策树,随机森林,聚类技术等)要求您在使用模型之前设置参数(或至少设置对这些参数的约束).如何设置这些参数可能取决于许多因素.也就是说,您的目标通常是将这些参数设置为最佳值,以便您以最佳方式完成学习任务.因此,调整算法或机器学习技术,可以简单地认为是一个过程,在这个过程中,他们优化影响模型的参数,以使算法能够表现最佳(当然,你已经定义了什么"最好的"实际是).
为了使其更具体,这里有几个例子.如果您使用机器学习算法进行像KNN这样的聚类,您将注意到,作为程序员,您必须指定所使用的模型(或质心)中的K的数量.你怎么做到这一点?你调整模型.有很多方法可以做到这一点.其中一个可以为模型尝试许多不同的K值,并希望了解组内和组内错误与模型中K的数量之间的关系.
作为另一个例子,让我们考虑支持向量机(SVM)分类.SVM分类需要初始学习阶段,其中训练数据用于调整分类参数.这实际上是指初始参数调整阶段,作为程序员,您可能会尝试"调整"模型以获得高质量的结果.
现在,您可能认为这个过程很难,而且您是对的.事实上,由于难以确定最佳模型参数是什么,一些研究人员在使用更好的调整参数的更简单的替代方案充分试验之前使用复杂的学习算法.