当前位置:  开发笔记 > 编程语言 > 正文

什么是一些好的机器学习编程练习?

如何解决《什么是一些好的机器学习编程练习?》经验,为你挑选了3个好方法。

理想情况下,它们具有以下特征:

    它们可以在一个编码的晚上完成.它不需要一周或更长时间才能获得有趣的结果.这样,我觉得我已经学会了并且只用一个(可能几个小时)坐着就能完成一些事情.

    问题来自现实世界,或者它们至少是现实世界问题的玩具版本.

    如果问题需要数据来测试解决方案,那么现实世界的数据集很容易获得,或者我自己生成有趣的测试数据是微不足道的.

    很容易评估我所做的工作有多好.当我测试我的解决方案时,从结果中可以清楚地看出,我已经完成了一些非常重要的事情,无论是通过简单的检查,还是通过量化的结果质量测量.

carlosdc.. 22

实现以下算法:

Perceptron,margin perceptron:您可以尝试使用任何面部数据库检测面部图像(对面部和非面部图像进行分类).试试例如MIT CBCL人脸数据库.您还可以尝试MNIST数据并编写一个穷人的OCR系统.

LVQ,Kohonen地图:你可以尝试压缩图像.您可以从任何壁纸网站下载大图像.

朴素贝叶斯分类器:您可以对垃圾邮件进行分类,而不是垃圾邮件.还有更多的科学数据集,如路透社和新闻组等,鉴于这篇文章,你必须确定这个主题.

反向传播,多层感知器:您可以尝试使用面部,垃圾邮件或文本/直方图数据.

使用SGD进行原始SVM线性学习:例如,您可以使用MNIST数字进行尝试.

有很多项目,其中一些需要几个小时,有些需要几天,但你肯定会学到很多东西.



1> carlosdc..:

实现以下算法:

Perceptron,margin perceptron:您可以尝试使用任何面部数据库检测面部图像(对面部和非面部图像进行分类).试试例如MIT CBCL人脸数据库.您还可以尝试MNIST数据并编写一个穷人的OCR系统.

LVQ,Kohonen地图:你可以尝试压缩图像.您可以从任何壁纸网站下载大图像.

朴素贝叶斯分类器:您可以对垃圾邮件进行分类,而不是垃圾邮件.还有更多的科学数据集,如路透社和新闻组等,鉴于这篇文章,你必须确定这个主题.

反向传播,多层感知器:您可以尝试使用面部,垃圾邮件或文本/直方图数据.

使用SGD进行原始SVM线性学习:例如,您可以使用MNIST数字进行尝试.

有很多项目,其中一些需要几个小时,有些需要几天,但你肯定会学到很多东西.



2> winwaed..:

大多数机器学习项目可能需要一些时间.

关于贝叶斯文本的分类怎么样?

NLTK Toolkit(Python的自然语言工具包)中的一个示例是电影评论.该工具包提供标记为正面或负面的电影评论.

编写一个可以对电影评论进行分类的贝叶斯分类器,使用这些数据进行培训.



3> George..:

检查UCI机器学习库以获取真实数据集.

例如,乳腺癌威斯康星(诊断)数据集.检查数据集描述以获取有关它的更多信息.

甚至朴素贝叶斯分类器也会在这个数据集上给出很好的结果(超过95%的交叉验证精度).如果我没记错的话,通过一些变量选择你甚至可以达到100%.

推荐阅读
吻过彩虹的脸_378
这个屌丝很懒,什么也没留下!
DevBox开发工具箱 | 专业的在线开发工具网站    京公网安备 11010802040832号  |  京ICP备19059560号-6
Copyright © 1998 - 2020 DevBox.CN. All Rights Reserved devBox.cn 开发工具箱 版权所有