13赞

单元测试机器学习代码

作者：135369一生真爱_890 | 2023-08-09 14:45

如何解决《单元测试机器学习代码》经验，为你挑选了4个好方法。

我正在为计算机视觉论文编写一个相当复杂的机器学习程序.它工作得很好,但我需要继续尝试新的东西并添加新的功能.这是有问题的,因为我在扩展代码或尝试简化算法时有时会引入错误.

显然,正确的做法是添加单元测试,但目前尚不清楚如何做到这一点.我的程序的许多组件产生了一些主观的答案,我无法自动进行健全性检查.

例如,我有一些代码使用较低分辨率的曲线近似曲线,因此我可以在较低分辨率的曲线上进行计算密集型工作.我不小心在这段代码中引入了一个错误,只有当我整个程序的结果稍差时,才会通过艰苦的搜索找到它.

但是,当我尝试为它编写单元测试时,我不知道应该做什么.如果我制作一个具有明确正确的低分辨率版本的简单曲线,那么我并没有真正测试出错的一切.如果我做一个简单的曲线,然后稍微扰乱点,我的代码开始产生不同的答案,即使这个特定的代码片段现在似乎真的很好.

1> S.Lott..：

"那我就不是在测试可能出错的一切."

正确.

单元测试的工作不是测试可能出错的一切.

单元测试的工作是根据具体的输入和特定的预期结果来测试你所拥有的是正确的.这里的重要部分是具体的可见外部要求,具体测试用例满足.并非所有可能出错的事都以某种方式被阻止.

什么都不能测试可能出错的一切.你可以写一个证明,但是你很难为所有东西编写测试.

明智地选择您的测试用例.

此外,单元测试的工作是测试整个应用程序的每个小部分都做正确的事情 - 孤立地.

例如,您的"使用较低分辨率曲线近似曲线的代码"可能有几个小部件,可以作为单独的单元进行测试.处于隔离状态.整合的整体也可以进行测试,以确保它的工作原理.

例如,您对"低分辨率曲线的计算密集型工作"可能有几个小部件可以作为单独的单元进行测试.处于隔离状态.

单元测试的这一点是创建后来组装的小型,正确的单元.

2> tvanfosson..：

没有看到你的代码,很难说,但我怀疑你是在试图在太高的水平上编写测试.您可能想要将您的方法分解为确定性的小组件并对其进行测试.然后通过提供从底层方法(可能位于不同对象)返回可预测值的模拟实现来测试使用这些方法的方法.然后,您可以编写涵盖各种方法领域的测试,确保您覆盖所有可能的结果.对于小方法,您可以通过提供表示输入域的值来实现.对于依赖于这些的方法,通过提供从依赖项返回结果范围的模拟实现.

3> APC..：

你可能不会体会到讽刺,但基本上你所拥有的是遗留代码:一大堆没有任何单元测试的软件.当然你不知道从哪里开始.因此,您可能会发现阅读处理遗留代码很有帮助.

关于这一点的最终想法是Michael Feather的书"有效地使用遗留代码".在ObjectMentor网站上曾经有过一个有用的摘要,但是网站已经走了公司的道路.然而,WELC在评论和其他文章中留下了遗产. 检查出来(或者只是买书),虽然关键课程是S.Lott和tvanfosson在回复中提到的.

该PDF的作者现在有一本关于同一主题的优秀书籍:http://www.amazon.com/Working-Effectively-Legacy-Michael-Feathers/dp/0131177052

4> 0xfe..：

您的单元测试需要使用某种模糊因子,通过接受近似值或使用某种概率检查.

例如,如果您有一些返回浮点结果的函数,则几乎不可能编写在所有平台上都能正常工作的测试.您的检查需要执行近似.

TEST_ALMOST_EQ(result, 4.0);

以上TEST_ALMOST_EQ可能会验证result介于3.9和4.1之间(例如).

或者,如果您的机器学习算法是概率性的,那么您的测试需要通过获取多次运行的平均值并期望它在某个范围内来适应它.

x = 0;
for (100 times) {
  x += result_probabilistic_test();
}

avg = x/100;
TEST_RANGE(avg, 10.0, 15.0);

当然,测试是非确定性的,因此您需要对它们进行调整,以便您可以很高的概率进行非片状测试.(例如,增加试验次数,或增加误差范围).

您也可以使用模拟(例如,用于概率算法的模拟随机数生成器),它们通常有助于确定性地测试特定的代码路径,但它们需要付出很多努力才能维护.理想情况下,您将使用模糊测试和模拟的组合.

HTH.

推荐阅读

程序员
AngularJS - 在私有函数中使用'this'

如何解决《AngularJS-在私有函数中使用'this'》经验，为你挑选了1个好方法。 ... [详细]
程序员
隐藏另一个布局的浮动操作按钮

如何解决《隐藏另一个布局的浮动操作按钮》经验，为你挑选了1个好方法。 ... [详细]
程序员
从ec2 Linux AMI连接到RDS MySQL实例-找不到mysql命令

如何解决《从ec2LinuxAMI连接到RDSMySQL实例-找不到mysql命令》经验，为你挑选了0个好方法。 ... [详细]
程序员
以编程方式重启app？

如何解决《以编程方式重启app？》经验，为你挑选了1个好方法。 ... [详细]
程序员
AWS是否支持RDS Insance的自动扩展

如何解决《AWS是否支持RDSInsance的自动扩展》经验，为你挑选了2个好方法。 ... [详细]
程序员
用于HTTP通信的出站通道适配器与出站网关

如何解决《用于HTTP通信的出站通道适配器与出站网关》经验，为你挑选了1个好方法。 ... [详细]
程序员
尽管驱动程序/客户端与服务器版本完全相同,但Spark中的java.util.concurrent.RejectedExecutionException

如何解决《尽管驱动程序/客户端与服务器版本完全相同,但Spark中的java.util.concurrent.RejectedExecutionException》经验，为你挑选了0个好方法。 ... [详细]
程序员
使用过滤器的Android BLE设备扫描无效

如何解决《使用过滤器的AndroidBLE设备扫描无效》经验，为你挑选了1个好方法。 ... [详细]
程序员
回调到notifyDataSetChanged

如何解决《回调到notifyDataSetChanged》经验，为你挑选了0个好方法。 ... [详细]
程序员
python类属性为pandas数据帧

如何解决《python类属性为pandas数据帧》经验，为你挑选了1个好方法。 ... [详细]
程序员
即使BeanManager知道EJB,为什么还有WELD-001408

如何解决《即使BeanManager知道EJB,为什么还有WELD-001408》经验，为你挑选了0个好方法。 ... [详细]
程序员
np.vectorize给我IndexError：标量变量的无效索引

如何解决《np.vectorize给我IndexError：标量变量的无效索引》经验，为你挑选了1个好方法。 ... [详细]
程序员
如何使用php取消环境变量？

如何解决《如何使用php取消环境变量？》经验，为你挑选了1个好方法。 ... [详细]
程序员
Android:Circular Drawable

如何解决《Android:CircularDrawable》经验，为你挑选了0个好方法。 ... [详细]
程序员
如何将csv转换为json网络图文件,以便与sigma.js一起显示

如何解决《如何将csv转换为json网络图文件,以便与sigma.js一起显示》经验，为你挑选了0个好方法。 ... [详细]
程序员
Linq查询将一个表行连接到另一个表多行

如何解决《Linq查询将一个表行连接到另一个表多行》经验，为你挑选了1个好方法。 ... [详细]
程序员
ASP.NET 5:响应中的Access-Control-Allow-Origin

如何解决《ASP.NET5:响应中的Access-Control-Allow-Origin》经验，为你挑选了1个好方法。 ... [详细]
程序员
是否有一种简单的方法可以使Visual Studio 2015使用特定的ToolsVersion？

如何解决《是否有一种简单的方法可以使VisualStudio2015使用特定的ToolsVersion？》经验，为你挑选了1个好方法。 ... [详细]
程序员
保护PDF

如何解决《保护PDF》经验，为你挑选了0个好方法。 ... [详细]
程序员
属性不应返回数组

如何解决《属性不应返回数组》经验，为你挑选了1个好方法。 ... [详细]

135369一生真爱_890

这个屌丝很懒，什么也没留下！

关注作者

Tags | 热门标签

RankList | 热门文章