对大型数据集进行单元测试的最佳方法是什么?我维护的一些遗留代码具有一百个或更多成员的结构; 我们正在处理的代码的其他部分创建或分析数百个样本的数据集.
到目前为止,我发现的最佳方法是从磁盘序列化结构或数据集,执行测试中的操作,将结果序列化到磁盘,然后将包含序列化结果的文件与包含预期结果的文件区分开来.这不是非常快,它违反了"不接触磁盘"的单元测试原则.但是,我能想到的唯一选择(编写代码来初始化和测试数百个成员和数据点)似乎无比乏味.
还有更好的解决方案吗?