我的程序使用了很多filter,all并且列出了理解,我相信它们是并行化的最佳选择(通过多线程或GPU编程)。
filter
all
那么并行化这些功能的最简单方法是什么?我正在寻找一种相当容易实现的方法(即,不必是最有效的方法或不需要达到最高水平的并行性),以便在潜入更复杂的方法(如PyCUDA等)之前获得潜在的加速效果。