2赞

在shell中做基本统计的最佳方法是什么？

作者：放ch养奶牛 | 2023-06-25 09:11

如何解决《在shell中做基本统计的最佳方法是什么？》经验，为你挑选了1个好方法。

现代Unix shell环境有很多好东西,我需要的东西几乎总是安装在我的机器上或者快速下载; 麻烦就是找到它.在这种情况下,我试图找到基本的统计操作.

例如,现在我正在为基于爬虫的应用程序进行原型设计.感谢wget加上其他一些好东西,我现在有几十万个文件.所以我可以用数十亿个文件估算这样做的成本,我想得到文件大小超过一定限度的平均值和中位数.例如:

% ls -l | perl -ne '@a=split(/\s+/); next if $a[4] <100; print $a[4], "\n"' > sizes
% median sizes
% mean sizes

当然,我可以用perl或awk编写自己的中位数和平均值.但是,不是已经有一些noob友好的包,除此之外还有更多吗？

1> Dirk Eddelbu..：

你能安装R吗？然后littler及其r命令可以帮助:

~/svn/littler/examples$ ls -l . | awk '!/^total/ {print $5}' 
87
1747
756
988
959
871
~/svn/littler/examples$ ls -l . | awk '!/^total/ {print $5}' | ./fsizes.r 
   Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
     87     785     915     901     981    1750 

  The decimal point is 3 digit(s) to the right of the |

  0 | 1
  0 | 89
  1 | 00
  1 | 7

~/svn/littler/examples$ cat fsizes.r 
#!/usr/bin/r -i

fsizes <- as.integer(readLines())
print(summary(fsizes))
stem(fsizes)

这是实施例我们以前曾使用过,因此,R函数summary()包含median()和mean()以及一个ASCII技术一样stem情节.对通话的概括median()或mean()当然非常简单.

推荐阅读

程序员
JsonMappingException:找不到合适的构造函数

如何解决《JsonMappingException:找不到合适的构造函数》经验，为你挑选了1个好方法。 ... [详细]
程序员
如何使用ES6语法导入jquery？

如何解决《如何使用ES6语法导入jquery？》经验，为你挑选了6个好方法。 ... [详细]
程序员
如何重定向到Angular2中的外部URL？

如何解决《如何重定向到Angular2中的外部URL？》经验，为你挑选了6个好方法。 ... [详细]
程序员
如何在Linux bash脚本中调用用户/组ID

如何解决《如何在Linuxbash脚本中调用用户/组ID》经验，为你挑选了1个好方法。 ... [详细]
程序员
如何在C＃中使用Windows搜索服务

如何解决《如何在C＃中使用Windows搜索服务》经验，为你挑选了1个好方法。 ... [详细]
程序员
在Spring中指定控制器异步方法的超时

如何解决《在Spring中指定控制器异步方法的超时》经验，为你挑选了1个好方法。 ... [详细]
程序员
Python 3.4中的"async for"

如何解决《Python3.4中的"asyncfor"》经验，为你挑选了1个好方法。 ... [详细]
程序员
Visual Studio 2015 Update 1打破了git存储库界面

如何解决《VisualStudio2015Update1打破了git存储库界面》经验，为你挑选了0个好方法。 ... [详细]
程序员
如何使用jquery从链接中选择href属性？

如何解决《如何使用jquery从链接中选择href属性？》经验，为你挑选了1个好方法。 ... [详细]
程序员
泊坞窗.npm install - >错误:getaddrinfo ENOTFOUND

如何解决《泊坞窗.npminstall->错误:getaddrinfoENOTFOUND》经验，为你挑选了0个好方法。 ... [详细]
程序员
解析程序:分段错误(核心转储)

如何解决《解析程序:分段错误(核心转储)》经验，为你挑选了0个好方法。 ... [详细]
程序员
为什么不是每个循环的JavaScript？

如何解决《为什么不是每个循环的JavaScript？》经验，为你挑选了1个好方法。 ... [详细]
程序员
ffmpeg:多个filter_complex的链,重用中间输出流

如何解决《ffmpeg:多个filter_complex的链,重用中间输出流》经验，为你挑选了1个好方法。 ... [详细]
程序员
更新列值为空的表中所有行的列值？

如何解决《更新列值为空的表中所有行的列值？》经验，为你挑选了1个好方法。 ... [详细]
程序员
如何执行lappend $ varname1 $ varname2

如何解决《如何执行lappend$varname1$varname2》经验，为你挑选了1个好方法。 ... [详细]
程序员
这个表达式有效吗？

如何解决《这个表达式有效吗？》经验，为你挑选了1个好方法。 ... [详细]
程序员
声明具有完整定义的子类

如何解决《声明具有完整定义的子类》经验，为你挑选了1个好方法。 ... [详细]
程序员
Pandas:合并多个数据帧和控制列名？

如何解决《Pandas:合并多个数据帧和控制列名？》经验，为你挑选了1个好方法。 ... [详细]
程序员
自定义视图,使用不同的子视图对角分割布局

如何解决《自定义视图,使用不同的子视图对角分割布局》经验，为你挑选了2个好方法。 ... [详细]
程序员
泡菜蟒蛇烤宽面条模型

如何解决《泡菜蟒蛇烤宽面条模型》经验，为你挑选了1个好方法。 ... [详细]

放ch养奶牛

这个屌丝很懒，什么也没留下！

关注作者

Tags | 热门标签

RankList | 热门文章