统计(发生频率%ecc ..)分析一个txt

我无法弄清楚我应该使用什么方法来查明:

  • 发生的频率
  • 出现在文件中的值

例如我的文件是:

xxxxx, yyyy , 79 xxxxx, yyyy , 80 xxxxx, yyyy , 79 xxxxx, yyyy , 81 xxxxx, yyyy , 80 

我想知道79有80%的出现率是40%,81有20%。 我怎样才能做到这一点? (如果有可能,没有R)

我需要这些,因为我想使用gnuplot绘制直方图。 你也可以告诉我如何使用刚刚计算的值绘制一个直方图?

排序和uniq的一些组合可能会伎俩。 你可以开始

 cat file | cut -d ',' -f 3 | sort | uniq --count > file.1 

在gnuplot中绘制,做

 gnuplot plot [78:82][0:3] "file.1" using 2:1 with boxes 

左括号[78:82]设置xrange,另一个是yrange。 这可以自动确定,但是在这个演示案例中,对文件进行简短的确定最小值/最大值的效果很好。

根据您的操作系统和配置,这可能就足够了。 您可能还需要使用set terminalset output 。 (开始gnuplot和说帮助,有一个在程序中的帮助)