我无法弄清楚我应该使用什么方法来查明:
例如我的文件是:
xxxxx, yyyy , 79 xxxxx, yyyy , 80 xxxxx, yyyy , 79 xxxxx, yyyy , 81 xxxxx, yyyy , 80
我想知道79有80%的出现率是40%,81有20%。 我怎样才能做到这一点? (如果有可能,没有R)
我需要这些,因为我想使用gnuplot绘制直方图。 你也可以告诉我如何使用刚刚计算的值绘制一个直方图?
排序和uniq的一些组合可能会伎俩。 你可以开始
cat file | cut -d ',' -f 3 | sort | uniq --count > file.1
在gnuplot中绘制,做
gnuplot plot [78:82][0:3] "file.1" using 2:1 with boxes
左括号[78:82]
设置xrange,另一个是yrange。 这可以自动确定,但是在这个演示案例中,对文件进行简短的确定最小值/最大值的效果很好。
根据您的操作系统和配置,这可能就足够了。 您可能还需要使用set terminal
并set output
。 (开始gnuplot和说帮助,有一个在程序中的帮助)