我有一个很大的文件,这行文字看起来像这样的文本数字等等。[Man-(some numers)]是很多这个Man-somenumbers在几行重复,我想只计算唯一的芒-words。 我不能使用独特的文件,因为文字之前的文字总是不同的每一行。 我怎样才能计算文件中唯一的人类somenumbers字?
如果我明白你想做的正确的话
grep -oE 'Man-[0-9]+' filename | sort | uniq -c
应该做的伎俩。 它的工作原理如下:第一
grep -oE 'Man-[0-9]+' filename
从文件中分离与Man-[0-9]+
正则表达式匹配的所有单词。 然后,该列表通过sort
来获取uniq
所需的排序列表,然后通过uniq -c
输入排序后的列表来计算每个独特Man-
出现的频率。