词频统计(awk)

写一个 bash 脚本以统计一个文本文件 words.txt 中每个单词出现的频率。

为了简单起见，你可以假设：

你也可以假设每行前后没有多余的空格字符。

示例：

假设words.txt有如下内容：

the day is sunny the the
the sunny is is

你的脚本应该输出（以词频降序排列）:

the 4
is 3
sunny 2
day 1

说明：

cat words.txt | awk '{ for(i=1;i<=NF;i++){count[$i]++} } END { for(k in count){print k" "count[k]} }' | sort -rnk 2

有关awk命令的基础知识请参考上一篇博文。

本题先用cat命令和管道命令|将文件内容传给awk。

在awk中我们用一个字典(?)count储存每个单词的词频，先遍历每一行(awk自身机制)的每一个字段(i<=NF)，然后用该字段本身作为key,将其value++；最后用一个for循环输出count数组中的每个元素的key(词)及其value(词频)。

最后用|管道命令传给sort命令：