通常我正在使用grep -r --color word /path/dir
search,但是这对于二进制文件不起作用。 所以我想写一个类似Perl的脚本。 因此,我正在search一个可以在Linux机器上读取doc-files的模块(可能类似于Spreadsheet :: ParseExcel for ms-word-documents)。
有很多文字转换器(如antidoc,wv,catdoc,unoconv …)。 你可以grep通过他们的输出。 这也是msysgit为编录doc文件所做的。
不要试图听起来那么尖锐,这是使用封闭源代码专有文档的危险。 您可能会被开发人员提供的工具卡住。
对于您的实际问题,您可以执行以下几项操作: