有没有办法使用标准的linux工具链做下面的事情?
假设example.com/index.php的源代码是:
Hello, & world! "
我怎么能做这样的事情…
curl -s http://example.com/index.php | htmlentities
…这将打印以下内容:
Hello, & world! "
只使用标准的Linux工具链?
使用recode
。
$ echo 'Hello, & world! "' | recode HTML_4.0 Hello, & world! "
编辑 :顺便说一下, recode
提供了对应于不同版本的HTML和XML的几个不同的转换,所以你可以使用例如HTML_3.2
而不是HTML_4.0
如果你有一个非常古老的HTML文档。 运行recode -l
将列出程序支持的所有字符集的完整列表。
alias decode="php -r 'echo html_entity_decode(fgets( STDIN ));'" $ echo 'Hello, & world! "' | decode Hello, & world! "