使用标准的linux工具链查找/replacehtmlentities?

有没有办法使用标准的linux工具链做下面的事情?

假设example.com/index.php的源代码是:

Hello, & world! " 

我怎么能做这样的事情…

 curl -s http://example.com/index.php | htmlentities 

…这将打印以下内容:

 Hello, & world! " 

只使用标准的Linux工具链?

使用recode

 $ echo 'Hello, & world! "' | recode HTML_4.0 Hello, & world! " 

编辑 :顺便说一下, recode提供了对应于不同版本的HTML和XML的几个不同的转换,所以你可以使用例如HTML_3.2而不是HTML_4.0如果你有一个非常古老的HTML文档。 运行recode -l将列出程序支持的所有字符集的完整列表。

 alias decode="php -r 'echo html_entity_decode(fgets( STDIN ));'" $ echo 'Hello, & world! "' | decode Hello, & world! "