字符编码,UTF或ANSI?

我在Ubuntu中使用Eclipse来编辑PHP文件。

但不幸的是,这些PHP文件中的一些是在Windows XP的Notepad ++中创build的,并且定义了ANSI编码。

而且,这些文件会生成charset = ISO-8859-1的HTML代码。

当我将Eclipseconfiguration为ISO-8859-1时,许多特殊字符丢失并更改为“???”,当我尝试使用ISO enconding保存文件时,Eclipse显示的错误不可能保存该文件,因为一些字符与字符集不兼容。

如何在不更改编码的情况下保存这些文件,或者如何更改编码而不丢失字符。

Solutions Collecting From Web of "字符编码,UTF或ANSI?"

至此,您需要使用ANSI编码读取这些文件,然后使用ISO-8859-1编码编写这些文件。 在Notepad ++中,您可以通过“ 格式”菜单选项更改编码。 不幸的是,没有ISO-8859-1选项,但UTF-8应该足够了,现在也是世界统治的首选,因为ISO-8859-1编码只包含拉丁字符,例如西里尔文,希腊文,中文,阿拉伯文,等等。

通过“ANSI”你的意思是“Windows代码页1252”?

在这两种情况下,一旦你找出源编码,你可以使用iconv从该编码转换为UTF-8。

最新版本可以在不丢失信息的情况下在ISO-8859-1和UTF-8之间进行转换。 版本5.6.8是能够这样做的。