Articles of 字符编码

FreeTDS:如何设置运行存储过程的参数字符集

我有一个C程序通过FreeTDS连接到MSSQL数据库。 我试图执行一个存储过程与varchar参数设置为“SaídaLiberada”,但它存储与奇怪的字符在MS SQL,如上面的截图: 这是我的freetds.conf: # $Id: freetds.conf,v 1.12 2007/12/25 06:02:36 jklowden Exp $ # # This file is installed by FreeTDS if no file by the same # name is found in the installation directory. # # For information about the layout of this file and its settings, # see the freetds.conf manpage "man freetds.conf". […]

Sendmail / procmail – 获取邮件发件人和邮件主题,utf8编码问题

我的.procmailrc(真的很简单): :0c | $HOME/send_sms.sh "`formail -xFrom:`" "`formail -xSubject:`" 因此,名为“mail@domain.com”的发件人发送邮件的主题是“Subject testąść”。 脚本“send_sms.sh”收到: 发件人:=? =?UTF-8?Q?mail@domain.com?= <mail@domain.com> Subject: =?UTF-8?Q?Subject_test_=C4=85=C5=9B=C4=87?= 我应该如何修改我的.procmailrc以获得明文? 或者在我的脚本send_sms.sh中转换这个?

写入文件时的UnicodeEncodeError

我有一个python脚本,在我的本地机器(OS X)上效果很好,但是当我将它复制到服务器(Debian)时,它不能按预期工作。 该脚本读取一个xml文件并以新格式打印内容。 在我的本地机器上,我可以使用stdout将脚本运行到terminal或文件(即> myFile.txt ),两者都可以正常工作。 然而,在服务器上( ssh ),当我打印到terminal一切正常,但打印到文件(这是我真正需要)给UnicodeEncodeError: UnicodeEncodeError: 'ascii' codec can't encode characters in position 0-3: ordinal not in range(128) 。 所有的文件都是utf-8编码,并且在魔术评论中声明了utf-8。 如果我在列表中打印str对象(这是我通常用来获取编码问题的一个技巧),它也会引发同样的错误。 如果使用print( x.encode('utf-8') ) ,那么它会打印代码样式的位(例如b'1' b'\xd0\x9a\xd0\xb0\xd0\xbc\xd0\xb0' ) 。 如果我在shell中$ export PYTHONIOENCODING=utf-8 (如某些SOpost中所build议的),那么我得到一个二进制文件: 1 <D0><9A><D0><B0><D0><BC><D0><B0> 。 我已经检查了所有的localevariables,并且相关的variables与我在本地机器上的variables相匹配。 我可以简单地在本地处理文件并上传,但我真的很想了解这里发生的事情。 由于Python代码在一台计算机上工作,我不确定它是相关的,但我在下面添加它: # -*- encoding: utf-8 -*- import sys, xml.etree.ElementTree as ET corpus = ET.parse('file.xml') […]

Hibernate + MySQL:如何设置数据库和表的编码utf-8

我的系统运行在Linux Mandriva ,RDBMS – MySQL 5上 。 我需要以UTF-8创build数据库和表格。 这里是hibernate.cfg.xml的一个片段 – … <property name="hibernate.hbm2ddl.auto">create-drop</property> <property name="hibernate.dialect">org.hibernate.dialect.MySQLDialect</property> <property name="hibernate.connection.characterEncoding">utf8</property> … my.cnf – # The MySQL server [mysqld] … default-character-set=cp1251 character-set-server=cp1251 collation-server=cp1251_general_ci init-connect="SET NAMES cp1251" skip-character-set-client-handshake … [mysqldump] … default-character-set=cp1251 … 例如,一些课程 – @Entity @Table(name = "USER") public class User { @Id @Column(name = "USERID") @GeneratedValue(strategy = GenerationType.AUTO) […]

编码cp-1252为utf-8?

我正在尝试编写一个将在Linux服务器上运行的Java应用程序,但是它将使用cp-1252作为字符集来处理旧版Windows计算机上生成的文件。 反正有编码这些文件为utf-8而不是它生成的cp-1252?

GCC 4.7源字符编码和执行字符编码string文字?

Linux / x86_64上的GCC 4.7是否具有默认字符编码,通过该编码validation并解码C源文件中string文字的内容? 这是可configuration的吗? 而且,当将string数据从string文字链接到输出的数据部分时,它是否具有默认的执行字符编码? 这是可configuration的吗? 在任何configuration中,都可能有一个与执行字符编码不同的源字符编码? (gcc会在字符编码之间进行转码吗?)

有没有办法从UTF8转换为ISO-8859-1?

我的软件得到了一些UTF8string比我需要转换为ISO 8859 1.我知道UTF8域大于iso 8859.但UTF8中的数据已经从ISO上转换,所以我不应该错过任何东西。 我想知道是否有一个简单的/直接的方式从UTF8转换为iso-8859-1。 谢谢

将string从Windows charset转换为Java中的UTF 8

所以我必须给我的Java应用程序从一个.bat文件调用一些参数。 这样做使参数具有系统的字符集编码,这使得一些字符显示错误。 我试过这个 String titulo; titulo = new String (args[1].getBytes(),"Cp1252"); 还尝试了这个清单http://docs.oracle.com/javase/1.4.2/docs/guide/intl/encoding.doc.html中的其他人,他们都没有成功。 我怎么能从Windows charset编码一个string到Java的UTF 8? 提前感谢! 问候,罗德里戈。 编辑:我在.bat中给出的论点是马丁和输出(这是一个JLabel显示)显示此MartÝn。

如何使cmd正确显示阿拉伯文脚本?

我正在运行Windows 7,并使用一个python脚本输出一些string在阿拉伯语Windows cmd。 这是我得到的: 我如何configurationcmd正确显示阿拉伯string?

批文件string字符拆分

我想写一个batch file来存储一个文件名字符到一个variables。 例如,如果我的文件名是helloworld或how_are_you? ,我想把第四个字符从右边存入variablesx (在上面的例子中是o和_ )。 文件名在我的情况下没有空格。