如果我只是在win下工作,
如果我只使用中文工具可能不会出现这种问题
如果我只使用中文工具可能不会出现这种问题
乱码自从使用linux开始就成了一个大问题,下载个歌曲全是乱码
可悲的是看个成人动作片好不容易找到了一个有外挂字幕的版本,居然还是乱码
GBK(Guojia Biaozhun Kuozhan)从它的全名就可以看出来这是中国指定的一套标准,扩展自GB2312
而UTF-8是来自于UNICODE编码,它的一个特点是长度可变,从1字节到4字节不等,如果使用的是英文,那么就会是1个字节,如果使用中文就是3个字节,其他字符最长可以达到4个字节。
UTF-8的设计理念和UNICODE是一样的就是用一种编码表示全世界的所有字符。
UTF-8的设计理念和UNICODE是一样的就是用一种编码表示全世界的所有字符。
由于Microsoft从win95开始支持GBK,所以大量的中文软件采用了默认的GBK编码,然而除了windows系列产品,而Linux默认采用了UTF-8编码,由于两种编码的定义方式不同所以就造成了乱码。
UTF-8是UNICODE码,我觉得也是大势所趋,比如IronPython在内部都是采用的UNICODE编码,这样就比较容易解决乱码的问题。虽然说UTF-8在表示中文的时候比较大,占用了3个字节(而GBK占用了2个字节),但以后毕竟面对的是国际化的问题。
如果一个网站采用了UNICODE编码,那么一个采用了其他语言系统的用户(没有安装GBK)也可以正常浏览,总比看着一对乱码感觉要好
如果一个网站采用了UNICODE编码,那么一个采用了其他语言系统的用户(没有安装GBK)也可以正常浏览,总比看着一对乱码感觉要好
那么,我想知道,可不可以自动进行编码的判断?