【高分，急！】linux下字符编码转换问题

文件是通过FTP上传上去的（vsftp），中文文件名，使用convmv -f GBK -t UTF-8 -r --notest 命令转化所有文件编码为UTF-8，OK！但是由UTF-8转换为GBK的时候出错了（使用命令：convmv -f UTF-8 -t GBK -r --notest）之转换回去部分文件，命令执行完毕报错：To prevent damage to your files, we won't continue.First fix this or correct options!
使用ftp登录，文件夹都是乱码
请问是什么问题啊？这些文件是非常重要的文件，急求解决办法！！谢谢！

其他回答

第1个回答 2012-04-09

互联网上越来越多的网页采用UTF-8编码，UTF-8用1到6个字节编码UNICODE字符，收录了超过10万个字符，BMP部分也有六万多个字符

而在进行编码转换时，我们往往需要转换为GBK编码进行后续处理，很多网页在转换后，会发现出现大量连续的问号:????????

这些恶心的问号是在编码转换阶段引入的，原因是：

GBK字符集只收录了两万多个字符，比UTF-8的字符数量少得多。

转化到GBK编码的时候，就会有编码落到GBK字符集以外，不能转化成GBK编码。这部分字符在转换之后的字符串中都变成了’?’

UTF-8：采用变长字节 (1 ASCII, 2 希腊字母和排版字符, 3 汉字等多字节东亚语言, 4 平面符号和特殊符号等)，

其中双字节字符中有一些没有在GBK字符集中，通常来说UTF-8无法识别的字符都是非常生僻的字符，几乎难以遇到，可不用考虑；但有一个字符非常特殊：C2A0

C2A0是UTF8里的排版用空格（区别于ASI =20的空格），这个特殊的字符（unicode序号为0xA0），不在GBK字符集中。却频繁用于xml/html等格式的文件中。大量UTF-编码的网页使用这个字符用作占位的空格。而且不同浏览器对它的处理方式不同：IE浏览器识别出该符号并以空格显示，firefox则替换为xml转义字符当网页中用C2A0进行文字排版时，我们对网页进行编码转换为GBK时就会出现很多"？"问号

第2个回答推荐于2017-09-18

先不要用ftp，直接登录后看一下文件是否完好，可以把LC_ALL切换到zh_CN.GBK或zh_CN.UTF-8分别试。如果文件是好的才有后话。

proftpd 是可以支持文件名内码转换的，vsftpd好象不行，建议用前者。本回答被提问者采纳

第3个回答 2012-04-09

为了防止损坏您的文件，将无法继续首先解决这个问题或不正确的选项。

第4个回答 2012-04-09

帮顶吧...这个有点难...但是我想问为啥GBK转UTF-8后又要转回来...追问

因为转换为UTF-8后在windows上看全是乱码
是ftp服务器

追答

samba服务器? 那你试试--nosmart
convmv -f UTF-8 -t GBK -r --notest --nosmart
强制转换...看出来的乱码不?

你可能感兴趣的内容

大家正在搜

linux设置字符编码 linux修改文件字符编码 linux修改系统的字符编码 linux查看文件的字符集编码 linux转换文件编码格式 linux 文件字符集转换命令 linux替换字符 linux修改字符噇字符集linux增加

非常风气网www.verywind.cn

【高分，急！】linux下字符编码转换问题

相关了解……

你可能感兴趣的内容