今天在做一个系统GBK转UTF8的编码转换,竟然发现这个系统的sql文件里的汉字都被处理成了16进制编码了。
而GBK,和UTF8的16进制编码不一致,导致根本无法在utf8下正常导入数据库。
现我肖飞为大家倾情奉献,解决办法如下:
一、在utf8的mysql下
得到中文‘游客’的gbk下的16进制编码
mysql> SELECT hex(CONVERT( '游客' USING gbk ));
-> D3CEBFCD
反推gbk的16进制编码,取回中文
mysql> SELECT CONVERT( unhex('d3cebfcd') USING gbk);
-> ’游客'
从gbk的16进制编码直接转成utf8的16进制编码
mysql> SELECT HEX(CONVERT(CONVERT( unhex('d3cebfcd') USING gbk) USING utf8));
-> 'E6B8B8E5AEA2'
二、如果在gbk的mysql环境下
得到中文‘游客’的gbk下的16进制编码
mysql> SELECT hex('游客');
-> D3CEBFCD
反推gbk的16进制编码,取回中文
mysql> unhex('d3cebfcd') ;
-> ’游客'
原理知道了,就可以写个小程序来替换进行转编码了。不过特别提醒在文本里16进制必须在头部加上0x,例如:0xD3CEBFCD才能正常使用。
mysql汉字16进制编码转换方法
建议继续学习
- 字符编码和中文乱码小叙 (阅读 6,984)
- 中文编码杂谈 (阅读 6,185)
- Hadoop的map/reduce作业输入非UTF-8编码数据的处理原理 (阅读 5,546)
- PHP编码规范 (阅读 5,504)
- Linux screen窗口中文乱码问题 (阅读 5,286)
- Unicode与字符汉字相互转换 (阅读 5,125)
- UTF-8编码中BOM的检测与删除 (阅读 5,107)
- base64_encode 和 urlencode (阅读 5,064)
- python-django的中文编码总结 (阅读 4,945)
- JAVASCRIPT完美实现UTF8页面提交数据到GB2312 (阅读 4,783)