IT技术博客大学习 共学习 共进步

mysql汉字16进制编码转换方法

BIWEB开源PHP WMS系统创始人ArthurXF肖飞的blog 2011-01-16 22:39:38 累计浏览 4,244 次
今天在做一个系统GBK转UTF8的编码转换,竟然发现这个系统的sql文件里的汉字都被处理成了16进制编码了。
而GBK,和UTF8的16进制编码不一致,导致根本无法在utf8下正常导入数据库。

现我肖飞为大家倾情奉献,解决办法如下:
一、在utf8的mysql下
得到中文‘游客’的gbk下的16进制编码
mysql> SELECT hex(CONVERT( '游客' USING gbk ));
      -> D3CEBFCD

反推gbk的16进制编码,取回中文
mysql> SELECT CONVERT( unhex('d3cebfcd') USING gbk);
      -> ’游客'

从gbk的16进制编码直接转成utf8的16进制编码
mysql> SELECT HEX(CONVERT(CONVERT( unhex('d3cebfcd') USING gbk) USING utf8));
      -> 'E6B8B8E5AEA2'

二、如果在gbk的mysql环境下
得到中文‘游客’的gbk下的16进制编码
mysql> SELECT hex('游客');
      -> D3CEBFCD

反推gbk的16进制编码,取回中文
mysql> unhex('d3cebfcd') ;
      -> ’游客'

原理知道了,就可以写个小程序来替换进行转编码了。不过特别提醒在文本里16进制必须在头部加上0x,例如:0xD3CEBFCD才能正常使用。

建议继续学习

  1. 字符编码和中文乱码小叙 (累计阅读 6,984)
  2. 中文编码杂谈 (累计阅读 6,186)
  3. Hadoop的map/reduce作业输入非UTF-8编码数据的处理原理 (累计阅读 5,547)
  4. PHP编码规范 (累计阅读 5,504)
  5. Linux screen窗口中文乱码问题 (累计阅读 5,287)
  6. Unicode与字符汉字相互转换 (累计阅读 5,126)
  7. UTF-8编码中BOM的检测与删除 (累计阅读 5,107)
  8. base64_encode 和 urlencode (累计阅读 5,064)
  9. python-django的中文编码总结 (累计阅读 4,946)
  10. JAVASCRIPT完美实现UTF8页面提交数据到GB2312 (累计阅读 4,783)