昨天,因为项目需要对文字进行简繁互转,网上基本上是内码互转,即GB2312编码和BIG5编码之间的互转,我始终是UTF-8编码。关于UTF-8内的简繁互转,只有1篇,但被可耻的转了N次,占据了几页搜索页。我随便试了下,发现可以,等正式放到项目中才发现,只有一部分是正常的,只好自己想办法了。突然想到PHP的iconv函数,这是一个内码转换的函数,表面上看好像和我的需求不符,其实不然,我们可以通过曲线救国的方式来实现。先将UTF-8(简体字)转为GB2312编码,再将GB2312编码转为BIG5编码,然后再将BIG5转为UTF-8,这样比正常直接转多了2步,应该会有不少性能损失,具体损失多少,还没测试。到目前为止,还没有发现有不能转的字。下面放出代码:
- class ChineseTransfer{
- public staticfunctionbig5_gb2312($in){
- $in = iconv('UTF-8', 'BIG5', $in);
- $in = iconv('BIG5', 'GB2312', $in);
- $out = iconv('GB2312', 'UTF-8', $in);
- return $out;
- }
- public staticfunctiongb2312_big5($in){
- $in = iconv('UTF-8', 'GB2312', $in);
- $in = iconv('GB2312', 'BIG5', $in);
- $out = iconv('BIG5', 'UTF-8', $in);
- return $out;
- }
- }