IT技术博客大学习 共学习 共进步

Oracle中如何用SQL检测字段是否包括中文字符

MKing's Blog 2011-08-26 22:36:44 浏览 2,943 次

      今天有一个同事的数据迁移程序有个问题,没有考虑中文编码字符,由于迁移的表有几千万数据,但是有中文的记录集很少,问我能否找出有中文内容的记录数。首先我想到的是采用检测每个字节ASCII的方式,这样的话需要写一个自定义函数,然后SQL中调用得到结果。但是感觉这个方法估计很耗时,毕竟每个字符都要比较,所以没有去实现。突然想到Oracle有一个编码转换的函数叫Convert,如果一个字符串编码转换前后不一样就表示字符串里面含有非ASCII字符,这样就得到结果。最后写出来测试了一下,确实可行,5500万记录10秒钟就扫描结束。以下是测试用例:

SQL> select *
  2    from (select 'abcd' c1 from dual
  3          union all
  4          select 'ab测试cd' c1 from dual)
  5   where c1 <> CONVERT(c1, 'US7ASCII', 'ZHS16GBK');
 
C1
--------
ab测试cd

CONVERT函数说明:

CONVERT(inputstring,dest_charset,source_charset)

inputstring:要转换的字符串

dest_charset:目标字符集

source_charset:原字符集

这只是一个小技巧,也许有一天你也有这样的需求,或许能派上用场。

建议继续学习

  1. 字符引用和空白字符 (阅读 4,624)
  2. 正则表达式傻瓜书 第二章:元字符 (阅读 4,105)
  3. sql 语句查换行隐形字符 (阅读 3,463)
  4. 前端开发中HTML与javascript的常用字符编码 (阅读 3,423)
  5. HTML特殊字符大全 (阅读 3,304)
  6. C#网络通信中中文字符的传送以及SQL数据库存取中文的解决方法 (阅读 3,205)
  7. 字符与字节 (阅读 3,042)
  8. java中文乱码解决之道(二)—–字符编码详解:基础知识 + ASCII + GB** (阅读 2,886)
  9. 字符与字节 (阅读 2,583)
  10. Oracle字符类型存数字及查询数字时使用单引号走不走索引的问题 (阅读 2,523)