IT技术博客大学习 共学习 共进步

PHP类型转换相关的一个Bug

风雪之隅 2010-06-02 23:09:14 浏览 2,703 次

PHP为了避免数字索引和数字字符串索引(注1)的混乱, 引入了zend_symtable_*系列函数, 并应用于数组中.

这样一来, 数字字符串索引也就会被当作数字索引, 然而总是有一些情况, 是PHP的维护者没有想到的…

比如, 类型转换时刻:

鉴于很多朋友好心的提示, 使用json_deocde的第二个参数就可以直接得到数组.我说明下, 如下的代码是我有意而为之, 并不是为了json_decode, 而是为了构造一个"有问题"的数组

在PHP5.2.*下(json version 1.2.1):

 $data = array(    123 => 'laruence',); $value = json_encode($data);$obj = json_decode($value);$arr = (array)$obj;var_dump($arr);

此时, 问题就出现了, 上面得到的输出是:

array(1) {  ["123"]=>  string(8) "laruence" 

现在,你郁闷吧, 因为数组键是字符串, 而通过正常渠道访问的时候, PHP都会自动把数字字符串转换成数字, 所以:

print_r($arr[123]);//PHP Notice: Undefined offset: 123 in ***print_r($arr["123"]);//PHP Notice: Undefined offset: 123 in ***var_dump(array_key_exists("123", $arr));//bool(false)

我已经报了Bug, 不过PHP本身也不保证类型转换的一致性, 所以PHP维护者最后认为是不是Bug都无所谓了, 大家平时注意即可:http://bugs.php.net/bug.php?id=51915

注1

本文中所说的字符串数字和之前的文章PHP字符串比较中所说的numeric string有一点不同, 在zend_symtable_*系列函数中, 只会吧/^-?[^0][0-9]*$/这样的字符串认为是数字字符串. 相关核心逻辑如下:

#define HANDLE_NUMERIC(key, length, func) {    register char *tmp=key;    if (*tmp=='-') {        tmp++;    }    if ((*tmp>='0' && *tmp<='9')) do {        char *end=key+length-1;        long idx;        if (*tmp++=='0' && length>2) {            break;        }        while (tmp<end) {            if (!(*tmp>='0' && *tmp<='9')) {                break;            }            tmp++;        }        if (tmp==end && *tmp=='0') {            if (*key=='-') {                idx = strtol(key, NULL, 10);                if (idx!=LONG_MIN) {                    return func;                }            } else {                idx = strtol(key, NULL, 10);                if (idx!=LONG_MAX) {                    return func;                }            }        }    } while (0);}

PS:我这里只有5.2.8, 5.2.11俩个版本, 各位读者如果有其他版本的PHP, 帮忙测试下是否在你的版本下也存在这个问题. 谢谢

另: 谢谢远豪提供这个问题, 原问题是和Memcached相关的.

建议继续学习

  1. STRUTS2类型转换错误导致OGNL表达式注入漏洞分析 (阅读 10,163)
  2. PHP数据类型隐性转换的陷阱 (阅读 3,942)
  3. 编写安全代码:再论整数类型转换 (阅读 3,881)
  4. javascript运算/转换技巧 (阅读 3,403)
  5. JavaScript ( (__ = !$ + $)[+$] + ({} + $)[_/_] +({} + $)[_/_] ) (阅读 3,362)
  6. 弱类型?C语言参数提升带来的一个陷阱 (阅读 3,084)
  7. 当类型转换表达式遇上自定义转换操作 (阅读 2,462)