php内核探索之zend_execute的具体执行过程

博学无忧 2015-01-14 13:55:55 累计浏览 3,075 次

本机暂存

内容概览

这篇文章从底层源码出发，剖析了PHP脚本引擎执行PHP代码的核心路径。它聚焦于引擎初始化的默认执行函数`execute`，并对其完整执行流程进行了逐行解读。

核心实现思路清晰展现：`zend_execute`本质上是个函数指针，指向`execute`函数。该函数首先为`zend_execute_data`分配并初始化执行上下文，包括CV变量表、临时变量空间以及保存当前执行状态，这类似于进程调度时的上下文保存。随后，进入一个无限循环，通过调用当前op指令的handler来驱动每一步操作，并根据handler的返回值（如跳转、函数调用）来控制流程。

文章的巧妙之处在于揭示了PHP虚拟机动态分派的关键机制。它详细解释了传入的`zend_op_array`结构体，特别是其`type`字段如何区分全局代码、用户函数和eval代码，明确了这些不同的代码块在执行层面本质上都是同一种操作数数组。最终，所有复杂的PHP逻辑都归结为对opcodes数组中每条指令handler的循环调用。

整篇文章用代码级的追踪，清晰展示了从`zend_execute`入口到单个操作码handler被调用的完整链路，是理解PHP运行时底层运作的扎实资料。

解释器引擎最终执行op的函数是zend_execute，实际上zend_execute是一个函数指针，在引擎初始化的时候zend_execute默认指向了execute,这个execute定义在{PHPSRC}/Zend/zend_vm_execute.h：

ZEND_API void execute(zend_op_array *op_array TSRMLS_DC)  
{  
    zend_execute_data *execute_data;  
    zend_bool nested = 0;  
    zend_bool original_in_execution = EG(in_execution);  
   
   
    if (EG(exception)) {  
        return;  
    }  
   
    EG(in_execution) = 1;  
   
zend_vm_enter:  
    /* Initialize execute_data */ 
    execute_data = (zend_execute_data *)zend_vm_stack_alloc(  
        ZEND_MM_ALIGNED_SIZE(sizeof(zend_execute_data)) +  
        ZEND_MM_ALIGNED_SIZE(sizeof(zval**) * op_array->last_var * (EG(active_symbol_table) ? 1 : 2)) +  
        ZEND_MM_ALIGNED_SIZE(sizeof(temp_variable)) * op_array->T TSRMLS_CC);  
   
    EX(CVs) = (zval***)((char*)execute_data + ZEND_MM_ALIGNED_SIZE(sizeof(zend_execute_data)));  
    memset(EX(CVs), 0, sizeof(zval**) * op_array->last_var);  
    EX(Ts) = (temp_variable *)(((char*)EX(CVs)) + ZEND_MM_ALIGNED_SIZE(sizeof(zval**) * op_array->last_var * (EG(active_symbol_table) ? 1 : 2)));  
    EX(fbc) = NULL;  
    EX(called_scope) = NULL;  
    EX(object) = NULL;  
    EX(old_error_reporting) = NULL;  
    EX(op_array) = op_array;  
    EX(symbol_table) = EG(active_symbol_table);  
    EX(prev_execute_data) = EG(current_execute_data);  
    EG(current_execute_data) = execute_data;  
    EX(nested) = nested;  
    nested = 1;  
   
    if (op_array->start_op) {  
        ZEND_VM_SET_OPCODE(op_array->start_op);  
    } else {  
        ZEND_VM_SET_OPCODE(op_array->opcodes);  
    }  
   
    if (op_array->this_var != -1 && EG(This)) {  
        Z_ADDREF_P(EG(This)); /* For $this pointer */ 
        if (!EG(active_symbol_table)) {  
            EX(CVs)[op_array->this_var] = (zval**)EX(CVs) + (op_array->last_var + op_array->this_var);  
            *EX(CVs)[op_array->this_var] = EG(This);  
        } else {  
            if (zend_hash_add(EG(active_symbol_table), "this", sizeof("this"), &EG(This), sizeof(zval *), (void**)&EX(CVs)[op_array->this_var])==FAILURE) {  
                Z_DELREF_P(EG(This));  
            }  
        }  
    }  
   
    EG(opline_ptr) = &EX(opline);  
   
    EX(function_state).function = (zend_function *) op_array;  
    EX(function_state).arguments = NULL;  
       
    while (1) {  
        int ret;  
#ifdef ZEND_WIN32  
        if (EG(timed_out)) {  
            zend_timeout(0);  
        }  
#endif  
   
        if ((ret = EX(opline)->handler(execute_data TSRMLS_CC)) > 0) {  
            switch (ret) {  
                case 1:  
                    EG(in_execution) = original_in_execution;  
                    return;  
                case 2:  
                    op_array = EG(active_op_array);  
                    goto zend_vm_enter;  
                case 3:  
                    execute_data = EG(current_execute_data);  
                default:  
                    break;  
            }  
        }  
   
    }  
    zend_error_noreturn(E_ERROR, "Arrived at end of main loop which shouldn't happen");  
}

zend_op_array简介

此类型的定义在{PHPSRC}/Zend/zend_compile.h:

struct _zend_op_array {  
    /* Common elements */ 
    zend_uchar type;  
    char *function_name;          
    zend_class_entry *scope;  
    zend_uint fn_flags;  
    union _zend_function *prototype;  
    zend_uint num_args;  
    zend_uint required_num_args;  
    zend_arg_info *arg_info;  
    zend_bool pass_rest_by_reference;  
    unsigned char return_reference;  
    /* END of common elements */ 
   
    zend_bool done_pass_two;  
   
    zend_uint *refcount;  
   
    zend_op *opcodes;  
    zend_uint last, size;  
   
    zend_compiled_variable *vars;  
    int last_var, size_var;  
   
    zend_uint T;  
   
    zend_brk_cont_element *brk_cont_array;  
    int last_brk_cont;  
    int current_brk_cont;  
   
    zend_try_catch_element *try_catch_array;  
    int last_try_catch;  
   
    /* static variables support */ 
    HashTable *static_variables;  
   
    zend_op *start_op;  
    int backpatch_count;  
   
    zend_uint this_var;  
   
    char *filename;  
    zend_uint line_start;  
    zend_uint line_end;  
    char *doc_comment;  
    zend_uint doc_comment_len;  
    zend_uint early_binding; /* the linked list of delayed declarations */ 
   
    void *reserved[ZEND_MAX_RESERVED_RESOURCES];  
};  
   
typedef struct _zend_op_array zend_op_array;

此结构比较复杂，我们目前只介绍最基本的几个字段。

1.type：

op_array的类型，首先需要说明的是，一段PHP代码被编译之后，虽然返回的是一个zend_op_array指针，但是实际上生成的zend_op_array结构可能不止一个，通过这个结构中的一些字段,例如function_name ,num_args等你也许会发现这个zend_op_array结构似乎能和函数产生一定的联系，确实如此，用户自定义的函数，以及用户定义的类的方法，都是一个zend_op_array结构，这些zend_op_array结构在编译过程中被保存在某些地方，例如用户自定义的函数被保存进了GLOBAL_FUNCTION_TABLE,这个是全局函数符号表，通过函数名可以在此表中检索到函数体。那么编译后返回的那个zend_op_array指针是什么呢，其实编译后返回的zend_op_array是执行的一个入口,也可以认为它是最外层，即不在任何函数体内的全局代码组成的op_array。然而全局代码，用户自定义函数，用户自定义的方法都拥有相同的type值：2 。type可取值的宏定义为:

#define ZEND_INTERNAL_FUNCTION              1  
#define ZEND_USER_FUNCTION                  2  
#define ZEND_OVERLOADED_FUNCTION            3  
#define ZEND_EVAL_CODE                      4  
#define ZEND_OVERLOADED_FUNCTION_TEMPORARY  5

可以看到全局代码，用户函数，用户方法都对应的是ZEND_USER_FUNCTION,这个也是最常见的type了，其中ZEND_EVAL_CODE对应的是eval函数中的PHP代码，所以我们可以想到，eval函数参数中的PHP代码也会被编译成单独的zend_op_array。

2.function_name

如果op_array是由用户定义的函数或则方法编译而生成，那么此字段对应函数的名字，如果是全局代码或则是eval部分的代码，那么此字段为控制。

3.opcodes

这个字段类型为zend_op *,因此这是一个zend_op的数组，这个数组保存的就是此编译过程中生成的op,如果不了解zend_op，可以看看之前的文章 OPcode简介 , 这个字段是最重要的部分了，zend_execute最终就是执行这里保存的op。

现在基本对参数op_array有了一定的了解，那么我们就开始进入到execute中。

执行过程详解

execute函数开始的时候是一些基础变量的申明，其中zend_execute_data *execute_data;是执行期的数据结构，此变量在进行一定的初始化之后将会被传递给每个op的handler函数作为参数，op在执行过程中随时有可能改变execute_data中的内容。

第14行zend_vm_enter 这个跳转标签是作为虚拟机执行的入口，当op中涉及到函数调用的时候，就有可能会跳转到这里来执行函数体。

第16行到第19行为execute_data分配空间

第21行到第32行主要是对execute_data进行一些初始化，以及保存现场工作，要保存现场是因为在进入函数调用的时候，需要保存当前一些运行期间的数据，在函数调用结束之后再进行还原，可以想象为操作系统中进程调度，当进程在调出的时候需要保存寄存器等上下文环境，而当进程被调入的时候再取出来继续执行。

第41行到第51行主要是在当前动态符号表中加入$this变量，这个是在调用对象的方法时才有必要进行。

第58行开始的while无限循环就是开始执行op_array中的opcodes了，在第66行中调用当前执行的op的handler:

EX(opline)->handler(execute_data&nbsp;TSRMLS_CC))

然后如果handler的返回值小于0则循环继续，如果大于0则进入一个switch结构：

当返回值为1时：execute函数将返回，执行也就结束了。

当返回值为2时：op_array被重新设置，并跳转到zend_vm_enter ，这个一般是函数调用或则执行eval函数中的代码，将在新的上下文执行相关函数的op_array

当返回值为3时：循环体继续继续执行，当然再继续执行之前，EX(opline)已经往后移了一位(可能多位)，也就是已经指向了后面一个新的opline,于是继续执行新的opline

当返回其他值时：结束循环，报错，结束应该用return,也就是返回1

在op的handler中返回特定的值都被定义成了宏,例如{PHPSRC}/Zend/zend_execute.c中定义的：

然后如果handler的返回值小于0则循环继续，如果大于0则进入一个switch结构：

当返回值为1时：execute函数将返回，执行也就结束了。

当返回值为2时：op_array被重新设置，并跳转到zend_vm_enter ，这个一般是函数调用或则执行eval函数中的代码，将在新的上下文执行相关函数的op_array

当返回其他值时：结束循环，报错，结束应该用return,也就是返回1

在op的handler中返回特定的值都被定义成了宏,例如{PHPSRC}/Zend/zend_execute.c中定义的：

#define ZEND_VM_NEXT_OPCODE() /  
    CHECK_SYMBOL_TABLES() /  
    EX(opline)++; /  
    ZEND_VM_CONTINUE()  
   
#define ZEND_VM_SET_OPCODE(new_op) /  
    CHECK_SYMBOL_TABLES() /  
    EX(opline) = new_op  
   
#define ZEND_VM_JMP(new_op) /  
    CHECK_SYMBOL_TABLES() /  
    if (EXPECTED(!EG(exception))) { /  
        EX(opline) = new_op; /  
    } /  
    ZEND_VM_CONTINUE()  
   
#define ZEND_VM_INC_OPCODE() /  
    EX(opline)++

以及在{PHPSRC}/Zend/zend_vm_execute.c中定义的：

#define ZEND_VM_CONTINUE()   return 0  
#define ZEND_VM_RETURN()     return 1  
#define ZEND_VM_ENTER()      return 2  
#define ZEND_VM_LEAVE()      return 3  
#define ZEND_VM_DISPATCH(opcode, opline) return zend_vm_get_opcode_handler(opcode, opline)(ZEND_OPCODE_HANDLER_ARGS_PASSTHRU);

简单介绍功能

ZEND_VM_NEXT_OPCODE()：移动到下一条op，返回0，不进入switch，循环继续(这个是最常用到的)

ZEND_VM_SET_OPCODE(new_op)：当前opline设置成new_op

ZEND_VM_JMP(new_op) ：当前opline设置成new_op，返回0，不进入switch，循环继续

ZEND_VM_INC_OPCODE()：仅仅移动到下一条op

执行环境的切换

在前面的内容已经提到，用户自定义函数，类方法，eval的代码都会编译成单独的op_array,那么当进行函数调用等操作时，必然涉及到调用前的op_array执行环境和新的函数的op_array执行环境的切换，这一段我们将以调用用户自定义函数来介绍整个切换过程如何进行。

介绍此过程前必须了解执行环境的相关数据结构，涉及到执行环境的数据结构主要有两个：

1. 执行期全局变量结构

相关的定义在{PHPSRC}/Zend/zend_globals_macros.h:

/* Executor */ 
#ifdef ZTS  
# define EG(v) TSRMG(executor_globals_id, zend_executor_globals *, v)  
#else  
# define EG(v) (executor_globals.v)  
extern ZEND_API zend_executor_globals executor_globals;  
#endif

这里是一个条件编译，ZTS表示线程安全启用，为了简化，我们这里以非线程安全模式的情况下来介绍，那么执行期的全局变量就是executor_globals,其类型为zend_executor_globals, zend_executor_globals的定义在{PHPSRC}/Zend/zend_globals.h，结构比较庞大，这里包含了整个执行期需要用到的各种变量，无论是哪个op_array在执行，都共用这一个全局变量，在执行过程中，此结构中的一些成员可能会改变，比如当前执行的op_array字段active_op_array，动态符号表字段active_symbol_table可能会根据不同的op_array而改变，This指针会根据在不同的对象环境而改变。

另外还定义了一个EG宏来取此变量中的字段值，此宏是针对线程安全和非线程安全模式的一个封装。

2.每个op_array自身的执行数据

针对每一个op_array,都会有自己执行期的一些数据，在函数execute开始的时候我们能看到zend_vm_enter跳转标签下面就会初始一个局部变量execute_data，所以我们每次切换到新的op_array的时候，都会为新的op_array建立一个execute_data变量，此变量的类型为zend_execute_data的指针，相关定义在{PHPSRC}/Zend/zend_compile.h：

struct _zend_execute_data {  
    struct _zend_op *opline;  
    zend_function_state function_state;  
    zend_function *fbc; /* Function Being Called */ 
    zend_class_entry *called_scope;  
    zend_op_array *op_array;  
    zval *object;  
    union _temp_variable *Ts;  
    zval ***CVs;  
    HashTable *symbol_table;  
    struct _zend_execute_data *prev_execute_data;  
    zval *old_error_reporting;  
    zend_bool nested;  
    zval **original_return_value;  
    zend_class_entry *current_scope;  
    zend_class_entry *current_called_scope;  
    zval *current_this;  
    zval *current_object;  
    struct _zend_op *call_opline;  
};

可以用EX宏来取其中的值:#define EX(element) execute_data->element

这里只简单介绍其中两个字段：

opline: 当前正在执行的op。

prev_execute_data: op_array环境切换的时候，这个字段用来保存切换前的op_array,此字段非常重要，他能将每个op_array的execute_data按照调用的先后顺序连接成一个单链表，每当一个op_array执行结束要还原到调用前op_array的时候，就通过当前的execute_data中的prev_execute_data字段来得到调用前的执行器数据。

在executor_globals中的字段current_execute_data就是指向当前正在执行的op_array的execute_data。

再正式介绍之前还需要简单的介绍一下用户自定义函数的调用过程，详细的过程以后再函数章节中专门介绍，这里简单的说明一下：

在调用函数的时候，比如test()函数，会先在全局函数符号表中根据test来搜索相关的函数体，如果搜索不到则会报错函数没有定义，找到test的函数体之后，取得test函数的op_array，然后跳转到execute中的goto标签:zend_vm_enter,于是就进入到了test函数的执行环境。

下面我们将以一段简单的代码来介绍执行环境切换过程，例子代码：

<?php  
$a = 123;  
   
test();  
   
function test()  
{  
    return 1;  
}  
?>

这段代码非常简单，这样方便我们介绍原理，复杂的代码读者可以举一反三。此代码编译之后会生成两个op_array,一个是全局代码的op_array,另外一个是test函数的op_array,其中全局代码中会通过函数调用进入到test函数的执行环境，执行结束之后，会返回到全局代码，然后代码结束。

下面我们分几个阶段来介绍这段代码的过程，然后从中可以知道执行环境切换的方法。

1. 进入execute函数，开始执行op_array ,这个op_array就是全局代码的op_array，我们暂时称其为op_array1

首先在execute中为op_array1建立了一个execute_data数据,我们暂时命名为execute_data1,然后进行相关的初始化操作，其中比较重要的是：

EX(op_array) = op_array; // 设置op_array字段为当前执行的op_array,也就是全局代码的op_array1
EX(prev_execute_data) = EG(current_execute_data);//将全局执行数据中保存的当前op_array执行数据保存到op_array1的execute_data1的prev_execute_data字段，由于这是执行的第一个op_array,所以prev_execute_data实际上是空值,然后将执行期全局变量的current_execute_data设置成execute_data1,然后设置execute_data1的当前执行op，这样就可以开始执行当前的op了

2. 在op_array1执行到test函数调用的的时候，首先从全局函数符号表中找到test的函数体，将函数体保存在execute_data1的function_state字段，然后从函数体中取到test的op_array,我们这里用op_array2来表示，并将op_array2赋值给EG(active_op_array)：

EG(active_op_array) = &EX(function_state).function->op_array;

于是执行期全局变量的动态op_array字段指向了函数test的op_array，然后用调用ZEND_VM_ENTER();这个时候会先回到execute函数中的switch结构，并且满足以下case

case 2:
     op_array = EG(active_op_array);
     goto zend_vm_enter;

EG(active_op_array)之前已经被我们设置为test函数的op_array2，于是在函数execute中，op_array变量就指向了test的op_array2,然后跳转到zend_vm_enter。

3. 跳转到zend_vm_enter之后其实又回到了类似1中的步骤，此时为test的op_array2建立了它的执行数据execute_data,我们这里用execute_data2来表示。跟1中有些不同的是EX(prev_execute_data) = EG(current_execute_data);这个时候current_execute_data = execute_data1,也就是全局代码的执行执行期数据，然后EG(current_execute_data) = execute_data;这样current_execute_data就等于test的执行期数据execute_data2了，同时全局代码的execute_data1被保存在execute_data2的prev_execute_data字段。这个时候进行环境的切换已经完成，于是开始执行test函数。

4. test函数执行完之后就要返回到调用前的执行环境了，也就是全局代码执行环境，此阶段最重要的一个操作就是EG(current_execute_data) = EX(prev_execute_data); 在3中EX(prev_execute_data)已经设置成了全局代码的execute_data1,所以这样当前执行数据就变成了全局代码的执行数据，这样就成功的从函数test执行环境返回到了全局代码执行环境

这样，执行环境的切换过程就完成了，对于深层次的函数调用，原理一样，执行数据execute_data组成的单链表会更长。

同分类推荐文章

等了十年的 Go 链式管道，终于来了：seq 让你像写 Scala 一样写 Go （2026-06-25 18:38:18）
Go 实验特性详解（2026-06-21 10:05:27）
amd64 微架构级别对 Go 程序性能提升多少？（2026-06-21 09:38:49）

查看更多后端文章 →

建议继续学习

使用gettext来支持PHP的多语言（累计阅读 39,269）
WordPress插件开发 -- 在插件使用数据库存储数据（累计阅读 29,164）
Paypal接口详细代码(PHP版，非API接口) （累计阅读 19,408）
我的PHP，Python和Ruby之路（累计阅读 13,147）
include(“./file.php”)和include(“file.php”)区别（累计阅读 12,789）
15个最好的免费开源电子商务平台（累计阅读 12,541）
Redis消息队列的若干实现方式（累计阅读 12,088）
到底什么是MVC？（累计阅读 11,865）
整理了一份招PHP高级工程师的面试题（累计阅读 11,708）
Rolling cURL: PHP并发最佳实践（累计阅读 11,488）