[PHP源码阅读]empty和isset函数

近些年被问到PHP中empty和isset函数时怎么判断变量的,刚初始小编是一脸懵逼的,因为小编要好也只是管窥之见,为了弄懂其确实的法则,赶紧翻开源码探讨商讨。经过分析可发现七个函数调用的都以同1个函数,因而本文将对多个函数一起分析。

自作者在github有对PHP源码更详实的注释。感兴趣的能够扫描一下,给个star。PHP5.4源码表明。能够经过commit记录翻开已添加的笺注。

函数使用格式

empty

bool empty ( mixed $var )

认清变量是还是不是为空。

 

isset

bool isset ( mixed $var [ , mixed $… ] )

判断变量是还是不是被设置且不为NULL。

参数表达

对此empty,在PHP5.5版本以前,empty只帮助变量参数,别的品类的参数会造成解析错误,比如函数调用的结果无法当做参数。

对于isset,就算变量被如unset的函数设为NULL,则函数会回来false。假使八个参数被传送到isset函数,那么唯有全数参数都被设置isset函数才会回到true。从左到右计算,一旦遇上没被安装的变量就告一段落。

 

运维示例

$result = empty(0); // true
$result = empty(null); // true
$result = empty(false); // true
$result = empty(array()); // true
$result = empty('0'); // true
$result = empty(1); // false
$result = empty(callback function); // 报错

$a = null;
$result = isset($a); // false;

$a = 1;
$result = isset($a); // true;

$a = 1;$b = 2;$c = 3;
$result = isset($a, $b, $c); // true

$a = 1;$b = null;$c = 3;
$result = isset($a, $b, $c); // false

 

找到函数的概念地方

事实上,empty不是1个函数,而是1个言语结构。语言结构是在PHP程序运维前编译好的,由此不能够像在此以前这样不难地查找”PHP_FUNCTION
empty”或”ZEND_FUNCTION
empty”查看其源码。要想看empty等语言结构的源码,先要理解PHP代码执行的机制。

PHP执行代码会经过6个步骤,其流程图如下所示:

 

图片 1

在第13个等级,即Scanning阶段,程序会扫描zend_language_scanner.l文件将代码文件转换到语言片段。对于isset和empty函数来说,在zend_language_scanner.l文件中搜索empty和isset能够博得函数在此文件中的宏定义如下:

<ST_IN_SCRIPTING>"isset" {
return T_ISSET;
}


<ST_IN_SCRIPTING>"empty" {
return T_EMPTY;
}

接下去就到了Parsing阶段,那些阶段,程序将T_ISSET和T_EMPTY等Tokens转换到有意义的表明式,此时会做语法分析,Tokens的yacc保存在zend_language_parser.y文件中,可以找到T_ISSET和T_EMPTY的定义:

internal_functions_in_yacc:
T_ISSET '(' isset_variables ')' { $$ = $3; }
| T_EMPTY '(' variable ')' { zend_do_isset_or_isempty(ZEND_ISEMPTY, &$$, &$3 TSRMLS_CC); }
| T_INCLUDE expr { zend_do_include_or_eval(ZEND_INCLUDE, &$$, &$2 TSRMLS_CC); }
| T_INCLUDE_ONCE expr { zend_do_include_or_eval(ZEND_INCLUDE_ONCE, &$$, &$2 TSRMLS_CC); }
| T_EVAL '(' expr ')' { zend_do_include_or_eval(ZEND_EVAL, &$$, &$3 TSRMLS_CC); }
| T_REQUIRE expr { zend_do_include_or_eval(ZEND_REQUIRE, &$$, &$2 TSRMLS_CC); }
| T_REQUIRE_ONCE expr { zend_do_include_or_eval(ZEND_REQUIRE_ONCE, &$$, &$2 TSRMLS_CC); }
;

isset和empty函数最后都执行了zend_do_isset_or_isempty函数,继续查找
grep -rn “zend_do_isset_or_isempty”
可以窥见,此函数在zend_compile.c文件中定义。

 

函数执行步骤

壹 、解析参数

二 、检查是否为可写变量

叁 、即使是变量的op_type是IS_CV(编写翻译时代的变量),则设置其opcode为ZEND_ISSET_ISEMPTY_VAR;否则从active_op_array中拿走下2个op值,依据其op值设置last_op的opcode。

四 、设置了opcode之后,之后会提交zend_excute执行。

源码解读

IS_CV是编写翻译器使用的一种cache机制,那种变量保存着它被引用的变量的地址,当1个变量第一回被引述的时候,就会被CV起来,现在那一个变量的引用就不须求再去查找active符号表了。

对于empty函数,到了opcode的步调后,参阅opcode处理函数,可以知道,isset和empty在excute的时候实施的是ZEND_ISSET_ISEMPTY_VAR等一密密麻麻函数,以ZEND_ISSET_ISEMPTY_VAR_SPEC_CV_VAR_HANDLER为例,找到这一个函数的概念在zend_vm_execute.h。查看函数能够知道,empty函数的结尾实施函数是i_zend_is_true(),而i_zend_is_true函数定义在zend_execute.h。i_zend_is_true函数的中坚代码如下:

        switch (Z_TYPE_P(op)) {
        case IS_NULL:
            result = 0;
            break;
        case IS_LONG:
        case IS_BOOL:
        case IS_RESOURCE:
            // empty参数为整数时非0的话就为false
            result = (Z_LVAL_P(op)?1:0);
            break;
        case IS_DOUBLE:
            result = (Z_DVAL_P(op) ? 1 : 0);
            break;
        case IS_STRING:
            if (Z_STRLEN_P(op) == 0
                || (Z_STRLEN_P(op)==1 && Z_STRVAL_P(op)[0]=='0')) {
                // empty("0") == true
                result = 0;
            } else {
                result = 1;
            }
            break;
        case IS_ARRAY:
            // empty(array) 是根据数组的数量来判断
            result = (zend_hash_num_elements(Z_ARRVAL_P(op))?1:0);
            break;
        case IS_OBJECT:
            if(IS_ZEND_STD_OBJECT(*op)) {
                TSRMLS_FETCH();

                if (Z_OBJ_HT_P(op)->cast_object) {
                    zval tmp;
                    if (Z_OBJ_HT_P(op)->cast_object(op, &tmp, IS_BOOL TSRMLS_CC) == SUCCESS) {
                        result = Z_LVAL(tmp);
                        break;
                    }
                } else if (Z_OBJ_HT_P(op)->get) {
                    zval *tmp = Z_OBJ_HT_P(op)->get(op TSRMLS_CC);
                    if(Z_TYPE_P(tmp) != IS_OBJECT) {
                        /* for safety - avoid loop */
                        convert_to_boolean(tmp);
                        result = Z_LVAL_P(tmp);
                        zval_ptr_dtor(&tmp);
                        break;
                    }
                }
            }
            result = 1;
            break;
        default:
            result = 0;
            break;
    }

那段代码相比较直观,函数没有对检查和测试值做任何的变换,通过那段代码来更为分析示例中的empty函数做分析:
empty(null),到IS_NULL分支,result=0,i_zend_is_true() ==
0,!i_zend_is_true() == 1,因而回到true。

empty(false),到IS_BOOL分支,result = ZLVAL_P(false) =
0,i_zend_is_true() == 0,!i_zend_is_true() == 1,由此回到true。

empty(array()),到IS_ARRAY分支,result =
zend_hash_num_elements(Z_ARRVAL_P(op)) ? 1 :
0),zend_hash_num_elements重返数组成分的多寡,array为空,由此result为0,i_zend_is_true()
== 0,!i_zend_is_true() == 1,因而回到true。

empty(‘0’),到IS_STRING分支,因为Z_STRLENP(op) == 1 且
Z_STRVAL_P(op)[0] == ‘0’,因此result为0,i_zend_is_true() ==
0,!i_zend_is_true() == 1,由此回到true。

empty(1),到IS_LONG分支,result = Z_LVAL_P(op) = 1,i_zend_is_true
== 1,!i_zend_is_true() == 0,由此回到false。

 

对此isset函数,最后达成判断的代码是:

if (isset && Z_TYPE_PP(value) != IS_NULL) {
    ZVAL_BOOL(&EX_T(opline->result.var).tmp_var, 1);
} else {
    ZVAL_BOOL(&EX_T(opline->result.var).tmp_var, 0);
}

若果value被设置了且不为NULL,isset函数就再次回到true。

 

小结

此次阅读那八个函数的源码,学习到了:

① 、PHP代码在编写翻译时期的履行步骤

② 、怎么着寻找PHP语言结构的源码地点

三 、怎么样寻找opcode处理函数的具体函数

学无止境,各种人都有和好的短板,唯有经过不停学习才能将自身的短板补上。

 

原创作品,文笔有限,才疏学浅,文中若有不正之处,万望告知。

倘诺本文对您有扶持,请点下推荐呢,多谢^_^

 

末尾再安利一下,我在github有对PHP源码更详尽的注释。感兴趣的可以扫描一下,给个star。PHP5.4源码注明。能够经过commit记录翻开已添加的笺注。

参照文章
opcode处理函数查找:http://www.laruence.com/2008/06/18/221.html
PHPopcode深刻驾驭及PHP代码执行步骤:http://www.php-internals.com/book/?p=chapt02/02-03-03-from-opcode-to-handler

 

越来越多源码文章,欢迎访问个人主页继续翻看:hoohack

相关文章