前言
PHP 可以自动进行内存管理,当程序执行结束或对变量使用 unset 函数时,会清除不需要的对象。
PHP 使用引用技术(reference counting)GC 机制。每个对象都包含一个引用计数器 refcount,每个 reference 连接到对象,计数器加 1。当 reference 离开生存空间或被设为 NULL,计数器减 1。当某个对象的引用计数器为零时,PHP 知道你将不再需要使用这个对象,释放其所占的内存空间。
php变量的内部存储结构
php 是由 C 编写而成的,所以 php 变量的内部存储结构也会和 C 语言相关,即zval 的结构体:
struct _zval_struct {
union {
long lval;
double dval;
struct {
char *val;
int len;
} str;
HashTable *ht;
zend_object_value obj;
} value; //变量value值
zend_uint refcount__gc; //引用计数内存中使用次数,为0删除该变量
zend_uchar type; //变量类型
zend_uchar is_ref__gc; //区分是否是引用变量
};
从上面结构体内容可以看出每一个php变量都会由变量类型
、value值
、引用计数次数
和是否是引用变量
四部分组成
引用计数原理
每个php变量存在一个叫”zval”的变量容器中。一个zval变量容器,除了包含变量的类型和值,还包括两个字节的额外信息。
第一个是”is_ref”,是个bool值,用来标识这个变量是否是属于引用集合(reference set)。通过这个字节,php引擎才能把普通变量和引用变量区分开来,由于php允许用户通过使用&来使用自定义引用,zval变量容器中还有一个内部引用计数机制,来优化内存使用。
第二个额外字节是”refcount”,用以表示指向这个zval变量容器的变量(也称符号即symbol)个数。所有的符号存在一个符号表中,其中每个符号都有作用域(scope),那些主脚本(比如:通过浏览器请求的的脚本)和每个函数或者方法也都有作用域。
当一个变量被赋常量值时,就会生成一个zval变量容器,如下例这样:
<?php
$a = "new string";
显示 zval 信息
<?php
xdebug_debug_zval('a');
输出:
a: (refcount=1, is_ref=0)='new string'
新的变量a,是在当前作用域中生成的。并且生成了类型为 string 和值为new string的变量容器。在额外的两个字节信息中,”is_ref”被默认设置为 FALSE
,因为没有任何自定义的引用生成。”refcount” 被设定为 1,因为这里只有一个变量使用这个变量容器. 注意到当”refcount”的值是1时,”is_ref”的值总是FALSE
.
赋值原理(写时复制技术)
<?php
$a = "new string";
$b = $a;
xdebug_debug_zval( 'a' );
输出:
a: (refcount=2, is_ref=0)='new string'
引用次数是2,因为同一个变量容器被变量 a 和变量 b关联.当变量 b没被使用时,php不会去复制已生成的变量容器。变量容器在”refcount“变成0时就被销毁. 当任何关联到某个变量容器的变量离开它的作用域(比如:函数执行结束),或者对变量调用了函数 unset()时,”refcount“就会减1
新的垃圾回收机制
php5.3版本之后引入根缓冲机制,即php启动时默认设置指定zval数量的根缓冲区(默认是10000),当php发现有存在循环引用的zval时,就会把其投入到根缓冲区,当根缓冲区达到配置文件中的指定数量(默认是10000)后,就会进行垃圾回收,以此解决循环引用导致的内存泄漏问题
确认为垃圾的准则
1、如果引用计数减少到零,所在变量容器将被清除(free),不属于垃圾
2、如果一个zval 的引用计数减少后还大于0,那么它会进入垃圾周期。其次,在一个垃圾周期中,通过检查引用计数是否减1,并且检查哪些变量容器的引用次数是零,来发现哪部分是垃圾。