2019独角兽企业重金招聘Python工程师标准>>>
结论:
1、小数组用msgpack,无论空间和性能都最好
2、大数组,考虑空间用igbinary,考虑性能用msgpack
json_encode,serialize,igbinary,msgpack四种序列化方式,在之前已经有过相关的测试,PHP5.5这方面的测试暂时没有,这次测试基于PHP5.5,并且测试用例,
http://blog.csdn.net/hguisu/article/details/7651730
的测试用例是一样的,只是从这个测试上家里igbinary serialize的测试,作为对比,可以参考
http://www.ooso.net/archives/538
运行环境
PHP5.5 内存 16G 8核 2.0GMHz
性能&空间大小列表
采用小数组测试结果(注意为了数据好看,小数组测试时,循环次数为10000次,大数组为1000次)
[html] view plaincopy
json :156
serialize :222
igbinary_serialize :123
msgpack :102
json_encode :0.22339701652527
json_decode :0.53043985366821
serialize :0.31040406227112
unserialize :0.30859398841858
Igbinary Serialize: 0.25647687911987
Igbinary unSerialize: 0.19416117668152
msgpack_pack: 0.14058780670166
msgpack_unpack: 0.29048585891724
方便对比把之前PHP5.3的测试结果放到下面(之前并未测试igbinary)
[html] view plaincopy
json :156
serialize :222
json_encode :0.1087498664856
json_decode :0.12652111053467
serialize :0.041656017303467
unserialize :0.040987968444824
采用大数组测试结果
[html] view plaincopy
json :5350
serialize :8590
igbinary_serialize :2432
msgpack :3929
json_encode :0.92437314987183
json_decode :1.791629076004
serialize :1.3011419773102
unserialize :1.1485421657562
Igbinary Serialize: 0.90479803085327
Igbinary unSerialize: 0.69125699996948
msgpack_pack: 0.52022004127502
msgpack_unpack: 1.0104610919952
下面是之前的结果(之前并未测试igbinary)
[html] view plaincopy
json :5350
serialize :8590
json_encode :0.90479207038879
json_decode :1.753741979599
serialize :1.3566699028015
unserialize :1.3003630638123
小结:
数据方面:
1:升级到PHP5.5后,json,serialize,igbinary三种方式序列化后,大小没有变化,说明这三种格式的对象结构没有没有变化,所以可以无缝升级,msgpack由于没有之前的数据做对比,暂时未知。
2:占用空间方面,igbinary节省空间明显优势,比如在json一个数组5.4k大小的数据,serialize方式要8.6k,而使用 igbinary方式,仅需2.4k,近乎为serialize方式的1/4,但在小数组方面msgpack方式更具优势,igbinary占用空间 123,而msgpack方式仅为102。但是在大数组情况下,明显igbinary方式优势更明显。大数组igbinary胜出,小数组msgpack 胜出。
性能方面:
1:在小数据时,json和原生serialize的性能都比PHP5.3版本有所提升,而在处理大数据量时,性能又有所下降。
2:在序列化方面,msgpack方式性能最好,其次是json_encode的,再次是igbinary,这两者相差无几,最差的为原生 serialize,原生serialize性能消耗大概为json和igbinary方式的的1.4倍左右,而是msgpack方式的2倍。在大数组方 面,序列化方便,基本上和小数组一致,只是igbinary性能教较json_encode方式有所提升。本轮msgpack胜出。
3:在反序列方面igbinary的比序列化过程更快,当然也是最快的,但是这种快也是有成本代价的,参见最后的注意事项,最慢的为 json_decode方式,猜测原因可能在于PHP作为服务器端应用,最多的场景是encode,而decode的最常见的为js处理方式,性能不是很 理想。而msgpack反序列化性能基本上是它序列化的2倍。本轮igbinary胜出。
4:整体性能对比,整体性能是序列化和反序列化之和,简单对比会发现,json是最差的,次之是原生serialize,再次为igbinary的方式, 最优的为msgpack,不过igbinary和msgpack相差真的非常小,而在占用空间方面,小数据时msgpack胜出,大数据时 igbinary胜出,算是各有千秋。所以,如果追求极致的性能,可以考虑使用msgpack,如果对是使用空间要求苛刻,那就选择igbinary方 式,估计这也是PHPRedis选择igbinary作为内置序列化方式的原因之一,另外还有一个原因,考虑到Redis应用场景多是一写多读,要保证反 序列化性能足够高,非igbinary莫属。
使用igbinary并非没有代价,在测试中我们发现,调用igbinary_unserialize时,传递非法数据,会导致整个php进程死掉,日志
[html] view plaincopy
child 19131 exited on signal 11 (SIGSEGV) after 1.844938 seconds from start 1.844938 seconds from start
估 计是因为igbinary为了提升性能,在unserialize时,没有做相关格式验证,导致整个进程异常退出。在使用Redis时,我们先期使用 SERIALIZE_PHP方式序列化,为了提升性能,减少对Redis空间的浪费采用igbinary_serialize方式,再切换的时候不小心踩 到这个坑,导致服务器响应出错,直接502,幸亏在daily环境上。