php windows共享内存,关于php的共享内存的使用和研究之由起

最近遇到一个场景,服务寻址的时候,需要请求远程的服务,获取一批可用的ip和端口地址及其权重。根据权重和随机算法选择最合适的一个服务地址,进行请求。由于服务地址在短时间之内不会发生变化,因此为了避免无限制的进行寻址的请求,有必要将地址缓存至本地。

对于php而言,说到用户数据缓存本地,第一反应出来的就是APC。但是APC首先被创建出来是给php做内部缓存的,其次才是提供给用户态使用的。根据laruence在博客的说法,opcache出现了之后,对zend编译的opcode做了缓存,实际上解决了apc被创建出来想要解决的问题。因此现在APC已经处于不再更新维护的状态了。

对于想使用opcache,又要使用用户态的APC的同学,就需要额外的配置,同时性能上也会比原来的APC要差,差不多相当于本机的memcache。这显然就无法达到本机内存访问的效率了,因此需要寻求其他的解决方案。

php的共享内存API

随后我就想到了使用php的共享内存API,反正只是缓存非常少的路由信息,加在一起不超过1k,尽管是多读多写的场景,但是覆盖了也没关系,出于这种出发点,我就开始了对php的共享内存API的研究。

php中操作共享内存的方式一共有两组:

System V IPC

编译增加 --enable-sysvshm

Shared Memory

--enable-shmop

先来看一个shmop的例子:

// 从系统获取一个共享内存的id

$key = ftok(__FILE__, 'test');

$size = 1024;

// 打开1024字节的共享内存(如果不存在则申请)

$shm_h = @shmop_open($key, 'c', 0644, $size);

if($shm_h === false) {

echo "shmop open failed";

exit;

}

// 读取共享内存中的数据

$data = shmop_read($shm_h, 0, $size);

// 对读取的数据进行反序列化

$data = unserialize($data);

//如果没有数据则写入

if(empty($data)) {

echo "there is no data";

$data = "imdonkey";

//所有写入的数据,都必须提前序列化

$write_size = shmop_write($shm_h, serialize($data), 0);

if($write_size === false) echo "shmop write failed!";

}

//如果有,显示出来,之后删掉

else {

echo "shared memory data: ";

print_r($data);

shmop_delete($shm_h);

}

shmop_close($shm_h);

?>

使用shmop扩展,必须要注意数据的大小,以及读写时候的偏移量。同时,不管你写入的是什么数据类型,都必须进行序列化和反序列化。

再看一下SysV的例子:

// 从系统获取一个共享内存的id

$shm_key = ftok(__FILE__, 'test');

// 获取此共享内存资源的操作句柄

$memsize = 1024;

$shm_h = shm_attach($shm_key, $memsize, 0644);

if($shm_h === false) {

echo "shmop open failed";

exit;

}

// 获取共享内存中key=222时的内容

$var_key = 222;

$data = @shm_get_var($shm_h, $var_key);

if(empty($data)) {

$data = ['test'=>'here'];

echo "there is no data, insert $data.\n";

// 如果数据不存在,写入数据,可以是任意类型,无需初始化

shm_put_var($shm_h, $var_key, $data);

} else {

// 否则,输出数据,并清理相关内存

echo "find data: $data\n";

shm_remove_var($shm_h, $var_key);

}

// 断开资源的链接

shm_detach($shm_h);

?>

原理上来讲并无不同,只是SysV做了更多的封装,让你使用起来更加方便一些。不用自己控制偏移量,也不用进行序列化和反序列化。同时对于每个数据,都设置了对应的var_key, 这样在同一个区域可以保存多个数据,而无需再次申请另一片共享内存。

业务中的使用

在使用两者的时候,都要注意对数据大小的估算。否则很容易出现共享内存溢出的情况。而我在使用的时候,充分评估了要存储的数据结构的大小,我需要存储的内容是:

ip(15个字节以内)+port(8字节以内)+timestamp(15字节以内)+分隔符(3字节)=41字节

假设我调用100个后端服务。那么最高需要存储的路由信息就是4.1k大小。

出于这种考虑,我申请了1M的内存,觉得应该是够够的了。就这么悠哉哉的在线上跑了一个星期左右,有天没事到线上看了下php的错误日志,结果一脸懵逼:

a182bc8b3f23

屏幕快照 2016-12-25 下午2.51.26.png

什么情况,调用的后端服务一共才5个,共享内存这么快就写满了??经过一个初步的判断之后,我得出的结论是:sysV的接口能力太差,对于shareKey没有做去重处理,而是每次都写入了新的key,这样就导致了共享内存的写入指针尽管是相同的shareKey,但是却不断的后移,最终导致共享内存被写爆,而寻址的请求全部都打到了寻址服务,还好它比较健壮,也有短时的缓存,才没有产生运营事故。

在得出了这么个结论之后,我修改了我的代码,在每次完成对shareKey内容的获取之后,增加了一行

shm_remove_var($shareKey)

同时写了一个脚本,把原有的共享内存id对应的内容清空,经过手工处理十台机器之后,再全量替换一把代码,打卡下班,感觉自己棒棒哒。

没想到,这才是悲剧的开始。就在当周的周六,吃着火锅,突然就有一台线上机器罢工了。机器服务狂core不止,打开系统配置的core文件输出之后,迅速占满磁盘,无奈之下,先让运维把机器摘掉,再进一步的分析。其他机器也出现了不同程度的core,线上失败率直线上升。

a182bc8b3f23

屏幕快照 2016-12-25 下午3.08.52.png

再把机器摘下来之后,看了一眼core文件,就发现,哎呀,闯祸了。

a182bc8b3f23

屏幕快照 2016-12-25 下午3.18.50.png

赶快恢复到没有remove的版本,至少还能撑一个星期,不至于程序core掉。

踩坑与解决

接下来开始仔细分析源码,发现sysV的扩展中,remove_var实现如下:

PHP_FUNCTION(shm_remove_var)

{

zval *shm_id;

long shm_key, shm_varpos;

sysvshm_shm *shm_list_ptr;

// 读取输入参数

if (SUCCESS != zend_parse_parameters(ZEND_NUM_ARGS() TSRMLS_CC, "rl", &shm_id, &shm_key)) {

return;

}

SHM_FETCH_RESOURCE(shm_list_ptr, shm_id);

// 检查sharekey在共享内存中是否存在

shm_varpos = php_check_shm_data((shm_list_ptr->ptr), shm_key);

// 如果不存在,返回错误

if (shm_varpos < 0) {

php_error_docref(NULL TSRMLS_CC, E_WARNING, "variable key %ld doesn't exist", shm_key);

RETURN_FALSE;

}

// 如果存在,删除共享内存

php_remove_shm_data((shm_list_ptr->ptr), shm_varpos);

RETURN_TRUE;

}

咋一看没啥问题,但是深入看一下php_check_shm_data,发现有问题:

// ptr为整个共享内存区块的头指针

static long php_check_shm_data(sysvshm_chunk_head *ptr, long key)

{

long pos;

sysvshm_chunk *shm_var;

// 从头开始寻找

pos = ptr->start;

for (;;) {

// 找到最后了返回

if (pos >= ptr->end) {

return -1;

}

// 向前进一个内存区块,由当前区块的next指针决定

shm_var = (sysvshm_chunk*) ((char *) ptr + pos);

if (shm_var->key == key) {

return pos;

}

pos += shm_var->next;

if (shm_var->next <= 0 || pos < ptr->start) {

return -1;

}

}

return -1;

}

这个根本就是线程不安全的版本额,在高并发的场景下,非常有可能出现,对一个shareKey内是否存在数据的错误判断,根据swoole的多进程模型,进程A进行寻址,查看共享内存,发现shareKey对应的区块无数据,所以他准备进行写入,同时进程B之前已经检查了shareKey数据,发现shareKey数据已经过期,执行了remove操作。这时候进程A再想去写入的时候,就会发生不可避免的segmentation fault。

发现了这个问题之后,反过来去想当时为什么共享内存会被写满,也是一样的问题,都怪php_check_shm_data对key的判断线程不安全,所以不可避免的,高并发下一直会用重复的key不停的向前写入。当时申请了 12M的内存, 每秒500请求,swoole开了24个进程,假设碰撞概率是1/(24*500)=1/12000。每次写入的大小是4k*3(四个服务寻址),程序设计的是五分钟进行一次put。

那么12M共享内存被写满的时间应该是12M/12k/(60min/5min)/24h = 3.6天左右。基本上只能撑个这么久。

所以呢,解决方向有两个:

实现一个有锁的共享内存API版本

另辟蹊径,使用别的本地内存存储方案

权衡之下,准备采取第二种做法,预知后事如何,且看下回分解~

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/303956.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

联想继续为其硬件产品完善Linux支持

喜欢就关注我们吧&#xff01;此前&#xff0c;联想曾宣布为其台式机/笔记本电脑预装 Fedora/Ubuntu 等 Linux 发行版。并通过与 RedHat 等达成合作&#xff0c;为 Linux 带来了更多的上游工作支持。时至今日&#xff0c;据 Phoronix 称&#xff0c;自联想开始提供 Linux 预装以…

Excel有哪些需要熟练掌握而很多人不会的技能!

看完这篇Excel攻略&#xff0c;你会感觉这么多年的excel都白学了&#xff01;来自知乎用户“未央之末”的分享。从今年年初的excel盲&#xff0c;到现在经常从大拿那偷师&#xff0c;也算是成长了不少&#xff0c;慢慢写下来算是对学习excel做个短期回顾——1排版篇给他人发送e…

如何在 ASP.NET Core 中使用 LazyCache

微软的 ASP.NET Core 已经是一个非常流行的用于构建 高性能, 模块化 并能运行在 Windows, Linux, MacOS 上的 WEB 框架&#xff0c;通常能够让程序保持高性能的一个有效途径就是通过缓存热链上的数据来应对高频的请求。LazyCache 是一款基于内存的易于使用和线程安全的缓存组件…

2018全球大学AI排名发布,中国高校表现强势!

[导读] 近日&#xff0c;麻省理工学院马萨诸塞校区计算机与信息科学学院教授 Emery Berger 发布一个全球院校计算机科学领域实力排名的开源项目 CSranking 更新了。目前&#xff0c;卡耐基梅隆大学&#xff08;CMU&#xff09;、麻省理工学院&#xff08;MIT&#xff09;与斯坦…

在C#中使用 CancellationToken 处理异步任务

在 .NET Core 中使用异步编程已经很普遍了&#xff0c; 你在项目中随处可见 async 和 await&#xff0c;它简化了异步操作&#xff0c;允许开发人员&#xff0c;使用同步的方式编写异步代码&#xff0c;你会发现在大部分的异步方法中&#xff0c;都提供了CancellationToken参数…

通过Python实现马尔科夫链蒙特卡罗方法的入门级应用

通过把马尔科夫链蒙特卡罗&#xff08;MCMC&#xff09;应用于一个具体问题&#xff0c;本文介绍了 Python 中 MCMC 的入门级应用。GitHub 地址&#xff1a;https://github.com/WillKoehrsen/ai-projects/blob/master/bayesian/bayesian_inference.ipynb过去几月中&#xff0c;…

315曝光不良奸商 对企业不能罚酒三杯

3月15日&#xff0c;315晚会又曝光了一批无良奸商&#xff0c;虽然315晚会年年曝光&#xff0c;各地政府也迅速跟进打击&#xff0c;但侵害消费者权益的情况却屡见不鲜。从被曝光企业的道歉信来看&#xff0c;“承认错误只是个别问题全面排查整改配合管理部门执法向消费者表示道…

.NET 产品版权保护方案 (.NET源码加密保护)

一. 前言大家好&#xff0c;我是康世杰&#xff0c;大家可以叫我Jason。我和大家一样&#xff0c;都是搞技术出身&#xff0c;也未当过讲师&#xff0c;所以口材有限&#xff0c;如果讲得不好之处&#xff0c;还希望大家多多海含&#xff0c;谢谢。今天是我们第一次见面&…

java地图 热力图,腾讯地图数据可视化之热力图

前言数据可视化API(Web)&#xff0c;是基于腾讯位置服务JavaScript API GL实现的专业地理空间数据可视化渲染引擎。 通过这套API&#xff0c;可以实现轨迹数据、坐标点数据、热力、迁徙、航线等空间数据的可视化展现。使用步骤1、注册成为腾讯位置服务开发者&#xff0c;并进入…

建模分析师与算法工程师的主要区别

大家晚上好&#xff0c;我是新来的实习生小模君&#xff0c;前几天小智老师给我科普了数据挖掘的基础知识&#xff0c;颇有收获&#xff0c;于是就趁小天今天有事休假冒个泡跟大家分享一番。数据挖掘&#xff0c;英文名叫Data mining&#xff0c;一般是指从大型数据库中将隐藏的…

Flurl使用Polly实现重试Policy

❝在使用Flurl作为HttpClient向Server请求时&#xff0c;由于网络或者其它一些原因导致请求会有失败的情况&#xff0c;比如HttpStatusCode.NotFound、HttpStatusCode.ServiceUnavailable、HttpStatusCode.RequestTimeout等&#xff1b;网络上有比较多的HttpClientFactory使用P…

推荐15个 JavaScript 和 CSS 库

Tutorialzine的使命是让开发者与最新的Web开发发展同步。因此&#xff0c;我们每月都会精选一批最优秀的资源推荐给大家&#xff0c;相信这些资源你绝对值得拥有&#xff01;ClarifyJSClarifyJS可以让你串联一串方法&#xff0c;以任意顺序执行。通常的JavaScript方法是从左到右…

Dapr Meetup 3.22【周六】

点击蓝字关注我们Dapr&#xff08;Distributed Application Runtime &#xff0c;分布式应用运行时&#xff09;是微软新推出的&#xff0c;一个可移植的、由事件驱动的运行时&#xff0c;用于跨云和边缘构建分布式应用程序。2019年10月9日&#xff0c;正式以 MIT 协议开源。…

日本老爷爷坚持17年用Excel作画,我可能用了假的Excel···

本文来源自网络说起办公软件Excel&#xff0c;不少人可能同小编一样&#xff0c;谈及色变。想想公式、表格头都大了&#xff0c;今天要介绍的这个人竟然可以用其作画&#xff0c;简直是大写的“丧心病狂”&#xff01;这位传奇人物就是堀内辰男&#xff0c;今年已经77岁了&…

腾讯二面挂了,就因为这个...

牛年跳槽季&#xff0c;惨遭开门黑&#xff0c;谨以此文纪念我的首次腾讯面试经历。经我的老师&#xff0c;微软MVP大佬推荐&#xff0c;有幸拿到了腾讯.NET Core高开面试机会&#xff0c;二面却挂在一个最常见的问题上&#xff0c;“你上家公司电商平台的TPS、QPS是多少&#…

51CTO博客 NO.1 大奖赛之后感想---奖品

自从加入51cto技术成就梦想这个大家庭以来&#xff0c;进入这个大家庭可以说是个机会&#xff0c;也可以是个缘分&#xff1b;已经有半年了&#xff0c;明朗炽热般的心&#xff0c;使我深深地喜欢上了这一个大家庭&#xff1b;这个大家庭是一个很不平凡而又富有源源不断学而不尽…

入门 | 我们常听说的置信区间与置信度到底是什么?

机器学习本质上是对条件概率或概率分布的估计&#xff0c;而这样的估计到底有多少是置信度&#xff1f;这里就涉及到统计学里面的置信区间与置信度&#xff0c;本文简要介绍了置信区间这一核心概念&#xff0c;它有助于我们从直观上理解评价估计优劣的度量方法。本文讨论了统计…

.NET 差点不叫“.NET”?微软大牛爆料技术往事

作者 | 伍杏玲出品 | CSDN&#xff08;ID&#xff1a;CSDNnews&#xff09;2000 年注定是不平凡的一年&#xff1a;千年虫问题爆发、互联网泡沫破灭……正值世界风云突变之际&#xff0c;比尔盖茨和史蒂夫鲍尔默向全球宣布全力打造“下一代因特网”——.NET 平台。比尔盖茨对.N…

【翻译】WPF 中附加行为的介绍 Introduction to Attached Behaviors in WPF

【翻译】WPF 中附加行为的介绍 Introduction to Attached Behaviors in WPF目录 隐藏 引言 [Introduction]背景 [Background]附加行为 [Attached Behaviors]论证 [Demonstration]结论 [Conclusion]参考 [References]版本历史 [Revision History]许可证 [License]作者&#xff…

地图是怎么知道实时路况的?因为我们每个人都是“百万年薪级”数据贡献者

【导读】地图公司给地图“上色”主要靠数据&#xff0c;数据够则地图生。数据是地图的生命&#xff0c;车速是路况的根本&#xff0c;地图获取数据主要有两种方式&#xff1a;自给自足、仰给于人上班出门&#xff0c;点开地图&#xff0c;前面红色&#xff0c;后面红色&#xf…