记一次死锁排查

一、代码场景

将FTP服务器设计为多线程形式。

FTP服务器在处理客户端响应时,对数据连接描述符dataFd和控制连接描述符ctrlFd分别进行集中处理。

因为方便用select()多路复用,开两个线程分发连接到来的事件。

1. 整体框架

void
addToControlServer (int connFd, struct sockaddr_in clientAddr)
{static Server *server = new ControlServer();server->addClient (connFd, clientAddr);
}void
addToDataServer (int connFd, struct sockaddr_in clientAddr)
{static Server *server = new DataServer();server->addClient (connFd, clientAddr);
}void
solveConrtrolConnection ()
{while (1){int connfd = accept (listenFd, (struct sockaddr *)&clientAddr, &clientAddrLen);addToControlServer (connfd, clientAddr);}
}void
solveDataConnection ()
{...while (1){int connfd = accept (listenFd, (struct sockaddr *)&clientAddr, &clientAddrLen);addToDataServer (connfd, clientAddr);}
}
int main()
{std::thread ctrlThread([]{	solveConrtrolConnection(); })std::thread dataThread([]{	solveDataConnection(); })ctrlThread.join();dataThread.join();retun 0;
}

2. Server实现

Server底层使用了select()多路复用。

class Server : public ErrorUtil {
public:Server();void addClient (int fd, struct sockaddr_in addr);void removeClient (int fd);
protected:virtual void preAdd (int fd, struct sockaddr_in addr);virtual void postRemove (int fd);virtual void workWhenDataCome (int fd) = 0;
private:class Impl;std::shared_ptr<Impl> m_pImpl = nullptr;
};class Server::Impl {
public:Impl (Server *server){assert (server);m_server		= server;auto workThread = std::thread (&Impl::threadEntry, this);workThread.detach();dispatcher.waitForStartCompleted();}void addClient (int fd, struct sockaddr_in addr){m_server->preAdd (fd, addr);dispatcher.addFd (fd);dispatcher.stopWait();}void removeClient (int fd){dispatcher.removeFd (fd);dispatcher.stopWait();m_server->postRemove (fd);}private:void threadEntry (){while (true) {std::vector<int> readAbleFds = dispatcher.waitForReadAble();std::for_each (readAbleFds.begin(), readAbleFds.end(), [&] (int fd) { m_server->workWhenDataCome (fd); });}}EasySelect dispatcher;Server *m_server;
};

ControlServer处理控制连接相关的逻辑:

class ControlServer : public Server {
...
private:void stopService (int fd){	...removeClient (fd);}void workWhenDataCome (int fd) override{...stopService (fd);...}...
};

二、死锁位置

代码不少,没必要全看。
死锁的位于是ControlServer中对virtual void workWhenDataCome (int fd) = 0;的重实现:

if (nRead == 0) {...stopService (fd);...
}

问题就出现在stopService()

void stopService (int fd)
{...removeClient (fd);
}

stopService()中调用了removeClient()removeClient()中调用了另一个类EasySelectstopWait()方法

这里EasySelect仅仅是对select()进行了易用性封装。

void
EasySelect::Impl::stopWait()
{char ANY_CHAR = 0;IOUtil::writen (m_pipeWrite, &ANY_CHAR, 1);std::unique_lock<std::mutex> lock (m_notifyMutex);m_stopFromPipeCond.wait (lock, [&] { return m_stopFromPipe == true; });m_stopFromPipe = false;IOUtil::readn (m_pipeRead, &ANY_CHAR, 1);
}

waitForReadable()则相当于select()系统调用,里面利用匿名管道来实现对select()的中断。

std::vector<int>
EasySelect::Impl::waitForReadable()
{fd_set fdSet;FD_ZERO (&fdSet);int fd_limits = -1;std::for_each (m_fds.begin(), m_fds.end(), [&] (int fd) {FD_SET (fd, &fdSet);fd_limits = std::max (fd_limits, fd);});FD_SET (m_pipeRead, &fdSet); //把管道读端放进去fd_limits = std::max (fd_limits, m_pipeRead);++fd_limits;{m_isWaiting = true;m_startCompleted.notify_one();}int nReadAble = ::select (fd_limits, &fdSet, NULL, NULL, NULL);if (nReadAble == -1) {setError (strerror (errno));return {};}m_isWaiting = false;std::vector<int> ret;std::for_each (m_fds.begin(), m_fds.end(), [&] (int fd) {if (FD_ISSET (fd, &fdSet) && fd != m_pipeRead) {ret.emplace_back (fd);}});if (ret.empty()) {std::lock_guard<std::mutex> lock (m_notifyMutex);m_stopFromPipe = true;m_stopFromPipeCond.notify_one();}return ret;
}

现在的程序实际只有两个线程:主线程(只用来建立连接)、ctrlFd处理线程。

原本的设想是在给每个客户端都再分配一个线程来执行任务,为了测试暂且只用了ctrlFd线程来串行处理所有任务。

下面的workWhenDataCome调用了stopWait(),在ctrlFd线程中执行。
然而stopWait()需要等待条件变量m_stopFromPipeCond的触发,这个条件变量又是在waitForReadAble()时才会产生的,线程现在卡在stopWait()处,根本不会执行waitForReadAble()

void threadEntry ()
{while (true) {std::vector<int> readAbleFds = dispatcher.waitForReadAble();std::for_each (readAbleFds.begin(), readAbleFds.end(), [&] (int fd) { m_server->workWhenDataCome (fd); });}
}

于是就产死锁了。

三、吸取教训

一定要搞清楚每个函数在执行时各自跑在哪个线程,就像看到变量就应该明白它在哪片内存空间。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/813584.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

java一个接口中比较复杂,这时候调用三次数据库,执行需要3秒,怎么优化

java一个接口中比较复杂&#xff0c;这时候调用2次数据库&#xff0c;执行需要3秒&#xff0c;怎么优化 使用异步执行: 将三次数据库操作放在独立的线程中异步执行,避免串行执行造成的等待时间。 可以使用 Java 的 CompletableFuture 或 Executor 框架来实现异步调用。 比如调用…

【IT资质】CS信息系统建设和服务能力评估详情介绍!你的企业办理了吗 ?

CS信息系统建设和服务能力评估是什么&#xff1f; 《信息系统建设和服务》是指通过结构化的综合布线系统&#xff0c;运用计算机网络技术和软件技术&#xff0c;将各个分离的设备、功能和信息等集成到相互关联的、统一和协调的系统之中&#xff0c;以及为信息系统正常运行提供…

Java基于微信小程序的校园跑腿小程序,附源码

博主介绍&#xff1a;✌程序员徐师兄、8年大厂程序员经历。全网粉丝15w、csdn博客专家、掘金/华为云/阿里云/InfoQ等平台优质作者、专注于Java技术领域和毕业项目实战✌ &#x1f345;文末获取源码联系&#x1f345; &#x1f447;&#x1f3fb; 精彩专栏推荐订阅&#x1f447;…

Python中queue和Qt中QQueue

Python中的queue queue模块 实现了多生产者、多消费者队列&#xff0c;适用于安全地在多线程间交换消息的线程编程。其实现了一个基本的先进先出&#xff08;FIFO&#xff09;容器。 queue模块定义了以下类和异常&#xff1a; class queue.Queue(maxsize0)FIFO 队列的构造函…

vue3+element plus图片预览点击按钮直接显示图片的预览形式

1 需求 直接上需求&#xff1a; 我想要直接点击下面这个“预览”按钮&#xff0c;然后呈现出预览图片的形式 ok&#xff0c;需求知道了&#xff0c;下面让我们来看看如何实现吧 ~ 2 实现 template部分 <el-buttontype"primary"size"small"click&qu…

一文读懂“涉密资质”与“保密资质”:不同之处,不容忽视!

什么是涉密资质&#xff1f; 涉密资质分为&#xff1a;涉密信息系统集成资质&#xff08;简称&#xff1a;涉密集成资质&#xff09;、国家秘密载体印制资质。涉密集成资质&#xff0c;该资质是从事涉及国家秘密的计算机信息系统集成业务需要取得的资质有8个行业单项和一个总体…

前端实现流文件下载的完整指南

在现代Web开发中&#xff0c;经常会遇到需要从服务器下载文件的情况。有时候这些文件是事先存储好的&#xff0c;可以通过简单的URL链接直接下载&#xff1b;但有时候&#xff0c;我们需要从数据流中动态生成文件并将其提供给用户。本篇博客将介绍如何在前端实现流文件下载的完…

链表中常见的使用方法逻辑整理

文章目录 1. 链表特点2. 链表创建3. 链表遍历通用方法3.1 在链表的开头添加元素3.2 在链表的结尾添加元素3.3 删除链表的第一个元素3.4 删除链表的最后一个元素3.5 遍历链表3.6 查找链表中的元素3.7 反转链表 4. 常见面试题4.1 相交链表4.2 反转链表4.3 环形链表4.4 环形链表 I…

easyui combobox下拉框组件输入检索全模糊查询

前引&#xff1a; easyui下拉组件&#xff08;combobox&#xff09;&#xff0c;输入检索下拉内容&#xff0c;是默认的右模糊匹配&#xff0c;而且不支持选择。因业务要求需要做成全模糊查询&#xff0c;目前网上搜索有两种方案&#xff1a; 1.修改easyui源码&#xff0c;这个…

测试 moco-runner工具 mock数据

1.下载moco-runner-1.5.0-standalone.jar文件 2.编辑demo.json &#xff08;和jar包在同一级目录&#xff09; 建议不要指定 "headers为application/json&#xff0c; 如果制定了&#xff0c;那么restTemplate调用header为null,调用就会报错400 是一个数组&#xff0c;…

LeetCode700:二叉搜索树中的搜索

题目描述 给定二叉搜索树&#xff08;BST&#xff09;的根节点 root 和一个整数值 val。 你需要在 BST 中找到节点值等于 val 的节点。 返回以该节点为根的子树。 如果节点不存在&#xff0c;则返回 null 。 代码 递归法 class Solution { public:TreeNode* searchBST(TreeN…

Visual Studio code无法正常执行Executing task: pnpm run docs:dev

最近尝试调试一个开源的项目&#xff0c;发现cmd可以正常启动&#xff0c;但是在vs中会报错&#xff0c;报错内容如下 Executing task: pnpm run docs:dev pnpm : 无法加载文件 E:\XXXX\pnpm.ps1&#xff0c;因为在此系统上禁止运行脚本。有关详细信息&#xff0c;请参阅 http…

组合导航的结果分段跳变问题

1 现象 用上海代数律动公司的AlgoT1-3组合导航设备采集数据进行组合导航算法调试&#xff0c;AlgoT1-3机器输出的结果很好很平滑&#xff0c;AlgoT1-3是带GNSS/INS的组合导航设备&#xff0c;另外还有一款更贵一点的带视觉的组合导航AlgoT1&#xff0c;效果会更好一些&#xf…

【Tars-go】腾讯微服务框架学习使用03-- TarsUp协议

3 TarsUP协议 统一通信协议 TarsTup | TarsDocs (tarscloud.github.io) TarsDocs/base at master TarsCloud/TarsDocs (github.com) &#xff1a; 有关于tars的所有介绍 每一个rpc调用双方都约定一套数据序列化协议&#xff0c;gprc用的是protobuff&#xff0c;tarsgo是统一…

每日OJ题_01背包③_力扣494. 目标和(dp+滚动数组优化)

目录 力扣494. 目标和 问题解析 解析代码 滚动数组优化代码 力扣494. 目标和 494. 目标和 难度 中等 给你一个非负整数数组 nums 和一个整数 target 。 向数组中的每个整数前添加 或 - &#xff0c;然后串联起所有整数&#xff0c;可以构造一个 表达式 &#xff1a; …

ThreadX:怎么确定一个线程应该开多少内存

ThreadX&#xff1a;如何确定线程的大小 在实时操作系统&#xff08;RTOS&#xff09;ThreadX中&#xff0c;线程的大小是一个重要的参数。这个参数决定了线程的堆栈大小&#xff0c;也就是线程可以使用的内存空间。那么&#xff0c;我们应该如何确定一个线程需要多大的字节呢…

C语言-----结构体详解

前面已经向大家介绍过一点结构体的知识了&#xff0c;这次我们再来深度了解一下结构体。结构体是能够方便表示一个物体具有多种属性的一种结构。物体的属性可以转换为结构体中的变量。 1.结构体类型的声明 1.1 结构体的声明 struct tag {member-list;//结构体成员变量 }vari…

MySQL进阶二

目录 1.使用环境 2.排序窗口函数 3.聚合窗口函数 1.使用环境 数据库&#xff1a;MySQL 8.0.30 客户端&#xff1a;Navicat 15.0.12 接续MySQL进阶一&#xff1a; MySQL进阶一-CSDN博客文章浏览阅读452次&#xff0c;点赞9次&#xff0c;收藏4次。MySQL进阶操作一。https…

P4631 [APIO2018] 选圆圈

题目传送门https://www.luogu.com.cn/problem/P4631 代码传送门https://www.luogu.com.cn/record/155489748 本弱鸡抄的~

【linux篇】ubuntu安装教程

有道是工欲善其事必先利其器&#xff0c;在学习linux前&#xff0c;先得搭建好环境才能事半功倍。 1.VMware虚拟机安装 打开浏览器&#xff0c;可直接在搜索栏中输入VMware。