WebSocket心跳机制
一、WebSocket简介
WebSocket是HTML5开始提供的一种浏览器与服务器进行全双工通讯的网络技术,属于应用层协议。
WebSocket 使得客户端和服务器之间的数据交换变得更加简单,允许服务端主动向客户端推送数据。
二、WebSocket事件与方法
1、创建WebSocket实例
var socketObj;if ("WebSocket" in window) {socketObj = new WebSocket(webSocketLink);} else if ("MozWebSocket" in window) {socketObj = new MozWebSocket(webSocketLink);}
2、WebSocket 事件
3、WebSocket 方法
三、WebSocket的心跳重连机制
1、问题
(1)websocket在连接后,如果长时间服务端和客户端不发消息,服务端会把websocket给断开。
(2)存在网络忽然断开的情况,这时服务器端并没有触发onclose的事件。服务器会继续向客户端发送多余的信息,这些数据会丢失。
2、心跳重连机制
为了解决上面的问题,就需要⼀种机制来检测客户端和服务端是否处于正常的连接状态。因此就有了websocket的心跳机制。
⼼跳机制是客户端每隔⼀段时间会向服务端发送⼀个数据包,告诉服务端自己还活着,同时客户端会根据服务端是否会回传⼀个数据包来确定服务端是否还活着。
如果客户端没有收到回复,表示websocket断开连接或者网络出现问题,就需要重连。
四、实际使用
详细代码如下:
<template><div></div>
</template>
<script>
export default {data() {return {// websocket相关socketObj: "", // websocket实例对象//心跳检测heartCheck: {vueThis: this, // vue实例timeout: 10000, // 超时时间timeoutObj: null, // 计时器对象——向后端发送心跳检测serverTimeoutObj: null, // 计时器对象——等待后端心跳检测的回复// 心跳检测重置reset: function () {clearTimeout(this.timeoutObj);clearTimeout(this.serverTimeoutObj);return this;},// 心跳检测启动start: function () {this.timeoutObj && clearTimeout(this.timeoutObj);this.serverTimeoutObj && clearTimeout(this.serverTimeoutObj);this.timeoutObj = setTimeout(() => {// 这里向后端发送一个心跳检测,后端收到后,会返回一个心跳回复this.vueThis.socketObj.send("HeartBeat");console.log("发送心跳检测");this.serverTimeoutObj = setTimeout(() => {// 如果超过一定时间还没重置计时器,说明websocket与后端断开了console.log("未收到心跳检测回复");// 关闭WebSocketthis.vueThis.socketObj.close();}, this.timeout);}, this.timeout);},},socketReconnectTimer: null, // 计时器对象——重连socketReconnectLock: false, // WebSocket重连的锁socketLeaveFlag: false, // 离开标记(解决 退出登录再登录 时出现的 多次相同推送 问题,出现的本质是多次建立了WebSocket连接)};},created() {console.log("离开标记", this.socketLeaveFlag);},mounted() {// websocket启动this.createWebSocket();},destroyed() {// 离开标记this.socketLeaveFlag = true;// 关闭WebSocketthis.socketObj.close();},methods: {// websocket启动createWebSocket() {let webSocketLink = "wss://uat.sssyin.cn/ws-reservation"; // webSocket地址// console.log(webSocketLink);try {if ("WebSocket" in window) {this.socketObj = new WebSocket(webSocketLink);} else if ("MozWebSocket" in window) {this.socketObj = new MozWebSocket(webSocketLink);}// websocket事件绑定this.socketEventBind();} catch (e) {console.log("catch" + e);// websocket重连this.socketReconnect();}},// websocket事件绑定socketEventBind() {// 连接成功建立的回调this.socketObj.onopen = this.onopenCallback;// 连接发生错误的回调this.socketObj.onerror = this.onerrorCallback;// 连接关闭的回调this.socketObj.onclose = this.oncloseCallback;// 向后端发送数据的回调this.socketObj.onsend = this.onsendCallback;// 接收到消息的回调this.socketObj.onmessage = this.getMessageCallback;//监听窗口关闭事件,当窗口关闭时,主动去关闭websocket连接,防止连接还没断开就关闭窗口,server端会抛异常。window.onbeforeunload = () => {this.socketObj.close();};},// websocket重连socketReconnect() {if (this.socketReconnectLock) {return;}this.socketReconnectLock = true;this.socketReconnectTimer && clearTimeout(this.socketReconnectTimer);this.socketReconnectTimer = setTimeout(() => {console.log("WebSocket:重连中...");this.socketReconnectLock = false;// websocket启动this.createWebSocket();}, 4000);},// 连接成功建立的回调onopenCallback: function (event) {console.log("WebSocket:已连接");// 心跳检测重置this.heartCheck.reset().start();},// 连接发生错误的回调onerrorCallback: function (event) {console.log("WebSocket:发生错误");// websocket重连this.socketReconnect();},// 连接关闭的回调oncloseCallback: function (event) {console.log("WebSocket:已关闭");// 心跳检测重置this.heartCheck.reset();if (!this.socketLeaveFlag) {// 没有离开——重连// websocket重连this.socketReconnect();}},// 向后端发送数据的回调onsendCallback: function () {console.log("WebSocket:发送信息给后端");},// 接收到消息的回调getMessageCallback: function (msg) {// console.log(msg);console.log(msg.data);if (msg.data.indexOf("HeartBeat") > -1) {// 心跳回复——心跳检测重置// 收到心跳检测回复就说明连接正常console.log("收到心跳检测回复");// 心跳检测重置this.heartCheck.reset().start();} else {// 普通推送——正常处理console.log("收到推送消息");let data = JSON.parse(msg.data);// 相关处理console.log(data);}},},
};
</script>
Linux中的心跳机制方案
心跳机制时,发送心跳包后判断设备是否离线
等待响应
发送心跳包后,需要等待对方设备的响应。可以设置一个合理的超时时间,如果在这个时间内没有收到响应,则可能表明对方设备有问题。
超时处理
如果在设定的超时时间内没有收到响应,应该认为对方设备可能离线或出现故障。这时,可以采取进一步的措施,如重试发送心跳包、记录日志、发送告警、尝试重新建立连接等。
重试机制
在确定对方设备离线之前,可以实施一定的重试机制。例如,连续几次心跳包均未得到响应后才判断为离线。这有助于避免因网络短暂抖动而错误地判断设备离线。
心跳包的响应内容
心跳响应不仅是一个简单的确认,有时可以包含设备的状态信息。通过分析这些信息,可以更准确地判断设备的健康状况。
多点检测
如果应用场景允许,可以从多个节点发送心跳包,以增加检测的可靠性。如果所有节点都无法接收到响应,那么可以更确定地判断设备离线。
整合监控系统
在大型系统中,心跳检测通常与监控系统整合,以实现更全面的状态监控和告警机制。
Netty保活机制
TCP层面的保活机制
TCP 协议本身提供了一个保活机制,通过在长时间未收到数据时向对端发送探测报文,以检测连接的状态。在 Netty 中,可以通过设置 childOption(ChannelOption.SO_KEEPALIVE, true) 来启用 TCP 层面的保活机制。
TCP长连接下,客户端和服务器若长时间无数据交互情况下,若一方出现异常情况关闭连接,抑或是连接中间路由出于某种机制断开连接,而此时另一方不知道对方状态而一直维护连接,浪费系统资源的同时,也会引起下次数据交互时出错。为了解决此问题,引入了TCP KeepAlive机制(并非标准规范,但操作系统一旦实现,默认情况下须为关闭,可以被上层应用开启和关闭)。其基本原理是在此机制开启时,当长连接无数据交互一定时间间隔时,连接的一方会向对方发送保活探测包,如连接仍正常,对方将对此确认回应。
TCP KeepAlive参数
KeepAlive为操作系统层面的参数.
tcp_keepalive_time (integer; default: 7200; since Linux 2.2)
在TCP保活打开的情况下,最后一次数据交换到TCP发送第一个保活探测包的间隔,即允许的持续空闲时长,或者说每次正常发送心跳的周期,默认值为7200s(2h)。
tcp_keepalive_probes (integer; default: 9; since Linux 2.2)
在tcp_keepalive_time之后,最大允许发送保活探测包的次数,到达此次数后直接放弃尝试,并关闭连接,默认值为9(次)。
tcp_keepalive_intvl (integer; default: 75; since Linux 2.4)
在tcp_keepalive_time之后,没有接收到对方确认,继续发送保活探测包的发送频率,默认值为75s。
sysctl net.ipv4.tcp_keepalive_time
sysctl net.ipv4.tcp_keepalive_intvl
sysctl net.ipv4.tcp_keepalive_probes
设置keepalive参数
vi /etc/sysctl.conf# 数据交互空闲600秒后发送保活数据
net.ipv4.tcp_keepalive_time=600
# 如果没有收到对方确认,继续发送保活探测包,间隔为60秒
net.ipv4.net.ipv4.tcp_keepalive_intvl=60
# 最大允许发送保活探测包的次数,到达此次数后直接放弃尝试,并关闭连接
net.ipv4.net.ipv4.tcp_keepalive_probes=20cat /etc/sysctl.conf
# 刷新配置
sysctl -p
查看TCP连接
netstat -anutp
参数含义:
-a 显示所有
-n 以ip形式显示当前建立的有效连接和端口
-u 显示UDP协议
-t 显示TCP协议
-p 显示对应PID与程序名
TCP KeepAlive报文格式
TCP KeepAlive探测报文是一种没有任何数据,同时ACK标志被置上的报文,报文中的序列号为上次发生数据交互时TCP报文序列号减1。比如上次本端和对端数据交互的最后时刻,对端回应给本端的ACK报文序列号为 N(即下次本端向对端发送数据,序列号应该为N),则本端向对端发送的保活探测报文序列号应该为 N-1。
TCP KeepAlive机制 的作用 是检测连接的有无(死活),但无法检测连接是否有效,如断网的时候。“连接有效”的定义 = 双方具备发送和接收消息的能力
KeepAlive机制无法代替心跳机制,需要在应用层自己实现心跳机制以检测长连接的有效性,从而高效维持长连接
Keep-Alive机制不会强制切断连接,如果连接存在但是一直不发生数据交互。Keep-Alive不会切断连接。而应用层实现的心跳检测 heartbeat_check 即便连接存在,但不产生数据交互的情况下,依然会强制切断连接。
IdleStateHandler
Netty 提供了一个名为 IdleStateHandler 的处理器,用于在一段时间内没有读取到数据或写入数据时触发事件。你可以通过将 IdleStateHandler 添加到 ChannelPipeline 中来实现自定义的空闲状态处理逻辑。这样就可以及时地检测连接的空闲状态,执行相应的处理操作,比如发送心跳消息或关闭连接。
定时任务
除了 IdleStateHandler 外,你还可以使用 Netty 提供的定时任务功能来实现保活机制。通过定时任务,你可以周期性地向对端发送心跳消息,以检测连接的状态。这种方式更加灵活,可以根据实际需求自定义心跳间隔和心跳消息内容