Kubernetes之路 3 - 解决服务依赖

摘要: 在容器服务的客户群中,一个经常被问起的问题就是如何处理服务间依赖。本文介绍了常见的解决方法来实现服务的依赖检查,还进一步用示例展示了如何利用init container, liveness/readiness探针等技术实现服务健康检查,依赖检查等等功能。


本系列文章记录了企业客户在应用Kubernetes时的一些常见问题

  • 第一篇:Java应用资源限制的迷思
  • 第二篇:利用LXCFS提升容器资源可见性
  • 第三篇:解决服务依赖

在容器服务的客户群中,一个经常被问起的问题就是如何处理服务间依赖。

在应用中,一个组件依赖指定的中间件服务和业务服务。在传统的软件部署方式中,应用启动、停止都要依照特定的顺序完成。

当采用 Kubernetes/Docker Swarm等容器编排技术在分布式环境下部署应用时,一方面不同组件之间并行启动无法保证其启动顺序,另一方面在应用运行时,其所依赖的服务实现有可能发生失败和迁移。如何解决容器之间的服务依赖就是一个非常常见的问题。

方法1 - 应用端服务依赖检查

我们可以在应用的启动逻辑中添加服务依赖检查逻辑,如果应用依赖的服务不可访问就重试,当错误超过一定次数后就自动退出。Kubernetes/Docker会根据所容器的重启策略(Restart Policy)在等待一段时间之后自动拉起。

下面就是一个简单的Golang应用示例,来检测所依赖的MySQL服务是否就绪。

  ...// Connect to database.hostPort := net.JoinHostPort(config.Host, config.Port)log.Println("Connecting to database at", hostPort)dsn := fmt.Sprintf("%s:%s@tcp(%s)/%s?timeout=30s",config.Username, config.Password, hostPort, config.Database)db, err = sql.Open("mysql", dsn)if err != nil {log.Println(err)}var dbError errormaxAttempts := 20for attempts := 1; attempts <= maxAttempts; attempts++ {dbError = db.Ping()if dbError == nil {break}log.Println(dbError)time.Sleep(time.Duration(attempts) * time.Second)}if dbError != nil {log.Fatal(dbError)}log.Println("Application started successfully.")...

注: 
"Fail Fast" (快速失败),是Design by Contract契约式设计的一种重要的原则,可以很好地保障系统的健壮性和可预测性。比如上文代码中,如果重试失败,就会由log.Fatal(dbError) 退出执行。而K8S/Docker的容器重启的回退机制可以保障不会因频繁拉起失败应用导致系统资源耗尽。

方法2 - 独立的服务依赖检查逻辑

在现实世界里,有些遗留应用或者框架无法进行调整。我们就会希望将依赖检查策略和应用逻辑进行解耦。

一个常见的方法是在容器的Dockerfile的启动脚本里加入相应的服务依赖检查逻辑,可以参见Docker文档获得更多信息。另一种方法是利用Kubernetes Pod自身机制添加依赖检查逻辑。

首先我们需要对Pod的生命周期有一定的理解,下图来自于 https://blog.openshift.com/kubernetes-pods-life/ 一文


首先在Pod中有三类容器

  • infra container: 这就是著名的pause容器
  • init container: 初始化容器 通常用于应用的初始化准备,只有等所有的初始化容器正常执行完毕之后,才会启动应用容器
  • main container: 应用容器

Kubernetes的最佳实践中,通常是利用初始化容器来进行依赖服务的检查。下面我们通过一个Wordpress的实例来展示其使用方法。

apiVersion: v1
kind: Service
metadata:name: mysql
spec:clusterIP: Noneports:- name: mysqlport: 3306selector:app: mysql
---
apiVersion: v1
kind: Service
metadata:name: wordpress
spec:ports:- name: wordpressport: 80targetPort: 80selector:app: wordpresstype: NodePort
---
apiVersion: apps/v1
kind: StatefulSet
metadata:name: mysql
spec:selector:matchLabels:app: mysqlserviceName: mysql replicas: 1template:metadata:labels:app: mysqlspec:containers:- name: mysqlimage: mysql:5.7env:- name: MYSQL_ALLOW_EMPTY_PASSWORDvalue: "true"livenessProbe:exec:command: ["mysqladmin", "ping"]initialDelaySeconds: 30periodSeconds: 10timeoutSeconds: 5readinessProbe:exec:# Check we can execute queries over TCP (skip-networking is off).command: ["mysql", "-h", "127.0.0.1", "-e", "SELECT 1"]initialDelaySeconds: 5periodSeconds: 2timeoutSeconds: 1
---
apiVersion: apps/v1
kind: Deployment
metadata:name: wordpress
spec:replicas: 1selector:matchLabels:app: wordpresstemplate:metadata:labels:app: wordpressspec:containers:- name: wordpressimage: wordpress:4ports:- containerPort: 80env:- name: WORDPRESS_DB_HOSTvalue: mysql- name: WORDPRESS_DB_PASSWORDvalue: ""initContainers:- name: init-mysqlimage: busyboxcommand: ['sh', '-c', 'until nslookup mysql; do echo waiting for mysql; sleep 2; done;']

我们在Wordpress Deployment的Pod定义中添加了initContainers,它会通过检查 mysql 域名是否可以解析来判断所依赖的mysql服务是否就绪。

同时,在MySQL StatefulSet中我们也引入了readinessProbe 和 livenessProbe探针,它们会判定是否MySQL进程已经业务就绪。在K8S中,只有健康的Pod才可以通过ClusterIP访问或者DNS解析。

$ kubectl create -f wordpress.yaml
service "mysql" created
service "wordpress" created
statefulset "mysql" created
deployment "wordpress" created
$ kubectl get pods
NAME                         READY     STATUS     RESTARTS   AGE
mysql-0                      0/1       Running    0          5s
wordpress-797655cf44-w4p87   0/1       Init:0/1   0          5s
$ kubectl get pods
NAME                         READY     STATUS     RESTARTS   AGE
mysql-0                      1/1       Running    0          11s
wordpress-797655cf44-w4p87   0/1       Init:0/1   0          11s
$ kubectl get pods
NAME                         READY     STATUS            RESTARTS   AGE
mysql-0                      1/1       Running           0          14s
wordpress-797655cf44-w4p87   0/1       PodInitializing   0          14s
$ kubectl get pods
NAME                         READY     STATUS    RESTARTS   AGE
mysql-0                      1/1       Running   0          17s
wordpress-797655cf44-w4p87   1/1       Running   0          17s
$ kubectl describe pods wordpress-797655cf44-w4p87
...

注:

  • Liveness探针:主要用于判断Container是否处于运行状态,比如当服务死锁或者响应缓慢等情况。
  • Readiness探针:主要用于判断服务是否已经正常工作。
  • 在init container中不允许使用readiness探针。
  • 如果Pod重启了,其所有init Container都需重新运行。

总结

本文介绍了常见的解决方法来实现服务的依赖检查,还进一步用示例展示了如何利用init container, liveness/readiness探针等技术实现服务健康检查,依赖检查等等功能。

Kubernetes提供了非常灵活的Pod生命周期管理机制,由于篇幅有限我们就不再展开介绍 postStart/preStop等生命周期钩子方法。

阿里云Kubernetes服务 全球首批通过Kubernetes一致性认证,简化了Kubernetes集群生命周期管理,内置了与阿里云产品集成,也将进一步简化Kubernetes的开发者体验,帮助用户关注云端应用价值创新。

原文链接

干货好文,请关注扫描以下二维码:



本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/521952.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

java并发访问_Java并发访问

1 线程安全线程安全就是多线程访问时&#xff0c;采用了加锁机制&#xff0c;当一个线程访问该类的某个数据时&#xff0c;进行保护&#xff0c;其他线程不能进行访问直到该线程读取完&#xff0c;其他线程才可使用。不会出现数据不一致或者数据污染。 线程不安全就是不提供数据…

3行代码实现ftp 上传、下载、删除操作集合

为了帮助小伙伴们便捷操作ftp&#xff0c;现对常用的上传、下载、删除功能进行封装&#xff0c;小伙伴只需要传入需要的参数操作即可&#xff01;告诉小伙伴好消息&#xff0c;本项目我已开源&#xff0c;大家可以根据需要克隆run起来&#xff01;&#xff01;&#xff01; 文章…

Logtail从入门到精通(一):日志采集杂谈

摘要&#xff1a; 目前logtail已承载阿里云全站、所有云产品服务、全球各Region部署、阿里巴巴集团&#xff08;淘宝、天猫、菜鸟等&#xff09;上重要服务的数据采集。每天采集接近百万服务器上数PB的实时数据&#xff0c;对接数千个应用与消费者。什么是日志提到日志&#xf…

互联网大佬马老师于昨日教师节正式卸任,让位现任CEO张勇;华为发布新一代CloudLink视讯解决方案,普惠4K+AI;联通……...

关注并标星星CSDN云计算极客头条&#xff1a;速递、最新、绝对有料。这里有企业新动、这里有业界要闻&#xff0c;打起十二分精神&#xff0c;紧跟fashion你可以的&#xff01;每周三次&#xff0c;打卡即read更快、更全了解泛云圈精彩newsgo go go OPPO Reno2正式发布&#xf…

python输出不重复的单词_Python情感分析(比较单词时,不计算文本中重复的单词)...

您可以使用嵌套的for loop来实现这一点&#xff0c;但是这并不是解决简单问题的好方法&#xff1a;for posWord in posWords:for test in readFile:if i test:counter 1print iprint(counter)这并不是分析情绪的有效方法&#xff0c;相反&#xff0c;你只是在检查文本中是否存…

Logtail从入门到精通(二):开启日志采集之旅

摘要&#xff1a; 为了更好的了解日志采集&#xff0c;这里我们首先对日志采集中遇到的基本概念进行简要的介绍。Logtail相关概念为了更好的了解日志采集&#xff0c;这里我们首先对日志采集中遇到的基本概念进行简要的介绍。概念介绍项目&#xff1a; 项目&#xff08;Project…

java数组下标越界_在java中,解决数组下标越界的问题

//获取文本内容publicstaticListgetText(StringfilePath){ListsimplesnewArrayList();try{FileReaderreadernewFileReader(filePath);BufferedReaderbfRead...// 获取文本内容public static List getText(String filePath) {List simples new ArrayList();try {FileReader read…

vsftpd常用操作

适用于Centos7.x 作用命令启动systemctl start vsftpd.service关闭systemctl stop vsftpd.service重启systemctl restart vsftpd.service查看运行状态systemctl status vsftpd.service设置开机启动systemctl enable vsftpd.service在线安装yum install -y vsftpd源码安装rpm -…

关于SDN的未来,Linux基金会专访阿里云网络大神

摘要&#xff1a; 近日&#xff0c;大家熟知的国际开源组织Linux基金会与阿里云进行了一次访谈。专访了阿里云网络团队掌门人江鹤。江鹤执掌阿里云网络产品线&#xff0c;并负责阿里集团网络虚拟化产品的研发管理工作。在软件定义网络&#xff08;SDN&#xff09;和网络功能虚拟…

5G 共建共享,究竟会带来什么影响?

戳蓝字“CSDN云计算”关注我们哦&#xff01;共建共享真的来了。根据9月9日中国联通发布的公告&#xff0c;中国联通和中国电信正式签署了《5G网络共建共享框架合作协议书》&#xff0c;将在全国范围内合作共建一张5G接入网络。图片来源网络小枣君认为&#xff0c;这一事件对于…

java 纳秒 毫秒_golang的time包:秒、毫秒、纳秒时间戳输出方式

菜鸟的时候只知道时间戳有10位、13位、还有好长位数的。入坑久了才明白10位数的时间戳是以 秒 为单位&#xff1b;13位数的时间戳是以 毫秒 为单位&#xff1b;19位数的时间戳是以 纳秒 为单位&#xff1b;golang中可以这样写&#xff1a;package mainimport ("time"…

object转float_人工智能-Object Detection API 模型转tflite并验证

最近在用TensorFlow Object Detection API训练目标检测模型&#xff0c;训练好的pb模型大小17.6M&#xff0c;用pb预测效果不错&#xff0c;于是想着如何在手机端运行&#xff0c;查看官网关于tflite的转换&#xff0c;网址&#xff1a;https://github.com/tensorflow/models/b…

Multi Task Learning在工业界如何更胜一筹

摘要&#xff1a; 本文主要介绍多任务学习和单任务学习的对比优势以及在工业界的一些使用。如何从单任务学习转变为多任务学习&#xff1f;怎样使AUC和预估的准确率达到最佳&#xff1f;如何对实时性要求较高的在线应用更加友好&#xff1f;本文将以淘宝实例为大家进行分享多任…

rsync一行代码实现远程文件同步之修改默认22端口

由于需求需要把应用服务器上的日志文件同步到文件服务器上&#xff0c;但是又不能用22端口 文章目录一、应用服务器脚本修改如下二、文件服务器操作三、执行脚本测试四、应用服务器生成ssh key五、文件服务器添加key5.1. 打开.ssh文件夹目录&#xff1a;5.2. 创建authorized_ke…

上云难?TA霸气回应:不要你觉得,一键上云 so easy!

戳蓝字“CSDN云计算”关注我们哦&#xff01;图片来源网络2019年阿里提出的“All in Cloud”战略以及《全球云计算 IT 基础设施市场预测报告》的数据结果&#xff0c;都在表明企业上云已成不可逆之势&#xff1b;但上云事故接二连三发生似乎又在宣示企业上云之路道阻且长&#…

基于阿里云HiTSDB搭建工业物联网平台实践

摘要&#xff1a; 基于阿里云全面的物联网、云计算与大数据技术搭建云端的企业能源管理物联网平台实现能耗数据采集、统计分析、平衡调度、节能优化等全面的能源管控协同平台。是企业生产运行保障的利器&#xff0c;也是大量企业实现云上管理的实践案例。背景工业企业的能耗占了…

java对象深克隆_JAVA中对象的克隆及深拷贝和浅拷贝

使用场景&#xff1a;在日常的编程过程 中&#xff0c;经常会遇到&#xff0c;有一个对象OA&#xff0c;在某一时间点OA中已经包含了一些有效值 &#xff0c;此时可能会需一个和OA完全相对的新对象OB&#xff0c;并且要在后面的操作中对OB的任何改动都不会影响到OA的值&#xf…

python安装pyserial模块_Python使用模块Pyserial模块报

用pip安装pyserial后:sudo -H pip install pyserial&#xff0c;运行新建的程序&#xff0c;名称为serial.py&#xff0c;程序中用到:import serial.toos.list_ports,但总是提示ImportError:No module named tools.list_ports&#xff0c;在度娘一顿乱搜后&#xff0c;在stack…

阿里巴巴开源的通用缓存访问框架JetCache介绍

摘要&#xff1a; JetCache是由阿里巴巴开源的通用缓存访问框架&#xff0c;如果你对Spring Cache很熟悉的话&#xff0c;请一定花一点时间了解一下JetCache&#xff0c;它更好用。JetCache可以做类似Spring Cache的注解式缓存&#xff0c;支持TTL、多级缓存、分布式自动刷新&a…

mysql数据库的总结

https://blog.csdn.net/LanlanDeming/article/details/103786146