k8s部署skywalking(helm)

官方文档

  • 官方文档说明:Backend setup | Apache SkyWalking
  • 官方helm源码:apache/skywalking-helm
  • 官方下载(包括agent、apm):Downloads | Apache SkyWalking

部署

根据官方helm提示,选择你自己部署的方式,是放到私有仓库还是采用官方镜像仓库

在这里插入图片描述

服务端部署

helm配置文件

这里我们有现成的es,所以设置为false,不在部署新的es;

oap:image:repository: skywalking.docker.scarf.sh/apache/skywalking-oap-servertag: 9.7.0  # Must be set explicitlypullPolicy: AlwaysstorageType: elasticsearchenv:SW_CORE_RECORD_DATA_TTL: "7" # 设置记录数据的保留时间SW_CORE_METRICS_DATA_TTL: "7" # 经过聚合处理的指标数据的保留时间# 官方健康监测默认值是10s,太短了,会认为一直失败,导致重启startupProbe:tcpSocket:port: 12800failureThreshold: 9periodSeconds: 30resources:limits:cpu: 8memory: 8Girequests:cpu: 8memory: 4Gi
ui:image:repository: skywalking.docker.scarf.sh/apache/skywalking-uitag: 9.7.0  # Must be set explicitlypullPolicy: Alwaysingress:enabled: truepath: /hosts:- sky.example.com
elasticsearch:enabled: falseconfig:               # For users of an existing elasticsearch cluster,takes effect when `elasticsearch.enabled` is falsehost: es.xx.xxx.comport:http: 80user: "xxx"         # [optional]password: "xxx"     # [optional]

如果没有现成的es,需要部署新的,配置文件如下:

oap:
image:repository: skywalking.docker.scarf.sh/apache/skywalking-oap-servertag: 9.7.0  # Must be set explicitlypullPolicy: Always
storageType: elasticsearch
env:SW_CORE_RECORD_DATA_TTL: "7" # 设置记录数据的保留时间SW_CORE_METRICS_DATA_TTL: "7" # 经过聚合处理的指标数据的保留时间
# 官方健康监测默认值是10s,太短了,会认为一直失败,导致重启
startupProbe:tcpSocket:port: 12800failureThreshold: 9periodSeconds: 30
resources:limits:cpu: 8memory: 8Girequests:cpu: 8memory: 4Gi
ui:
image:repository: skywalking.docker.scarf.sh/apache/skywalking-uitag: 9.7.0  # Must be set explicitlypullPolicy: Always
ingress:enabled: truepath: /hosts:- sky.example.com
elasticsearch:enabled: truereplicas: 1minimumMasterNodes: 1nodeGroup: "single-node"persistence: enabled: trueinitResources:requests:memory: 2GiclusterHealthCheckParams: "wait_for_status=yellow&timeout=1s"volumeClaimTemplate:accessModes: [ "ReadWriteOnce" ]storageClassName: pvc-esresources:requests:storage: 512Gi

注意调整这两个参数,SW_CORE_RECORD_DATA_TTL和SW_CORE_METRICS_DATA_TTL。官方默认的是时间分别为3和7

开始部署

这里建议采用私有仓库部署,一方面是网络开销小,另一方面公有仓库存在一些问题(下面回答),这里只做demo演示,先暂时采用公有仓库部署

# helm chat 的版本
export SKYWALKING_RELEASE_VERSION=4.5.0
# helm 的 release name
export SKYWALKING_RELEASE_NAME=skywalking
# k8s 的命名空间
export SKYWALKING_RELEASE_NAMESPACE=tools# 部署
helm install "${SKYWALKING_RELEASE_NAME}" \oci://registry-1.docker.io/apache/skywalking-helm \--version "${SKYWALKING_RELEASE_VERSION}" \-n "${SKYWALKING_RELEASE_NAMESPACE}" -f ./values.yaml

这个时候,你会在k8s后台看到2个服务,一个是oap的,一个是ui的

Java项目集成

因为Java项目集成skywalking是通过agent集成的,所以需要从官网上下载agent包,对于部署方式,也存在下面几种种方式:

  • agent打入dockerfile镜像;
  • k8s sidecar方式,需要申请共享磁盘;
  • 当然,还有一种是本地开发环境连接线上服务端的场景。

在这里我们说一下第一种方式和本地调试。

Dockerfile

准备内容:

  • 从官方网站下载agent包到本地
  • 可执行的Java web项目
FROM  openjdk:8-jdk # 你们项目自身的环境,比如openjdk-8
LABEL maintainer="xx.xx@xxx.com"
COPY skywalking-agent-9.2.0 /opt/skywalking-agent-9.2.0# 时区问题
RUN ln -sf /usr/share/zoneinfo/Asia/Shanghai /etc/localtime
RUN echo "Asia/shanghai" > /etc/timezoneVOLUME /tmp
ADD spring-web-demo-1.0.0.jar app.jar
RUN sh -c 'touch /app.jar'
RUN ls -l
RUN ls -l /opt
RUN ls -l /opt/skywalking-agent-9.2.0/ENTRYPOINT ["sh", "-c", "java -javaagent:/opt/skywalking-agent-9.2.0/skywalking-agent.jar -Dskywalking.agent.service_name=sky-demo -Dskywalking.collector.backend_service=skywalking-skywalking-helm-oap.tools:11800 -Djava.security.egd=file:/dev/./urandom -jar /app.jar"]

参数解释:

-javaagent:/opt/skywalking-agent-9.2.0/skywalking-agent.jar:agent jar包

-Dskywalking.agent.service_name=sky-demo:skywalking中显示的服务名称

-Dskywalking.collector.backend_service=skywalking-skywalking-helm-oap.tools:11800:skywalking 服务端收集的端口

上述参数也可以通过k8s环境变量的方式实现,如下:

containers:  
- name: <example-name>image: <image>ports:- containerPort: <port>env:- name: VA_OPTSvalue: "-Dfile.encoding=utf-8 -Duser.timezone=UTC"- name: JAVA_TOOL_OPTIONSvalue: "-javaagent:/skywalking/agent/skywalking-agent.jar"- name: SW_AGENT_NAMESPACEvalue: "dev"- name: SW_AGENT_NAMEvalue: "dev::example-name"- name: SW_AGENT_COLLECTOR_BACKEND_SERVICESvalue: "skywalking-skywalking-helm-oap.skywalking.svc.cluster.local:11800"
k8s yaml文件
apiVersion: apps/v1
kind: Deployment
metadata:name: sky-demonamespace: toolslabels:app: sky-demo
spec:replicas: 1selector:matchLabels:app: sky-demotemplate:metadata:labels:app: sky-demospec:containers:- name: sky-demoimage: xxx/sky-demo:v1.5imagePullPolicy: IfNotPresentports:- containerPort: 9020resources:requests:memory: "512Mi"cpu: "200m"limits:memory: "4Gi"cpu: "2000m"

部署成功,即可在skywalking页面显示,下面来说另一种方式

本地调试

idea启动

以端口号为9020的商品服务为例,添加以下JVM启动参数

# skywalking客户端路径
-javaagent:E:\skywalking\skywalking-agent\skywalking-agent.jar
# 服务名称
-Dskywalking.agent.service_name=sky-demo
-Dskywalking.collector.backend_service=skywalking-skywalking-helm-oap.tools:11800

如图所示:

在这里插入图片描述

最终效果

在这里插入图片描述

该页面中包含四个标签页:Service、Topology、Trace、Log。

  • Service:微服务列表。类比eureka服务端的服务列表。在该列表中,发现其表格中包含了以下几列

    • Service Groups:服务分组。

      当我们启动服务时,在JVM启动参数中为其添加了skywalking的服务名称-Dskywalking.agent.service_name=sky-demo,如果需要为该服务指定分组,则需要以 分组名::服务名 配置服务名称。

      例如我们需要将商品服务的分组设置为test,则将该参数修改为-Dskywalking.agent.service_name=test::sky-demo。

    • Service Names:服务名称。

    • Load(calls/min):平均每分钟调用次数。

    • Success Rate(%):调用成功率。

    • Latency(ms):延迟。

    • apdex:应用性能指数。

  • Topology:服务拓扑图。

  • Trace:服务调用链路。

  • Log:服务调用日志。

查看服务实例

在这里插入图片描述

修改实例名称

由于skywalking生成的实例名称有默认规则,我们可以对其进行修改,以增加各个服务实例的辨识度。

在项目的JVM启动参数中添加配置:-Dskywalking.agent.instance_name=实例名称,且可以发现实例名称支持中文

踩坑点

本地调试连接不上skywalking 服务端,就是服务怎么都注册不上去!

  • 检查 skywalking-skywalking-helm-oap.skywalking.svc.cluster.local:11800 host和port是否正确

  • 检查k8s的ingress是否支持grpc,并且需要在ingress和ingress controller开启grpc。

如果开启了还是注册不上去,查看日志报错信息,在java客户端,找到agent的包,里面有个logs文件夹,进去查看具体报错详情。

运行一段时间后,发现服务端起不起来

报错信息为:

table: xxx does not exist. OAP is running in 'no-init' mode, waiting...

如果采用公有的helm部署,大概率会出现这种问题

这个是由于Skywalking的TTL失效bug引起,这种情况是es做了日志保存时间策略,导致数据删除,有两种解决方案:

  • 在es中删除skywalking相应的index和template,然后重启oap服务;

  • helm镜像仓库中添加以下内容:

    ui-deployment.yaml文件下添加:

    apiVersion: apps/v1
    kind: Deployment
    .
    .
    {{- end }}initContainers:{{- include "skywalking.containers.wait-for-storage" . | nindent 6 }}{{- include "skywalking.containers.oap-init-job" . | nindent 6 }}
    

    _helpers.tpl添加:

    # Template for oap init job container 
    {{- define "skywalking.containers.oap-init-job" -}}
    - name: oap-init-jobimage: {{ .Values.oap.image.repository }}:{{ required "oap.image.tag is required" .Values.oap.image.tag }}imagePullPolicy: {{ .Values.oap.image.pullPolicy }}env:- name: JAVA_OPTSvalue: "{{ .Values.oap.javaOpts }} -Dmode=init"{{- include "skywalking.oap.envs.storage" . | nindent 2 }}{{- range $key, $value :=  .Values.oap.env }}- name: {{ $key }}value: {{ $value | quote }}{{- end }}
    {{- end -}}
    

    官方issue:table: alarm_record does not exist. OAP is running in ‘no-init’ mode, waiting… retry 3s later. · Issue #4938 · apache/skywalking (github.com)

k8s服务端启动过程中,每次日志信息还没加载完,就重启,并且日志没有任何报错信息

解决方案:

startupProbe.periodSeconds尽量调大一点

oap:image:repository: skywalking.docker.scarf.sh/apache/skywalking-oap-servertag: 9.7.0  # Must be set explicitlypullPolicy: AlwaysstorageType: elasticsearchenv:SW_CORE_RECORD_DATA_TTL: "7" # 设置记录数据的保留时间SW_CORE_METRICS_DATA_TTL: "7" # 经过聚合处理的指标数据的保留时间# 官方健康监测默认值是10s,太短了,会认为一直失败,导致重启startupProbe:tcpSocket:port: 12800failureThreshold: 9periodSeconds: 30

拓展

sidecar方式

主要讲解在Kubernetes Pod initContainer 中执行Shell指令,将agent复制到共享磁盘里面,并且将 apm-trace-ignore-plugin.jar 插件拷贝至 plugins 文件夹,并配置需要忽略的路径。

apiVersion: apps/v1
kind: Deployment
metadata:namespace: dmp-ns1name: daoshop-user-centerlabels:app: daoshop-user-center
spec:selector:matchLabels:app: daoshop-user-centertemplate:metadata:labels:app: daoshop-user-centerspec:# refs: https://kubernetes.io/docs/tasks/configure-pod-container/configure-pod-initialization/initContainers:- name: dx-monitor-agent-sidecarimage: registry.dx.io/daocloud-dmp/dx-monitor-agent-sidecar:release-2.3.0-0b0cbd1imagePullPolicy: IfNotPresent# 将trace-ignore插件拷贝至`plugins`目录下。# 添加相关配置,这里将忽略追踪 `/api/sail/**` 为前缀的URL。command: - "sh"- "-c"- > mv /sidecar/skywalking/agent/optional-plugins/apm-trace-ignore-plugin-6.5.0-SNAPSHOT.jar /sidecar/skywalking/agent/plugins; echo 'trace.ignore_path=${TRACE_IGNORE_PATH:/eureka/**,/api/sail/**}' >> /sidecar/skywalking/agent/config/apm-trace-ignore-plugin.config; cp -r /sidecar /target; volumeMounts:- name: sidecarmountPath: /targetcontainers:- image: {{ daoshop-user-center.image }}name: daoshop-user-centerresources:requests:memory: "2048Mi"cpu: "500m"limits:memory: "2048Mi"cpu: "500m"ports:- containerPort: 18081env:- name: JAVA_OPTSvalue: "-javaagent:/sidecar/sidecar/skywalking/agent/skywalking-agent.jar" - name: SW_AGENT_NAMEvalue: apm-demo- name: SW_AGENT_COLLECTOR_BACKEND_SERVICES  value: dx-skywalking-oap-ng.dx-pilot.svc:11800volumeMounts:- name: sidecarmountPath: /sidecarvolumes:- name: sidecar  #共享agent文件夹emptyDir: {}
---
apiVersion: v1
kind: Service
metadata:name: daoshop-user-center
spec:type: NodePortports:- port: 18081selector:app: daoshop-user-center

参考链接

skywalking_理想万岁万万岁的博客-CSDN博客

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/pingmian/9042.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

Petalinux的使用——定制Linux系统

文章目录 配置petalinux运行环境petalinux设计流程 配置petalinux运行环境 Petalinux的安装在文章Ubuntu镜像源的更改及其Petalinux的安装中已经介绍&#xff0c;下面介绍petalinux运行环境的配置过程。 进入到petalinux的安装路径下&#xff0c;使用下面的命令对petalinux的运…

C语言洛谷题目分享(11)回文质数

目录 1.前言 2.题目&#xff1a;回文质数 1.题目描述 2.输入格式 3.输出格式 4.输入输出样例 5.题解 3.小结 1.前言 哈喽大家好&#xff0c;今儿继续为大家分享一道蛮有价值的一道题&#xff0c;希望大家多多支持喔~ 2.题目&#xff1a;回文质数 1.题目描述 因为 151 …

【用文本生成歌声】Learn2Sing 2.0——歌声转换算法即梅尔频谱详解

一. 频谱图与梅尔谱图的介绍 频谱图&#xff1a;频谱图可以理解为一堆垂直堆叠在一起的快速傅里叶变换结果。 1.1 信号 在进入频谱图模块之前&#xff0c;首先我们需要了解信号是什么。 信号就是某一特定量随时间变化&#xff0c;对于音频来说&#xff0c;这个特定的变化量就…

pytest教程-43-钩子函数-pytest_report_header

领取资料&#xff0c;咨询答疑&#xff0c;请➕wei: June__Go 上一小节我们学习了pytest_runtest_makereport钩子函数的使用方法&#xff0c;本小节我们讲解一下pytest_report_header钩子函数的使用方法。 pytest_report_header 钩子函数允许你在 pytest 的终端报告的头部添…

七、 数据出境安全评估申报需要多长时间?

《评估申报指南&#xff08;第二版&#xff09;》未区分数据处理者进行数据出境安全评估线上申报和线下申报整体所需时间。一般情况下&#xff0c;数据出境安全评估的申报时长周期如图所示&#xff1a; 根据《评估申报指南&#xff08;第二版&#xff09;》第二条的规定&#…

跨越智能建筑桥梁:西门子PLC无缝对接BACnet楼宇自动化系统化

智能楼宇每一个环节的互联互通都至关重要&#xff0c;而PLC&#xff08;可编程逻辑控制器&#xff09;作为自动化领域的基石&#xff0c;其与BACnet协议的融合无疑成为了构建智能楼宇神经系统的关键节点。今天&#xff0c;让我们深入探讨如何利用先进的PLC转BACnet协议网关&…

使用Python实现2048小游戏

使用Python实现2048小游戏源码分享。实现效果如下所示。 实现效果图 游戏开始效果图 游戏结束效果图 部分源码截图 下载链接 基于如下的运行环境。运行需要安装tkinter /Library/Frameworks/Python.framework/Versions/3.7/bin/python/bin/python /Users/nihui/Documents/P…

AI预测体彩排3第3套算法实战化赚米验证第1弹2024年5月5日第1次测试

从今天开始&#xff0c;准备启用第3套算法&#xff0c;来验证下本算法的可行性。因为本算法通过近三十期的内测&#xff08;内测版没有公开预测结果&#xff09;&#xff0c;发现本算法的预测结果优于其他所有算法的效果。彩票预测只有实战才能检验是否有效&#xff0c;只有真正…

电脑中的两个固态硬盘比一个好,想知道为什么吗

你当前的电脑很有可能有一个NVME SSD作为主驱动器&#xff0c;但可能至少还有一个插槽可以放另一个SSD&#xff0c;而且这样做可能是个好主意。 两个SSD可以提高性能 如果你有两个固态硬盘&#xff0c;你可以从中获得比有一个更好的性能。一种方法是使用RAID 0将两个驱动器组…

使用 PXE+Kickstart 批量网络自动装机

前言&#xff1a; 正常安装系统的话使用u盘一个一个安装会非常慢&#xff0c;所以批量安装的技术就出来了。 一、 概念 PXE &#xff08;Preboot eXecute Environment&#xff0c;预启动执行环境&#xff09;是由 Intel 公司开发的技术&#xff0c;可以让计算机通过网络来启动…

Calendar 366 II for Mac v2.15.5激活版:智能日历管理软件

在繁忙的工作和生活中&#xff0c;如何高效管理日程成为了许多人的难题。Calendar 366 II for Mac&#xff0c;作为一款全方位的日历管理软件&#xff0c;以其独特的功能和优秀的用户体验&#xff0c;成为您的日程好帮手。 Calendar 366 II for Mac支持多种视图模式&#xff0c…

【Java基础】设计模式——单例设计模式

单例设计模式&#xff08;Singleton Design Pattern&#xff09;是一种创建型设计模式&#xff0c;它确保⼀个类有且只有⼀个实例&#xff0c;并提供一个全局访问点来访问这个唯一实例。 单例模式主要解决的是&#xff0c;⼀个全局使⽤的类频繁的创建和消费&#xff0c;从⽽提…

vivado 低级别 SVF JTAG 命令

低级别 SVF JTAG 命令 注释 &#xff1a; 在 Versal ™ 器件上不支持 SVF 。 低级别 JTAG 命令允许您扫描多个 FPGA JTAG 链。针对链操作所生成的 SVF 命令使用这些低级别命令来访问链中的 FPGA 。 报头数据寄存器 (HDR) 和报头指令寄存器 (HIR) 语法 HDR length […

功率半导体测试挑战及应对方案详解

功率半导体是电子产业链中最核心的一类器件&#xff0c; 能够实现电能转换和电路控制作用。功率半导体包括功率半导体分立器件(含模块)以及功率IC等。其中&#xff0c;功率半导体分立器件按照器件结构可分为二极管、晶闸管和晶体管等。 以MOSFET、IGBT以及SiC MOSFET为代表的功…

【教学类-53-01】20240509“去掉背景的png彩色图片”转“黑色影子图”

作品展示 背景需求&#xff1a; 刚写完蒙德里安涂色学具&#xff0c;准备开课&#xff0c;转眼班级就“百日咳“”隔离3周&#xff0c;o(╥﹏╥)o 我的AI对话大师只剩1个月的有效期&#xff0c;剩下9万6千次也马上就作废了。 最后一个月可以尽量多用掉一些&#xff0c;我从小…

SpringBoot 扩展篇:ConfigFileApplicationListener源码解析

SpringBoot 扩展篇&#xff1a;ConfigFileApplicationListener源码解析 1.概述2. ConfigFileApplicationListener定义3. ConfigFileApplicationListener回调链路3.1 SpringApplication#run3.2 SpringApplication#prepareEnvironment3.3 配置environment 4. 环境准备事件 Config…

第十篇:数字堡垒:操作系统安全深度解析与实战指南

数字堡垒&#xff1a;操作系统安全深度解析与实战指南 1 *引言 1.1 数字世界的守护者 在遥远的比特海中&#xff0c;有一座名为“操作系统”的数字堡垒&#xff0c;它守护着我们的数据宝藏&#xff0c;确保每一次计算的航行都能安全抵达彼岸。然而&#xff0c;这片海域并非风…

2024年最新【SpringBoot2】开发实用篇-测试_springboot2 test(1),2024年最新2024春招BAT面试真题详解

既有适合小白学习的零基础资料&#xff0c;也有适合3年以上经验的小伙伴深入学习提升的进阶课程&#xff0c;涵盖了95%以上软件测试知识点&#xff0c;真正体系化&#xff01; 由于文件比较多&#xff0c;这里只是将部分目录截图出来&#xff0c;全套包含大厂面经、学习笔记、…

YOLOv5,YOLOv7改进之结合​SOCA

1.SOCA moudle结构图 2,YOLOv5,YOLOv7改进之结合​SOCA 1.配置common.py文件 #SOCA moudle 单幅图像超分辨率 class Covpool(Function):@staticmethoddef forward(ctx, input):x = inputbatchSize = x.data.shape[0]dim = x.data.shape[1]h = x.data.shape[2]w = x.data.sha…

docker Harbor私有仓库部署管理

搭建本地私有仓库&#xff0c;但是本地私有仓库的管理和使用比较麻烦&#xff0c;这个原生的私有仓库并不好用&#xff0c;所以我们采用harbor私有仓库&#xff0c;也叫私服&#xff0c;更加人性化。 一、什么是Harbor Harbor是VWware 公司开源的企业级Docker Registry项…