【项目001】运维工程师项目实践:高可用性云基础设施部署与升级项目

目录

项目名称

项目背景

项目目标

项目成果

我的角色与职责

我主要完成的工作内容

本次项目涉及的技术

本次项目遇到的问题与解决方法

本次项目中可能被面试官问到的问题

1、什么是ELK?

2、什么是Elasticsearch、Logstash 和Kibana?

3、ELK 三个组件 如何协同工作?

4、你们公司采用的虚拟化平台是哪一个?

5、你们本次项目共多少人?

6、你们本次项目共使用了多少台虚拟机,配置分别是什么样的?

经验教训与自我提升

展望未来


项目名称

项目简称或代号:CUO(这个可以自己随便编一个,每个公司的每个项目简称或代号都是内部任意起名的,显得专业一点,一般是项目关键词的首拼,比如这个CUO是:comprehensive upgrade and optimization)

项目全名:高可用性云基础设施部署与升级项目

项目背景

随着公司业务的迅速扩张,对数据中心的可靠性和性能要求越来越高。为了应对这一挑战,公司决定对现有的IT基础设施进行升级,构建一个基于云计算的高可用性平台。作为运维团队的一员,我深度参与了这一项目的规划、实施和优化工作。

项目目标

  1. 构建一个稳定、可靠、可扩展的云计算平台,支持公司业务的快速增长。

  2. 实现自动化部署和监控,提高运维效率。(比如日志监控采用ELK,服务器性能及网络流量等监控采用Prometheus+grafana监控,对于这两个监控平台的部署和相面试官考察时候只需要能大概说一下这两个监控平台的原理、功能就可以了)

  3. 优化系统性能,确保关键业务应用的稳定运行。

项目成果

  1. 成功构建了一个基于云计算的高可用性平台,为公司业务的快速增长提供了有力支持。

  2. 实现了自动化部署和监控,提高了运维效率,降低了人力成本。

  3. 通过对系统性能的优化,确保了关键业务应用的稳定运行,提高了客户满意度。

我的角色与职责

  1. 需求分析:与业务团队紧密合作,了解业务需求和技术要求,为云平台的规划和设计提供有力支持。

  2. 架构设计:参与云平台的整体架构设计,包括网络、存储、计算和安全等方面的规划。

  3. 系统部署:负责云平台的搭建和部署工作,包括虚拟化环境的配置、操作系统的安装、应用软件的部署等。

  4. 自动化脚本编写:编写自动化脚本,实现服务器的批量部署、配置和更新,提高运维效率。

  5. 监控与告警:配置和管理监控系统,实时监控云平台的运行状态,及时发现并处理潜在问题。同时,设置告警机制,确保关键业务应用的稳定运行。

  6. 性能优化:分析系统性能瓶颈,制定优化方案并实施,提高系统的整体性能。

  7. 文档编写:编写运维手册、操作指南等文档,为团队成员提供技术支持和参考。

我主要完成的工作内容

  1. 需求分析与文档编写

    • 与业务团队和开发团队进行深入沟通,明确业务需求和技术要求。

    • 编写项目需求文档,明确项目目标、范围、时间表和关键里程碑。

  2. 云平台架构设计

    • 根据业务需求和技术要求,设计云平台的整体架构,包括网络、存储、计算和安全等方面的规划。

    • 制定详细的架构图和设计文档,为后续的部署和运维提供指导。

  3. 系统部署与配置

    • 负责云平台的服务器、网络设备和存储设备的部署和配置工作。

    • 安装和配置虚拟化环境,包括虚拟机管理器和虚拟机模板的创建。

    • 部署操作系统和应用软件,并进行必要的配置和优化。

  4. 自动化脚本编写

    • 编写自动化脚本,实现服务器的批量部署、配置和更新。

    • 开发自动化监控和告警脚本,确保系统稳定运行。

  5. 性能监控与优化

    • 配置和管理监控系统,实时监控云平台的运行状态和性能指标。

    • 分析系统性能瓶颈,制定优化方案并实施,如调整系统参数、优化数据库查询等。

  6. 文档编写与技术支持

    • 编写运维手册、操作指南等文档,为团队成员提供技术支持和参考。

    • 参与内部培训和知识分享活动,提升团队整体技能水平。

本次项目涉及的技术

  1. 虚拟化技术:使用VMware或KVM等虚拟化技术搭建和管理虚拟机环境。

  2. 自动化工具:利用Ansible、Shell脚本等实现自动化部署、配置和监控。

  3. 监控工具:使用Zabbix、Prometheus等监控工具实时监控系统的运行状态和性能指标。

  4. 存储技术:涉及NFS、SAN、NAS等存储技术的配置和管理。

  5. 网络技术:包括VLAN、VPN、负载均衡等网络技术的配置和优化。

(关于这些技术知识点,只需要网上搜索各个技术点的基本原理等就可以了。面试官提问时候能回答上个一二三基本就差不多了,面试官也不会深入提问的,如果有些技术被提问了你不会回答,就说这一部分工作内容是另一个同事做的)

本次项目遇到的问题与解决方法

  1. 问题

    :虚拟机性能不足,影响业务应用运行。

    • 解决方法:调整虚拟机资源配置,如增加CPU、内存和存储资源。同时,对虚拟机进行优化,如关闭不必要的服务和应用,减少资源消耗。

  2. 问题

    :监控系统告警频繁,导致误报率较高。

    • 解决方法:对监控系统的阈值进行调整和优化,减少误报率。同时,对告警进行分类和优先级划分,确保重要告警能够及时得到处理。

  3. 问题

    :自动化脚本执行失败,导致部署和配置失败。

    • 解决方法:对自动化脚本进行调试和修改,确保脚本的正确性和健壮性。同时,对执行环境进行排查和修复,确保脚本能够正常运行。

  4. 问题

    :网络延迟较高,影响业务应用性能。

    • 解决方法:对网络设备和配置进行排查和优化,如调整路由策略、优化网络带宽等。同时,与网络团队紧密合作,确保网络环境的稳定性和可靠性。

  5. 问题

    :存储资源不足,无法满足业务需求。

    • 解决方法:扩展存储资源,如增加存储设备、优化存储架构等。同时,对存储资源进行合理规划和分配,确保资源的充分利用和高效运行。

本次项目中可能被面试官问到的问题

1、什么是ELK?

答:ELK 是三个开源项目的首字母缩写:Elasticsearch、Logstash 和 Kibana。这些项目通常一起使用来构建一个集中的日志管理和分析系统

2、什么是Elasticsearch、Logstash 和Kibana?

答:

  1. Elasticsearch

    • Elasticsearch 是一个基于 Lucene 的搜索和分析引擎。它提供了全文搜索、结构化搜索、分析以及实时分析的能力。

    • Elasticsearch 是一个分布式系统,设计用于处理大规模数据,支持水平扩展和容错。

    • 它通常用于存储、搜索和分析日志、监控数据、时间序列数据等。

  2. Logstash

    • Logstash 是一个数据收集、处理和转发的管道。它可以接收来自各种来源的数据(如文件、数据库、网络等),然后对其进行处理(如解析、转换、过滤等),最后将处理后的数据发送到其他系统(如 Elasticsearch)。

    • Logstash 使用灵活的配置文件来定义数据流,可以轻松地修改和扩展以处理各种数据格式和场景。

    • Logstash 也可以与 Elasticsearch 和 Kibana 一起使用,形成一个完整的日志管理解决方案。

  3. Kibana

    • Kibana 是一个数据可视化和分析平台,专门为 Elasticsearch 设计。它提供了一个用户友好的界面,用于浏览、搜索、分析和可视化存储在 Elasticsearch 中的数据。

    • Kibana 提供了各种可视化选项,如图表、表格、地图等,可以帮助用户更好地理解数据。

    • Kibana 还支持自定义仪表板,允许用户根据自己的需求创建和保存复杂的可视化布局。

3、ELK 三个组件 如何协同工作?

  • Logstash 负责从各种来源收集日志数据,并进行必要的处理和转换。

  • 处理后的数据被发送到 Elasticsearch 进行存储和索引。

  • Kibana 从 Elasticsearch 中检索数据,并提供用户友好的界面进行搜索、分析和可视化。

通过这种方式,ELK Stack 提供了一个完整的日志管理解决方案,可以帮助组织更好地理解和利用他们的日志数据。

4、你们公司采用的虚拟化平台是哪一个?

答:VMware ESXI虚拟化平台,部署简单、可视化界面对虚拟机管理方便。

流程:购买物理服务器,然后下载VMware ESXI的iso镜像包,找VMware官方购买授权证书。通过U盘将VMware ESX镜像刻一个启动盘,用U盘给服务器装VMware ESXI虚拟化系统,然后在配置ip地址。这样就可以通过笔记本上下载个VMware ESXI客户端连接上这台服务器,在这台服务器上安装多个虚拟机。

5、你们本次项目共多少人?

答:共5人

一个项目经理、1个业务开发工程师、1个测试工程师、2个运维工程师

6、你们本次项目共使用了多少台虚拟机,配置分别是什么样的?

答:共44台虚拟机

23台虚拟机:用来部署公司业务服务的。公司的服务是分布式部署的(就是一个软件由多个组件组成,然后每个组件都是拆开单独部署在一台虚拟机上,然后通过ip端口或其他策略来实现把这些组件都串起来组成完整的服务,大概就是这么个意思),公司有两个服务,一个是C开发的服务共10个组件,分别部署在10台虚拟机上,每台服务器2核心4G配置。还有一个是JAVA开发的服务共13个组件,分别部署在13台虚拟机上,因为JAVA服务比较吃内存,所以每台虚拟机为2核8G配置。

8台mysql虚拟机:用来存储数据、公司服务数据一共存储在4个库中,每台mysql中创建了一个库。每个库中有几十上百张表。每个数据库都做了主备架构,分别为8核16G

3台redis虚拟机:用来做mysql的中间件,进行数据缓存的,以减轻mysql压力分别为8核16G

2台LB负载均衡虚拟机,用来负责流量分发分别为8核心16G

2台nginx虚拟机:用来搭建web页面,代理后端业务虚拟机。分别为4核8G

3台ELK虚拟机:Elasticsearch 消耗两台,因为Elasticsearch 主要用来存储数据,LK两个服务部署在同一台机器上分别为2核4G

1台性能监控虚拟机:用来部署Prometheus和grafana服务.4核心8G。

7、本次升级项目中你们你们数据备份是通过什么命令实现的?

mysql数据是通过mysqldump命令进行数据备份的

Elasticsearch 是通过elasticdump命令进行数据备份的

8、你们数据量有多大?是怎么迁移的?

总数据量大概有10TB左右,用linux命令进行迁移太过耗时,可能得好几天。所以是用的第三方工具。

经验教训与自我提升

  1. 在项目过程中,我深刻体会到了团队协作的重要性。与业务团队、开发团队等成员的紧密合作是项目成功的关键。

  2. 不断学习和掌握新技术是运维工程师的必修课。通过参与这个项目,我深入了解了云计算、自动化运维等前沿技术,并不断提升自己的技能水平。

  3. 在遇到问题时,保持冷静和耐心是解决问题的关键。同时,及时总结和分享经验教训也是提高团队整体能力的重要途径。

展望未来

随着云计算、大数据等技术的不断发展,运维工程师的角色和职责也在不断变化。未来,我将继续学习和掌握新技术,提高自己的专业技能和综合素质,为公司的发展贡献更多力量。同时,我也期待与更多优秀的团队成员一起合作,共同推动公司IT基础设施的升级和优化工作。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/web/11269.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

echarts树图 改文本显示的地方的样式

树图改文本显示的时候的样式 虽然有点越改越丑 其中有一些失败的尝试 forammter 无法识别html元素 所以对于tooptips有用的html元素定义获取返回在这里写的话是不生效的 rich配置项里面的backgroundColor官方说支持 html元素和canvas元素 已经图片url 没有详细试验 官网地址 h…

【chisel】如何用chisel写一个上升沿检测程序

自定义上升沿检测 class RisingEdgeDetector extends Module {val io IO(new Bundle {val inSig Input(Bool())val outSig Output(Bool())val clock Input(Clock())})// 定义 risingedge 函数def risingedge(x: Bool): Bool x && !RegNext(x)// 使用 risingedge …

代码签名证书的重要作用及申请途径

代码签名技术是一种确保软件完整性和来源可信度的安全措施。它通过数字证书和加密算法为软件代码或可执行文件加上一个“签名”,以此验证软件未被篡改,并确认其来源于可信赖的开发者。 一、代码签名证书的重要作用 1、提高下载率和安装率:用…

Linux提权--Rsync(未授权访问) Docker 组挂载

免责声明:本文仅做技术学习与交流... 目录 Rsync(未授权访问) 介绍: 靶场及过程: 提权过程: Docker 组挂载 原理: 复现: 利用: 具体操作: 1-确定是否有docker服务 2-查看用户是否在docker组里面 3-执行命…

包管理工具npm、cnpm、yarn、NVM

文章目录 npmnpm基本使用npm搜索包生产环境与开发环境开发依赖与生产依赖全局安装环境变量Path安装包依赖安装指定版本的包、删除依赖配置命令别名 cnpm安装操作命令:配置 yarnyarn安装及常用命令yarn 配置淘宝镜像 NVM使用常用命令 扩展内容npm和yarn的选择npm发布…

USB转串口芯片CH341、CH372、CH374、CH375等的电路及 PCB 设计的重要注意事项

前言 USB芯片的电路和PCB设计参考及注意事项,含CH34X、CH37X等系列芯片的电路设计说明。涉及工作稳定性和抗干扰以及USB-HOST带电热插拔。基于 USB 芯片的电路及 PCB 设计的重要注意事项 版本:2E 1、摘要 本文主要针对以下因电路及 PCB 设计不佳而引起…

文档解析与向量化技术加速多模态大模型训练与应用

前言 随着人工智能技术的不断发展,多模态大模型作为一种新型的机器学习技术,逐渐成为人工智能领域的热点话题。多模态大模型能够处理多种媒体数据,如文本、图像、音频和视频等,并通过学习不同模态之间的关联,实现更加…

Q1咖啡机行业线上市场(京东天猫淘宝)销售数据分析

回顾疫情那几年,咖啡机市场可能是大环境带动下爆发飞速的品类之一。在整体厨房小家电大盘销售不佳的情况下, 咖啡机市场的表现是亮眼的。而今年Q1季度,在厨卫小电市场整体低迷的状态下,咖啡机市场依然保持着稳中向好的趋势。 根据…

Windows 命令修改时间

Windows 命令修改时间 运行w32tm /resync, 显示“此计算机没有重新同步,因为没有可用的时间数据”, 运行w32tm /query /source , 显示“Local CMOS Clock”,表示正在使用的是主板上的时间,没有使用外部…

树莓派|连接CSI接口摄像头+opencv

CSI(Camera Serial Interface)接口摄像头是一种常见的嵌入式系统或移动设备中使用的摄像头接口。它通常用于与处理器或图像传感器进行直接连接,实现高速的图像数据传输。 CSI接口摄像头具有以下特点: 高速传输:CSI接口…

Spring MVC(五) 文件上传

1 单文件上传 在程序开发中,有时候需要上传一些文件。我们在学习Servlet的时候,也做过文件上传的操作,只不过基于Servlet的文件上传操作起来过于复杂,因此所有的MVC框架都提供了自己的文件上传操作,基本上都是基于File…

UE5 FARFilter筛选器使用方法

UE5 查找资源时可以用FARFilter进行筛选,之前可以用ClassNames进行筛选,但是5.1之后就弃用这个属性改成ClassPaths属性 构造一个FTopLevelAssetPath对象需要两个FName参数,但是没找到应该传什么 查找官方文档,明显是错误的&#x…

AAAI: Generalized Singular Value Thresholding论文阅读

1 Abstract 这篇论文研究了与非凸函数g相关的广义奇异值阈值(Generalized Singular Value Thresholding, GSVT)算子Proxσ g (),定义为 P r o x g σ ( B ) arg ⁡ min ⁡ X ∑ i 1 m g ( σ i ( X ) ) 1 2 ∥ X − B ∥ F 2 , \mathbf{Prox}_{g}^{\sigma}(\mat…

Python学习-Numpy-1

学习参考链接: Numpy的介绍和安装和性能对比_哔哩哔哩_bilibili Numpy相对List的优势和特点 1、Numpy的数据结构是array数组 2、相较List的性能更好,并且包含大量的便捷的函数,以及数组中元数据的信息 3、array的数据类型必须一致&#xff0c…

实验名称:TCP 连接管理

目录 实验目的: 实验原理: 实验步骤: 1) 启动WireShark,设置抓包状态 2) 访问指定服务器 ,通过Wireshark抓取通信数据报文 3) 分析TCP连接建立的三次握手和连接释放的四次握手过程 原始数据记录: 实…

微信小程序生命周期揭秘:从启动到消亡的全过程剖析【附代码】

微信小程序生命周期揭秘:从启动到消亡的全过程剖析 一、小程序生命周期概览核心生命周期函数 二、深入理解生命周期回调2.1 onLoad: 首次亮相的准备2.2 onShow: 重登舞台的瞬间2.3 onReady: 舞台就绪,静待表演2.4 onHide & onUnload: 谨慎离场&#…

【数据结构陈越版笔记】第1章 概述【习题】

1. 碎碎念 我这答案做的可能不对,如果不对,欢迎大家指出错误 2. 答案 1.1 判断正误 (1) N ( log N ) 2 N(\text{log}N)^{2} N(logN)2是 O ( N 2 ) O(N^{2}) O(N2)的。 (2) N 2 ( log N ) 2 N^{2}(\text…

蓝桥杯备战12.阶乘

P5739 【深基7.例7】计算阶乘 - 洛谷 | 计算机科学教育新生态 (luogu.com.cn) 递归 #include<bits/stdc.h> #define endl \n #define int long long using namespace std; const int N 2e710,M 1e310; double a[N]; int jie(int n) {if(n1)return 1;else return n*ji…

HTML/CSS3

1.CSS CSS的作用在于在HTML的基础上(决定网页的内容和结构)对网页进行排版布局 对网页中的元素提供样式 使得网页显得更加精美CSS全称是cascading style sheets 即层叠样式表CSS样式的书写格式&#xff1a;样式名: 样式值 例如&#xff1a;color: red建议:之后进行空格 CSS样式…

AXI Interconnect IP核的连接模式简介

AXI Interconnect IP核内部包含一个 Crossbar IP核&#xff0c;用于在 Slave Interfaces&#xff08;SI&#xff09;和 Master Interfaces&#xff08;MI&#xff09;之间路由传输。在连接 SI 或 MI 到 Crossbar 的每条路径上&#xff0c;可以选择性地添加一系列 AXI Infrastru…