如何理解运维

运维工程师
(运营),负责维护并确保整个服务的高可用性,同时不断优化系统架构提升部署效率,优化资源利用率提高整体的投资回报率。
运维工程师面对的最大挑战是大规模集群的管理问题,如何管理好几十万台服务器上的服务,同时保障服务的高可用性,是运维工程师面临的最大挑战。
中文名运维工程师外文名操作技能服务器,操作系统,数据库应用网络,服务器

  • 目录
  • 1职责
  • 2工作内容
  • 3能力要求
  • ▪基础技能:
  • ▪加分技能:
  • 4软素质要求
  • 5职业发展
  • 6前景

职责
    无论做什么运维,运维工程师最基本的职责都是负责服务的稳定性,确保服务可以7 * 24H不间断地为用户提供服务在此之上运维工程师的主要工作职责如下:
    质量:保障并不断提升服务的可用性,确保用户数据安全,提升用户体验。
    效率:用自动化的工具/平台提升软 在研发生命周期中的工程效率。
    成本:通过技术手段优化服务架构,性能调优;通过资源优化组合降低成本,提升ROI。
    从产品的生命周期来看:
    1.产品发布前:负责参与并审核架构设计的合理性和可运维性,以确保在产品发布之后能高效稳定的运行
    2。产品发布阶段:负责用自动化的技术或者平台确保产品可以高效的发布上线,之后可以快速稳定迭代。
    3.产品运行维护阶段:负责保障产品7 * 24H稳定运行,在此期间对出现的各种问题可以快速定位并解决;在日常工作中不断优化系统架构和部署的合理性,以提升系统服务的稳定性。
工作内容
    在软件产品的整个生命周期中运维职业:工程师都需要适时地参与并发挥不同的作用英文,因此运维工程师的工作内容和方向非常多:
    事件管理:目标是在服务出现异常时尽可能快速的恢复服务,从而保障服务的可用性;同时深入分析故障产生的原因,推动并修复服务存在的问题,同时设计并开发相关的预案以确保服务出现故障时可以高效的止损在这方面主要工作内容有:
    问题发现:设计并开发高效的监控平台和告警平台,使用机器学习,大数据分析等方法对系统中的大量监控数据进行汇总分析,以期在系统出现异常的时候可以快速的发现问题和判断故障的影响。
    问题处理:设计并开发高效的问题处理平台和工具,在系统出现异常的时候可以快速/自动决策并触发相关止损预案,快速恢复服务。
    问题跟踪:通过分析问题发生时系统的各种表现(日志,变更,监控)确定问题发生的根本原因,制定并开发预案工具。
    变更管理:以可控的方式,尽可能高效的完成产品功能的迭代的变更工作在这方面运主要工作内容有:
    配置管理:通过配置管理平台(自研,开源)管理服务涉及到的多个模块,多个版本的关系以及配置的准确性。
    发布管理:通过构建自动化的平台确保每一次版本变更可以安全可控地发布到生产环境。
    容量管理:在服务运行维护阶段,为了确保服务架构部署的合理性同时掌握服务整体的冗余,需要不断评估系统的承载能力,并不断优化之在这方面主要工作内容有:
    容量评估:通过技术手段模拟实际的用户请求,测试整个系统所能承担的最大吞吐;通过建立容量评估模型分析压力测试过程中的数据以评估整个服务的容量。
    容量优化:基于容量评估数据,判断系统的瓶颈并提供容量优化的解决方案比如通过调整系统参数,优化服务部署架构等方法来高效的提升系统容量。
    架构优化:为了支持产品的不断迭代,需要不断的进行架构优化调整以确保整个产品能够在功能不断丰富和复杂的条件下,同时保持高可用性。
能力要求
  基础技能:
    精通壳/ Python的/ Perl的等1至2种编程语言
    熟练掌握常用数据结构状语从句:算法,并能灵活运用
    熟悉基础网络知识
    深入理解的Linux操作系统
  加分技能:
    熟悉开源的监控平台工具,比如:神经节,Nagios的等
    熟练掌握外壳脚本熟悉awk中,桑达基础等工具
    熟悉分布式计算或者存储系统- ,比如Hadoop的/ HBASE /暴等
    熟悉学习机器原理能付诸实践者更佳
    熟悉TCP / IP,HTTP等网络协议,精通插座编程网络
软素质要求
    强烈的责任心与主动性,对所负责工作有所有者意识,并自我能驱动成长
    能承担较大工作压力,有较强独立分析,问题解决能力的
    工作中需要胆大心细,探索具备创新精神
职业发展
    运维人员的要求特别严苛,因为运维人员针对不同的问题,需要不断的补充扩大自己的知识和研究范畴。
    在初级阶段,优秀运维人员会体现出格外出众的主动性和责任心,面对陌生的业务会主动学习和拓展自己对业务对认识和相应的知识范畴,以能够足够的胜任业务的独立维护。
    在逐步的发展阶段中,注重总结反省的工程师会逐渐成长为高阶运维人员,通常他们会有比较体系化的服务运维理解。也有一部分工程师由于出色的项目管理规划能力,逐渐成为项目经理。
    再进一步的发展,高阶的运维人员对于产品的理解将非常的透彻,因而在这种情况下,高阶运维人员甚至可以成为产品的产品经理,产品研发的咨询顾问,在产品功能的设计与开发中起到至关重要的角色。
前景
    运维所涉及的知识面,专业点非常广,对从业人员素质也要求非常高,运维工作在大型互联网公司也越来越重要。随着互联网的高速发展,网站规模越来越大,架构越来越复杂,对 站运维工程师的需求也会越来越急迫,特别是对有经验的运维人才需求量大,而且是越老越值钱。

转载于:https://www.cnblogs.com/lixinjie-98/p/10019060.html

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/389090.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

advanced installer更换程序id_好程序员web前端培训分享kbone高级-事件系统

好程序员web前端培训分享kbone高级-事件系统:1、用法,对于多页面的应用,在 Web 端可以直接通过 a 标签或者 location 对象进行跳转,但是在小程序中则行不通;同时 Web 端的页面 url 实现和小程序页面路由也是完全不一样…

ai对话机器人实现方案_显然地引入了AI —无代码机器学习解决方案

ai对话机器人实现方案A couple of folks from Obviously.ai contacted me a few days back to introduce their service — a completely no-code machine learning automation tool. I was a bit skeptical at first, as I always am with supposedly fully-automated solutio…

网络负载平衡的

网络负载平衡允许你将传入的请求传播到最多达32台的服务器上,即可以使用最多32台服务器共同分担对外的网络请求服务。网络负载平衡技术保证即使是在负载很重的情况下它们也能作出快速响应。 网络负载平衡对外只须提供一个IP地址(或域名)。 如…

透明状态栏导致windowSoftInputMode:adjustResize失效问题

当我们通过下面代码: getWindow().getDecorView().setSystemUiVisibility(View.SYSTEM_UI_FLAG_LAYOUT_FULLSCREEN |View.SYSTEM_UI_FLAG_LIGHT_STATUS_BAR); 设置状态栏透明,当界面存在EditText时,在activity里面设置windowSoftInputMode:…

[TimLinux] JavaScript 元素动态显示

1. css的opacity属性 这个属性用于:设置元素的不透明级别,取值范围:从 0.0 (完全透明)到 1.0(完全不透明),元素所在的文本流还在。这个属性的动态变化可以用来设置元素的淡入淡出效果…

神经网络 CNN

# encodingutf-8import tensorflow as tfimport numpy as npfrom tensorflow.examples.tutorials.mnist import input_datamnist input_data.read_data_sets(MNIST_data, one_hotTrue)def weight_variable(shape): initial tf.truncated_normal(shape, stddev0.1) # 定义…

图片中的暖色或冷色滤色片是否会带来更多点击? —机器学习A / B测试

A/B test on ads is the art of choosing the best advertisement that optimizes your goal (number of clicks, likes, etc). For example, if you change a simple thing like a filter in your pictures you will drive more traffic to your links.广告的A / B测试是一种选…

3d制作中需要注意的问题_浅谈线路板制作时需要注意的问题

PCB电路板是电子设备重要的基础组装部件,在制作PCB电路板时,只有将各个方面都考虑清楚,才能保证电子设备在使用时不会出现问题。今天小编就与大家一起分享线路板制作时需要注意的问题,归纳一下几点:1、考虑制作类型电路…

冷启动、热启动时间性能优化

用户希望应用程序能够快速响应并加载。 一个启动速度慢的应用程序不符合这个期望,可能会令用户失望。 这种糟糕的体验可能会导致用户在应用商店中对您的应用进行糟糕的评价,甚至完全放弃您的应用。 本文档提供的信息可帮助您优化应用的启动时间。 它首先…

python:lambda、filter、map、reduce

lambda 为关键字。filter,map,reduce为内置函数。 lambda:实现python中单行最小函数。 g lambda x: x * 2 #相当于 def g(x):return x*2print(g(3))# 6 注意:这里直接g(3)可以执行,但没有输出的,前面的…

集群

原文地址:http://www.microsoft.com/china/MSDN/library/windev/COMponentdev/CdappCEnter.mspx?mfrtrue 本文假设读者熟悉 Windows 2000、COM、IIS 5.0 摘要 Application Center 2000 简化了从基于 Microsoft .NET 的应用程序到群集的部署,群集是一组…

Myeclipes连接Mysql数据库配置

相信大家在网站上也找到了许多关于myeclipes如何连接mysql数据库的解决方案,虽然每一步都按照他的步骤来,可到最后还是提示连接失败,有的方案可能应个人设备而异,配置环境不同导致。经过个人多方探索终于找到一个简单便捷的配置方…

cnn图像二分类 python_人工智能Keras图像分类器(CNN卷积神经网络的图片识别篇)...

上期文章我们分享了人工智能Keras图像分类器(CNN卷积神经网络的图片识别的训练模型),本期我们使用预训练模型对图片进行识别:Keras CNN卷积神经网络模型训练导入第三方库from keras.preprocessing.image import img_to_arrayfrom keras.models import lo…

图卷积 节点分类_在节点分类任务上训练图卷积网络

图卷积 节点分类This article goes through the implementation of Graph Convolution Networks (GCN) using Spektral API, which is a Python library for graph deep learning based on Tensorflow 2. We are going to perform Semi-Supervised Node Classification using C…

[微信小程序] 当动画(animation)遇上延时执行函数(setTimeout)出现的问题

小程序中当动画animation遇上setTimeout函数内部使用this.setData函数,通常情况下会出现报错。本文先告诉解决方法,后分析报错原因 1.解决方法: 在 setTimeout() 函数的同级加上 const that this; ,然后将this.setData换成that…

关于使用pdf.js预览pdf的一些问题

手机应用中pdf展示使用非常广泛, 一些pdf由于特殊的内容比如文字、电子签章必须使用复杂的解析器来解析,当使用MultiPdf 这个库加载,会使得包变得非常庞大, 这里我们考虑使用pdf.js 来解析pdf. 引用非常简单,只需要把…

SqlHelper改造版本

using System;using System.Configuration;using System.Data;using System.Data.SqlClient;using System.Collections; /// <summary> /// SqlHelper类是专门提供给广大用户用于高性能、可升级和最佳练习的sql数据操作 /// </summary> public abstract c…

回归分析预测_使用回归分析预测心脏病。

回归分析预测As per the Centers for Disease Control and Prevention report, heart disease is the prime killer of both men and women in the United States and around the globe. There are several data mining techniques that can be leveraged by researchers/ stat…

VMware文件共享

VMware tools 文件共享 已经安装后&#xff1a; vmhgfs-fuse .host:/ /mnt/hgfs

npm 问题(一)

今天在使用npm安装程序时出现了以下问题如下&#xff1a; 我解决了问题&#xff0c;这是由于缓存清除错误&#xff08;但他们自动修复&#xff09;有一些数据损坏&#xff0c;没有让JSON文件解析&#xff0c;使用以下命令可以解决&#xff1a;即&#xff1a; npm cache clean -…