主页 > imtoken冷钱包官方 > 运维工作是什么?(4)

运维工作是什么?(4)

imtoken冷钱包官方 2023-01-18 13:14:47

这时候服务变更更多的是手动操作,或者有一些简单的批处理脚本。监控的重点更多是服务器状态和资源使用情况,对服务应用状态的监控很少,更多的监控使用Nagios、Cacti等各种开源系统。

由于业务规模和复杂性的不断增加,运维团队将逐渐分为应用运维和系统运维。应用运维开始接手线上业务,逐步开展服务监控整理、数据备份和服务变更等工作。

随着服务的深入,应用运维工程师有能力开始对服务进行一些简单的优化。同时,为了应对每天大量的服务变更,我们也开始编写各种运维工具,可以方便地批量变更某些服务。

随着业务规模的扩大,由于容量规划不足或抗风险能力弱导致的基础设施故障越来越多,迫使运维人员开始将更多的精力投入到多数据中心的容灾和计划管理上。方向。

业务规模达到一定程度后,开源监控系统在性能和功能上已经无法满足业务需求;大量的服务变更和复杂的服务关系,过去依赖人工记录和工具更换,效率或准确性均不高。两者都不能满足业务需求。

矿场运维是做什么的

安全方面也发生了大大小小的各种事件,迫使我们将更多的精力投入到安全防御中。运维团队逐渐形成了上述5大类岗位,每一类都需要专门人才。

此时系统运维更侧重于基础设施建设和运维,提供稳定高效的网络环境,将服务器等资源交付给应用运维工程师。应用运维更关注服务运行状态和效率。

数据库运维属于应用运维工作的精细化,更侧重于数据库领域的自动化、性能优化和安全防御。运维研发和运维保障提供各种平台和工具,进一步提高运维工程师的工作效率,让业务服务运行更加稳定、高效、安全。

我们将运维开发过程分为四个阶段矿场运维是做什么的,如图1-2所示。

矿场运维是做什么的

运维工作到底是做什么的?

图1-2 运维开发流程

人工管理阶段:业务流量不大,服务器数量比较少,系统复杂度不高。对于日常的业务管理操作,大家更有可能一一登录服务器进行手动操作。他们每个人都在以自己的方式战斗。每个人都有自己的操作方法,缺乏必要的操作标准和流程机制。例如,业务目录环境都是不同的。各种各样的。

工具批量操作阶段:随着服务器规模和系统复杂度的增加,全手工操作模式已经不能满足业务快速发展的需要。因此,运维人员逐渐开始使用批量操作工具,针对不同的操作类型出现了不同的脚本程序。

矿场运维是做什么的

但是每个团队都有自己的工具,每次运营需求发生变化时都需要对其进行调整。这主要是由于环境和操作规范不足,导致可编程处理能力较弱。至此,虽然效率有了一定的提升,但很快又遇到了瓶颈。

操作的质量并没有太大的提升,甚至可能由于批量执行而导致更大规模的问题。我们开始建立大量的流程规范,比如审核机制,先用服务器上线观察10分钟再继续后续操作,升级完成后至少观察20分钟。

这些主要靠人来监督和落实,但在实际过程中,往往落实不到位,降低了工作效率。

平台管理阶段:此阶段对运维效率和误操作率有较高要求。我们决定开始建设运维平台,通过平台承载标准和流程,从而解放人力矿场运维是做什么的,提高质量。

矿场运维是做什么的

这时服务的变更动作被抽象出来,形成了操作方法、服务目录环境、服务操作方式的统一标准。比如程序的启停界面必须包括启动、停止、过载等。运行过程受平台约束,比如上面提到的在线服务器观察10分钟。

在平台中强制设置暂停检查点。第一台服务器运行完成后,运维人员需要填写相应的检查项,然后才能继续后续的部署动作。

系统自调度阶段:规模更大的服务数量,更复杂的服务关联,各种运维平台的建立,原来将批量操作转化为平台操作的方式已经不适用,需要改进服务变化。一层抽象。

每台服务器被抽象成一个容器,调度系统根据资源使用情况,将服务调度部署到合适的服务器上,并自动完成与周边运维系统的联动,如监控系统、日志系统、备份系统等。

矿场运维是做什么的

通过自调度系统,可以根据业务运行动态扩展容量,自动处理常见业务故障。运维人员的工作也将推进到产品设计阶段,协助研发人员进行服务改造,接入自调度系统。

在运维的整个开发过程中,我们希望所有的工作都实现自动化,减少人的重复性工作,降低知识传递的成本,让我们的运维交付更高效、更安全,让产品运行起来更稳定。对于故障的处理,也希望后处理变成早期检测,人工处理变成系统自动容灾。

【编辑推荐】

企业级自动化运维方案设计及Saltstack、Ansible等5款工具对比分析分析微博服务器瘫痪!O&M:我该怎么做才能救我?为制造业配备“最强大脑” 中科曙光工业互联网平台发布1-10年运维人修仙指南 Linux操作系统运维必备的实用工具有哪些?【责任编辑:吴晓燕电话:(010)68476606]

喜欢 0