运维,在一些没有接触过IT的小伙伴的概念里,觉得是一个比较低级的职位,很容易从字面上理解为运维。许多朋友认为,IDC机房运维、网络运维、桌面运维、Linux系统运维、数据库运维、云计算运维等在互联网公司的工作是设置系统,配置服务,处理紧急故障,为公司开发人员和其他部门提供支持。同时负责内外网络的稳定性。没错,以上描述的工作确实是运维的一部分,但并非全部,或中小企业的低级运维劳动,无法诠释运维的核心能力。
一、运维人员必须具备运维思想。依我看,除了以上角色,运维人员还是管理、制度、规范、流程的制定、推广、监督角色。运维的核心是运维思想,非运维技术本身(如部署服务等),这是一些朋友的误解)。
如果没有良好的管理流程、规范和制度策略,数百台以上的服务器就不能协调工作,数千台和数万台就更不用说了。操作流程,操作规范,操作系统,自动化,智能化,批量部署,批量管理,网站架构优化,监控预警,流量和日志分析统计,成本控制(注意字眼是控制,不是省钱)才是真正的操作人员需要做的。如何推进和完善以上工作,提高工作效率,提高团队战斗力是核心内容。操作和维护的目的:保护数据安全,7*24小时网络稳定,用户体验良好(包括内部员工和外部网站用户)。因此,我们不应该离开操作和维护的目的。否则,你的工作可能是徒劳的(至少与目标没有直接对接)。经验丰富的运维人员会先思考动作,经验不足的操作人员会先做,遇到问题在思考,这是完全不同的层次和境界。想象一下,建造一座建筑物如果先盖好思考,还能盖好吗?因此,不要轻易说你精通什么服务,会有多少软件,那只是几块砖,几袋水泥,几根钢筋而已。建造建筑物,这些只是基本的元素,运维和维护也一样!
2.运维商必须特别清楚即将面临的威胁。专家研究和大量企业实践表明,在信息技术项目的生命周期中,约80%的时间与信息技术项目的运维和维护有关,而现阶段的投资只占整个信息技术投资的20%,形成了典型的轻服务、重技术现象。根据国内某调研机构的调查,技术或产品上的问题(包括硬件、软件、网络、电力故障和自然灾害)实际上只占经常发生的问题的20%,而过程上的问题占40%,人员上的问题占40%。过程故障包括过程中没有做好变更管理、过载、无测试等过程中的错误或不完整,人员故障包括忘记做某事、缺乏训练、备份或安全故障等。面对如此高的要求和压力,信息技术部门需要有一套完善的、可管理的信息技术服务流程,有效管理信息技术运维,使信息系统更好地满足业务不断变化的需求,使信息技术部门从成本中心转变为利润中心。当现代企业建立完善成熟的信息技术运维管理体系时,通过流程管理,不断提高信息技术运维质量,实现高效运维,提高组织内信息技术服务满意度。
如何保证我们的IT运维?做好服务支持计划。事故管理:有效解决冲突,尽快恢复信息技术服务。问题管理:找出问题的根源和解决方案,消除或减少问题。配置管理:管理变更的实施过程,避免或减少变更的影响。变更管理:控制信息技术系统软件的发布过程和版本。发布管理:管理信息技术系统的所有元素和相关信息,描述信息技术元素之间的相互关系。做好服务交付计划。服务级管理:提供与服务级对等的服务内容,完成定量服务器管理。可用性管理:监控信息技术的重要资源和运行指标,确保整个业务系统的可用性。能力管理:监控和提高系统性能。持续管理:简历业务持续规划,实现业务可持续运行。