精英下午茶丨财经头条洪军:能“偷懒”,会学习,才是好运维!

导 语 运维之于技术项目就像后勤之于军队,运维工程师职责就是保障IT系统的稳定运行。一般人对运维是很陌生的,甚至会有一些误解。财经早餐近日采访了财经头条资深运维工程师洪军,让他给我们揭开运维工程师的神秘面纱。 财经头条运维工程师洪军 什么是运维 1 财经早餐:你能介绍一下,什么是运维?IT技术公司为什么需要运维? 洪军:简单地说,运维就是维护网站、运营系统的稳定。比如财经头条APP,要让用户要能够顺利访问,就必须保证其背后的爬虫系统、数据分析系统、搜索引擎系统、智能推荐系统、APP系统稳定运行,这就需要运维做支持。 维护系统要达到四个方面的目的,第一要维护系统稳定,能让当前用户流畅使用;第二要保障系统的性能;第三要维护系统安全,不被外部攻击;第四要让系统有可扩展性,在未来用户量暴增的时候系统能够升级应对。 运维的工作,请一个实习生来做也行,甚至让研发人员兼职也可以,但效果会很难保证。有的运维工资只有两三千,有的会有两三万,甚至年薪五六十万,因为他们维护的系统的稳定性、安全性、和可扩展性是完全不同的。 运维工作非常复杂 2 财经早餐:运维具体包括哪些职责呢? 洪军:运维是一个非常广泛的定义,在不同的公司不同的阶段有着不同的职责与定位,如果认为就是敲几行操作命令的工作,那就错了。 对于初创公司,运维工程师的工作可能需要从申请域名开始,购买/租用服务器,上架,调整网络设备的设置,部署操作系统和运行环境,部署代码,设计和部署监控,防止漏洞和攻击等等。 对于大型的公司,对于运维工作的要求越来越高,也催生了更细化的运维分工,可以分为helpdesk、网络工程师,系统工程师,研发支撑,数据库运维,系统架构师,网络安全工程师,监控工程师、运维开发等。 运维的工作涉及范围非常广,从简单的对同事进行技术支持,网络布线,维护机器,到复杂的研发支撑,网络安全,系统架构等多个方面。 以系统架构为例,它需要非常资深,接触过很多种工作的人才能胜任。比如说,研发新产品,要考虑到到研发使用什么接口、什么数据库、什么服务器、用多大的内存、用什么样的网络宽带,要不要分布式发布等等,这些全部都要系统架构师来设计。 什么样的才是好运维 3 财经早餐:运维的工作涉及到普通的日常维护,也涉及到复杂的网络安全、研发支持、系统架构等方面。那如何判断一个运维是不是好运维? 洪军:第一,能“偷懒”才是好运维。 如果一个公司运维工作做得好,那么系统稳定性就会很高,不会经常出问题。所以经常半夜爬起来解决问题的运维不是个好运维,能够让系统稳定顺利运行的运维才是好运维。 要做到偷懒,首先在设计系统的时候要考虑长远,未来就不会问题,或者出现问题能很快解决。比如最简单的一件事,给机房拉一根网线,我要布置20分钟,而一个新手运维可能花5分钟就搞定了。但如果未来出现问题,我5分钟就能查出问题并解决,但他最后要花一个小时也未必能排查出问题。 要做到偷懒,还要做好自动化部署。如果同一个问题出现两次,我就会考虑让机器自动化解决该问题。比如系统经常崩溃,一般的运维就是每次花10分钟重启一下,而好运维就会去思考如何自动化解决该问题。而要实现自动化,最初需要付出的时间和精力会更多,可能要花了1个星期,去学习一些新的技术和解决方案,才能一劳永逸地解决掉问题。 第二,会学习才是好运维。 运维需要的知识面非常广,需要十八班武艺样样精通,甚至比精通十八班武艺还难。十八班武艺,比如刀枪剑戟,这些武器是不会变的,但运维面对的技术是会不断升级换代的。 所以,运维一定要在工作中不断地学习。在IT领域,新技术很多都是国外先出现的,这就要求运维能够主动用google去搜索新技术,同时也要求他具备很好的英语阅读能力。可以说,只用百度搜索的运维,其水平一定不如用google的。 运维的烦恼 4 财经早餐:运维工作做得好,大家是没什么感觉的,但如果做不好,各种问题都会出现,导致所有人都会知道。运维的工作平时会有哪些误解和烦恼? 洪军:确实是这样的,并且还不止这些。 一方面,运维容易替同事背黑锅。比如网站崩溃了或者APP访问不了,别人第一时间想到的是运维出问题了,但其实这可能是研发部门出现了问题。但凡出现问题,运维都得背锅。 另一方面,运维工作还容易被老板误解。一个好的运维,他在设计系统的时候就把问题隐患处理了,在运行过程中出现的问题他也会进行自动化部署实现快速解决。而在系统的基础搭建好,自动化平台也设计好之后,运维的工作就会变得“很闲”。这很容易让老板误解,老板会认为这个运维平时怎么这么闲,以后别想加工资了。 运维的“闲”不是真的闲,他是需要用空余的时间不断去学习新的知识。运维的工作是需要分层次的,普通运维负责维护公司系统,发现问题解决问题,资深的运维则专门负责研究新技术。比如说我们目前采用最新的DOCKER+自动化部署来保障系统的稳定性,这个技术是我两年前浏览技术网站发现的,它能够极大地减少运维人员布置环境的次数,从而大大提高运维的效率。 所以,运维的工作性质决定了它前期需要付出很多时间和精力,后期相对轻松,但也要求运维人员不断地自我学习,这都是大家不了解并容易误解的地方。
已邀请:

要回复问题请先登录注册