什么是自动化运维做些什么?

什么是自动化运维?_自动化运维吧_百度贴吧
&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&签到排名:今日本吧第个签到,本吧因你更精彩,明天继续来努力!
本吧签到人数:0可签7级以上的吧50个
本月漏签0次!成为超级会员,赠送8张补签卡连续签到:天&&累计签到:天超级会员单次开通12个月以上,赠送连续签到卡3张
关注:11贴子:
什么是自动化运维?
所谓自动化运维,就是把运维日常工作中复杂的问题简单化、重复的问题工具化、自动化,尽可能减少人的参与。运维自动化的四个基础组成部份是:1) CMDB。2) 运行环境标准化。3) 发布管理。4) 监控管理。
1) CMDB。运维管理的核心,存储所有运维相关数据,包括硬件、系统、软件版本、数据库、中间件、网络配置等信息,所有的维护变更都需要基于这个配置管理数据库。(可参考:自动化运维)
2) 运行环境标准化。有了CMDB后,就可以通过Puppet、Saltstack、Ansible等自动化管理工具把系统、软件部署标准化。当你只有几十台主机时,可能标准化的作用还是不太明显,但是当你有成百上千台,甚至上万台设备时,要单纯通过人去管理这么多机器无疑是行不通的,你需要合理地运用一些工具去管理你的系统,标准化运行环境。
3) 发布管理。发布管理需要考虑代码自动构建、自动发布、发布后检查、发布异常回滚等,对于生产环境特别是涉及大规模的重大影响变更时,还要考虑灰度发布,尽可能控制用户的影响范围。
4) 监控管理。监控管理包括容量监控、系统运行指标监控、应用指标监控,以及出错时的告警和自动处理。在应用部署完成生产交付后,整个监控系统应当随之同步上线,因为这是运维保障的最后一道防线。
贴吧热议榜
使用签名档&&
保存至快速回贴中国领先的IT技术网站
51CTO旗下网站
IT运维管理之自动化运维篇
何谓自动化运维,即在最少的人工干预下,结合运用脚本与第三方工具,保证业务系统7*24小时高效稳定运行。这应该是所有业务系统运维终极目标。
作者:清风拂面来源:51CTO| 10:10
何谓自动化运维,即在最少的人工干预下,结合运用脚本与第三方工具,保证业务系统7*24小时高效稳定运行。这应该是所有业务系统运维终极目标。
按照运维的发展成熟度来看,运维大致可分为三个阶段:
(一)、依靠纯手工,重复的进行软件的部署与运维;
(二)、通过编写脚本,方便的进行软件的部署与运维;
(三)、借助第三方工具,高效的进行软件的部署与运维;
我们对运维的要求通常是:
(一)、事前预警
在故障出现之前,管理人员应该能在任何时间,任何地点接收到告警信息,并及时处理问题,把故障隐患扼杀在摇篮中。
(二)、事中恢复
天有不测风云,即使是再完美的方案也可能有预料之外的故障,为保证在最短时间内恢复业务,关键数据不因故障丢失,我们需要有完整备份方案来应对自如。
(三)、事后存档
这里更加强调运维管理的方法,针对处理过的故障,应该记录在案,在处理过程当中运用过的处理技术,处理方案,应该形成经验文档,以供知识分享。
要实现以上三个要求,并不是一件容易的事情。需要一个经验丰富且高效的运维团队,随着我们的业务系统不断增加,业务量的不断上升,传统依靠纯手工的运维方式,逐渐被淘汰。
我们更多的将注意力集中在通过脚本与借助第三方工具的运维方式上,这样不仅能满足我们对运维的要求,解放生产力,还能使我们的运维管理更加规范化,标准化,从而真正意义上的实现自动化运维。
自动化运维的实现工具(脚本与第三方工具,通常这两者须结合使用。):
脚本(SHELL、DOC)
1、硬件状态监控:通过编写脚本,对CPU、MEM、DISK、TOPProcesses、Network等关键硬件参数状态进行实时监控,发现异常触发告警信息给管理员;
2、业务拨测:通过编写脚本对常用业务的网站实时进行拨测,发现网站页面异常触发告警信息给管理员;
3、系统安全加固:通过编写脚本对常用的Windows、Linux、Unix服务器进行快速的安全加固;
4、补丁更新:通过编写脚本实现应用及操作系统补丁的快速更新;
5、数据备份:通过编写脚本实现关键业务数据,关键日志,数据库,操作系统,中间件等的快速备份(本地与异地);
6、过期日志清理:通过编写脚本实现过期日志清理;
第三方管理工具
针对一些轻量级的业务系统,我们可以使用一些开源的管理工具。而对于重量级(100万量级以上)的业务系统,建议采用成熟度比较高的第三方管理工具。一般来说比较成熟的第三方工具都能实现以上运维需求,而且管理操作起来也更加方便。
运维方式对比表:
(设备台数)
劳动力损耗
(shell、doc)
(100&X&500)
注:以上参数来自经验值,仅供参考。
原文链接:
【编辑推荐】
【责任编辑: TEL:(010)】
大家都在看猜你喜欢
头条头条外电头条外电
24H热文一周话题本月最赞
讲师:0人学习过
讲师:0人学习过
讲师:5人学习过
精选博文论坛热帖下载排行
《设计模式:可复用面向对象软件的基础》(双语版)是引导读者走入软件设计迷宫的指路明灯,凝聚了软件开发界几十年的设计经验。四位顶尖的...
订阅51CTO邮刊更多公众号:duorenwei多人维,一个好用的IT技术专家在线服务平台。高效的为企业与个人在线解决IT技术问题。同时给IT人更大的发展空间。让我们成为您贴心的小伙伴,为您的网络技术助力!最新文章相关作者文章搜狗:感谢您阅读自动化部署和自动化运维是什么? 本文版权归原作者所有,本文由网友投递产生,如有侵权请联系 ,会第一时间为您处理删除。运维自动化浅谈_运维吧_百度贴吧
&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&签到排名:今日本吧第个签到,本吧因你更精彩,明天继续来努力!
本吧签到人数:0成为超级会员,使用一键签到本月漏签0次!成为超级会员,赠送8张补签卡连续签到:天&&累计签到:天超级会员单次开通12个月以上,赠送连续签到卡3张
关注:4,850贴子:
运维自动化浅谈收藏
一个互联网产品由许多服务组成,而服务内包含多个模块,这些模块部署在成千上万的服务器上。由于互联网产品的特点,产品更新速度非常快,运维人员每天都要进行大量的模块维护操作。模块的运维操作涉及程序更新、配置修改、数据传输以及各种自定义的命令执行。在运维的早期,运维人员大多是通过手工操作或编写脚本的方式,将模块更新到生产环境中,我们称这个阶段为石器时代。这个阶段的问题也比较明显,重复性的工作还需要人工介入,手工操作不可避免的会带来误操作,效率底下,甚至出现过模块上线操作排队的现象。部署自动化方向主要解决的问题就是尽可能地将模块从发布到更新到生产环境这一过程中所有工作自动化,使部署工作更加安全和高效。一个模块部署工作的自动化,需要把这个模块的发布和更新方式固定下来;而所有模块部署工作的自动化则需要一个统一的规范和标准,基于这套规范和标准,我们可以搭建一个自动化平台来完成各项部署工作,运维人员不用再输入大量命令和编写复杂的脚本,只需在web上指指点点,即可完成成千上万台服务器的部署工作。部署自动化中关键的因素有如下几个:1. 标准建立:是一套系统能够运维所有模块的基础,我们不可能为每个模块都开发一套自动化系统,那样成本就太高了,也不利于维护。统一标准有利降低开发和维护成本。2. 模块信息的维护:模块的版本,部署路径,包含哪些文件,哪些是程序,哪些是配置,这些信息都部署时必须的信息,所以要统一维护起来。3. 模块健康检查:模块部署生效后,要有某种方法来检查他的健康程度,这部分也可以抽象出一些通用的方法来实现,这样就可以代替人工的检查。4. 全流程的应用:很多效率问题出在流程的每个环节之间连接的不紧密上,有的时候同样的事情要在不同角色间重复,如果把这些重复的劳动整合起来,各个环节连接紧密,就可以大大提高自动化程度。运维人员通过平台,将规范、常规的操作固定化,减少重复的手工操作,避免误操作。通过模板化,根据模块信息智能化分析,实现快速发单,同时串并行控制,提升模块更新效率。我们称这个阶段为工业时代。关联关系主要指模块之间通信,数据交互的关系。大量的模块更新、上/下线,生产环境中模块与模块之间,产品与产品之间的交互错综复杂。模块的各种变更会对上下游模块造成影响。没有统一的关联关系记录,更加复杂或者智能化的自动化操作是无法完成的,比如:1. 当发生故障后,预案自动执行2. 机器发生故障后,自动替换,搭建新的服务并与上下游通信3. 多个模块在服务器上混合部署,根据机器的性能,模块的特性,动态的调整。4. 根据当前的流量以及集群性能,动态的伸缩集群。5. 模块需要根据IDC、网络等情况,均匀分布在不同交换机下,避免网络故障导致所有模块失效的情况。实现上述目标,我们需要对所有信息进行管理,大概罗列下:1. 机器信息:cpu、mem、io、磁盘空间、网卡流量、内核、基础组件等2. 网络:交换机下机器分布情况,交换机性能,网络使用率等3. IDC:机架位分布,电力等4. 服务:产品与模块的关系(父子关系),模块与模块的关系(连接关系)5. 模块内的bin、conf、data信息6. 任务与任务的关系,任务与具体模块的关系文章转自戴尔IT解决方案专家团
上海运维外包,浦东新区运维外包,嘉定区运维外包,虹口区运维外包,,黄浦区运维外包静安区运维外包,长宁区运维外包,普陀区运维外包.
公司最近要把IT运维系统换成全自动化的,CIO让我们都提提建议和意见,对于全新的IT运维自动化系统我了解不多,有懂行的人支支招,看能给上面给出什么建议,或者推荐什么运维系统?
建议很好提,其实对于你们企业来说,要特别关注两类自动化工具:一是IT运维监控和诊断优化工具;二是运维流程自动化工具。这两类工具主要应用于:①监控自动化,是指对重要的IT设备实施主动式监控,如路由器、交换机、防火墙等。②配置变更检测自动化,是指IT设备配置参数一旦发生变化,将触发变更流程转给相关技术人员进行确认,通过自动检测协助IT运维人员发现和维护配置。③维护事件提醒自动化,是指通过对IT设备和应用活动的时时监控,当发生异常事件时系统自动启动报警和响应机制,第一事件通知相关责任人。④系统健康检测自动化,是指定期自动地对IT设备硬件和应用系统进行健康巡检,配合IT运维团队实施对系统的健康检查和监控。⑤维护报告生成自动化,是指定期自动的对系统做日志的收集分析,记录系统运行状况,并通过阶段性的监控、分析和总结,定时提供IT运维的可用性、性能、系统资源利用状况分析报告。现在大公司比较常用的IT自动化运维系统都是卡西亚定制的,他们在全球500强里面很多客户,实力雄厚,技术领先,你适当考察下以后再给你的上级建言。
碉堡堡垒机可以解决运维审计管理方面的什么问题?麻烦楼主解答一下 谢谢啦~~~
实现对各种操作,包括Unix等终端指令、Windows等图形操作、C/S客户端工具操作、浏览器操作的集中管理,有效解决共享账号问题,确保操作者与实际操作一一对应;严格访问控制策略,有效杜绝了未授权访问操作;对正在进行的操作实时监控、对已经结束的操作能够完整记录、快速查询;通过部署碉堡,满足相关安全规范对运维人员的管理和审计要求。
EasyOps就是实现自动化运维的一站式管理平台啊,优维科技还提供免费的社区版试用,用过再说话。EASYOPS的实现是基于DevOps的创新技术理念和实现设计。能够帮助各个企业快速的去构建内部的技术管理流程、建立技术服务标准、并形成可靠的IT支撑能力,并最终通过我们的平台来实现IT服务技术的核心竞争力的打造。 实现了运维的能力从基础设施到业务的闭环,也实现了多运维角色的能力集中管理。
登录百度帐号推荐应用
为兴趣而生,贴吧更懂你。或

我要回帖

更多关于 自动化运维 的文章

 

随机推荐