还剩13页未读,继续阅读
本资源只提供10页预览,全部文档请下载后查看!喜欢就下载吧,查找使用更方便
文本内容:
IT运维效劳部运营方案目录
1、部门宗旨
2、业务范围
3、运维效劳治理体系
1.11运维效劳治理对象
1.2运维系统功能框架
1.3运维治理组.织结构
3.3・1运维部负责人
3.
3.2总工
3.
3.3效劳台
3.
3.4网络组
3.3,5效劳器组.
3.
3.6桌面组
3.
3.7用』机房组
3.
3.8各组组长
3.4运维效劳流程
3.
4.1工程运维效劳工作流程图
3.
4.2效劳台
3.
4.3事件治理
3.
4.4工单治理
3.
4.5问题治理
3.
4.6变更治理
3.
4.7配置治理
3.
4.8工程师考核
3.
4.9知识库治理统计及工作报告
4、人员治理
4.1轮岗原那么
4.4绩效治理根据效劳台、组长、组员等不同岗位提取考核指标,制定客观、明确的考核标准,选择科学合理的考核方法.绩效考核要做到客观、公正、公开、公平、科学;真实、准确;民主与集中相结合;责、权、利相结合;定性与定量相结合;考核方法要科学、可行;考核周期要适当;考核等级或计分要合理;考核结果要反应;考核人员要合格、到位;考核要标准化、制度化.(具体内容需制定考核细那么)
4.5维效劳内容
5.1效劳目标运维效劳部提供的运行维护效劳包括,信息系统相关的主机设备、操作系统、数据库和存储设备的运行维护效劳,保证用户现有的信息系统的正常运行,降低整体治理本钱,提升网络信息系统的整体效劳水平.同时根据日常维护的数据和记录,提供用户信息系统的整体建设规划和建议,更好的为用户的信息化开展提供有力的保证.用户信息系统的组成主要可分为两类硬件设备和软件系统.硬件设备包括网络设备、平安设备、主机设备、存储设备、通讯设备、监控设备等;软件设备可分为操作系统软件、典型应用软件〔如数据库软件、中间件软件等)、业务应用软件等.效劳工程范围覆盖的信息系统资源以下方面的关键状态及参数指标>运行状态、故障情况>配置信息>可用性情况及健康状况性能指标
5.2IT资产统计效劳效劳内容包括>硬件设备型号、数量、版本等信息统计记录>软件产品型号、版本和补丁等信息统计记录>网络结构、网络路由、网络IP地址统计记录>综合布线系统结构图的绘制>其它附属设备的统计记录
5.3网络、平安系统运维效劳从网络的连通性、网络的性能、网络的监控治理三个方面实现对网络系统的运维治理.>设备根底性能检测CPU、内存使用情况监测;>设备日志查看;>设备snmp状态;>测试Ping,tracert等工具的连通性;>网络平安策略应用是否正常;>Internet带宽流量的实时监测;>网络拓扑链路状态监测;>异常网络数据包流量;>Dos、ddos等网络攻击情况监测;>Internet线路的误码率、丢包率监测;
5.4效劳器、存储系统运维效劳提供的效劳器、存储系统的运维效劳包括效劳器、存储设备的日常监控,设备的运行状态监控,故障处理,操作系统维护,补丁升级等内容.进行监控治理的内容包括>CPU性能治理;>内存使用情况治理;>硬盘利用情况治理;〉系统进程治理;>主机性能治理;>实时监控主机电源、风扇的使用情况及主机机箱内部温度;>监控主机硬盘运行状态;>监控主机网卡、阵列卡等硬件状态;>主机系统文件系统治理;>监控存储交换机设备状态、端口状态、传输速度;>监控备份效劳进程、备份情况(起止时间、是否成功、出错告警);>监控记录磁盘阵列等存储硬件故障提示和告警,并及时解决故障问题;>对存储的性能进行监控.
5.5数据库系统运维效劳提供的数据库运行维护效劳是包括主动数据库性能治理,数据库的主动性能管理对系统运维非常重要.通过主动式性能治理可了解数据库的日常运行状态,识别数据库的性能问题发生在什么地方,有针对性地进行性能优化.同时,密切注意数据库系统的变化,主动地预防可能发生的问题.进行监控治理的内容包括>数据库根本信息文件系统、碎片、死锁、CPU占用率较大或时间较长的SQL语句.〉表空间使用信息监测;>数据库文件I/O读写情况;>Session连接数量监控;>数据库监听运行状态监测;>查看每日数据备份、数据同步是否正常;〉报警日志监测;>对表和索引进行Analyze,检查表空间碎片;>检测数据库后台进程;数据库对象的空间扩展情况监测;
5.6桌面、终端运维效劳负责对终端PC、笔记本以及工作站的操作系统、应用软件和硬件的维护,解决使用人员在应用过程中遇到的问题并进行简单培训,完成打印机、考勤机、消费机等其他终端的故障处理工作.
6、应急效劳响应举措运维工程组制定了详尽的应急处理预案,整个流程严谨而有序.但在效劳维护过程中,意外情况将难以完全防止.我们将对工程实施的突发风险进行详细分析,并且针对各类突发事件,设计了相应的预防与解决举措,同时提供了完整的应急处理流程.
6.1应急预案实施根本流程
6.2突发事件应急策略1值班人员平时应做好应急事件的监控工作,对于突发事件应认真分析、准确判定故障发生的数据域,负责跟踪该事件直至其结束.对于不在运维中央的故障,应在第一时间内通知负责人去现场处理,密切关注事件流程及进展情况,并做好登记工作上报领导.2正常情况下,要求值班人员在10分钟内进行事件确认.如果属于一般事件那么根据事件流程进行分派处理,否那么应迅速启动应急预案,并严格根据应急预案所规定的步骤快速实施应急处置,及时汇报上级领导,掌握实时处理情况.⑶在处理过程中,如需其他部门去现场增援处理,应及时向上级领导部门汇报,协调沟通,尽快联系技术工程师或厂家技术支持赶赴现场援助处理.
7、效劳治理模式
7.1效劳模式由IT运维效劳部对整个集团现有IT资源进行普查,并根据普查结果并参考市场运维价格制定运维外包协议,价格至少要比市场价格低三分之一,由信息处牵头与IT运维效劳部签订IT运维外包协议,根据协议价格由集团按月拨付运维费用.
7.2效劳时间1在工作时间内设置由专人职守的热线,非工作时间设置有专人7*24小时接听的移动热线,接听效劳请求,并记录效劳台事件处理结果.⑵效劳响应时间故障级别响应时间故障解决时间I级属于紧急问题;其具表达象为系统崩10分钟,30分钟内提4小时以内溃导致业务停止、数据丧失.交故障处理方案II级属于严重问题;其具表达象为出现局部部件失效、系统性能下降但能正常运普小珈
9.叶内6小时以内行,不影响正常业务运作.1吆U二.HI级属于较严重问题;其具表达象为出20分钟,2小时内提现系统报错或警告,但业务系统能继续运行12小时以内交故障处理方案且性能不受影响.IV级属于普通问题;其具表达象为系统30分钟,4小时内提技术功能、安装或配置咨询,或其他显然不影24小时以内交故障处理方案响业务的预约效劳.
7.3行为标准1遵守集团的各项规章制度,严格根据集团相应的规章制度办事.⑵与集团运行维护体系其他部门和环节协同工作,密切配合,共同开展技术支持工作.⑶出现疑难技术、业务问题和重大紧急情况时,及时向负责人报告.⑷现场技术支持时要精神饱满、态度温和.接听时要文明礼貌,语言清晰明了,语气和蔼.⑸遵守保密原那么.对集团的网络、主机、系统软件、应用软件等的密码、核心参数、业务数据等负有保密责任,不得随意复制和传播.
4.2工程师等级
4.3晋升原那么
4.4绩效治理
5、运维效劳内容
5.1效劳目标
5.2IT资产统计效劳
5.3网络、平安系统运维效劳
5.4效劳器、存储系统运维效劳
5.5数据库系统运维效劳
5.6桌面、终端运维效劳
6、应急效劳响应举措
6.1应急预案实施根本流程
6.2突发事件应急策略
7、效劳治理模式
7.1效劳模式
7.2效劳时间
7.3行为标准
1、部门宗旨立足集团、结合集团业务工作及信息化建设实际,完善运维治理体系的建设,增强运维人员梯队建设,增强信息系统正常运行保证,“以流程为导向,以效劳为核心〃提升效劳质量水平、转变效劳理念、拓宽效劳范围、提升效劳效率、减少故障发生率,降低运维本钱、提升用户效劳满意度.
2、业务范|根底业务IT根底设施运维校园网、视频监控网、播送电视网、网、效劳器及终端设备等;应用软件系统运维.IDC机房运维;拓展业务承接网络工程、运维工程;IT咨询效劳等等.
3、运维效劳治理体系运维效劳治理体系规定了仃运维活动涉及的各类实体,以及这些实体间的相互关系.相关的实体根据IT运维效劳治理体系进行有机组织,并协调工作,根据服务协议要求提供不同级别的IT运维效劳.
3.1运维效劳治理对象运维效劳治理对象包括根底设施、应用系统、用户、供给商、以及IT运维部门和人员,具体内容如下1根底设施包括网络、主机系统、存储/备份系统、终端系统、平安系统、以及机房动力环境等.2应用系统包括内部办公、教学系统、门户网站、各类应用系统等.3用户包括使用如上IT应用系统的用户.4供给商包括根底设施和应用系统的供给商等.5运维部门和人员包括IT运维效劳部及集团内部参与IT运维活动的相关部门和人员.
3.2运维系统功能框架根据集团的系统结构和业务开展需要,IT运维效劳部将维护框架分为8个具体组成局部,分别为效劳台、事件治理、工单治理、问题治理、变更治理、配置治理、工程师考核、知识库治理、统计等9个子项.而具体运维流程将以此为依据开展工作.
3.3运维治理组织结构IT运维效劳部的运维治理结构位三层模式,具体如下列图所示.由运维部负责人与集团进行业务范围接洽,并签订外包协议,负责集团整体运维工作,包括各种制度的制定和实施.各运维组组长负责本小组标准化、标准化建设,建立运维档案、知识库等,并带着小组成员进行运维工作.各小组成员在小组长的指导下开展维护工作.
3.
3.1运维部负责人责任负责部门整体运营,规划、执行、完善信息化运维工作.职位描述
1、整体负责运维效劳工程方案的制定,领导各组组长并安排运维工作,每周听取各组组长的工作汇报,负责考核各组组长工作完成情况.
2、根据运维目标,指导各小组组长开展用户效劳工作,保证运维工作能够满足用户的实际需要;
3、建立和持续完善运维治理体系,优化运维流程流程,解决运维效劳中出现的特殊问题;
4、规划并提升运维工程师专业效劳水平,在整体上提升用户满意度;
5、制定和持续完善绩效考核体系;
6、制定整理运维工程的应急预案系统,并指导运维工程师实施;
3.
3.2总工责任网络规划、网络建设方案制定,核心网络设备治理,对网络组工作进行技术支持.职位描述
1、集团()通信网、网、播送电视网、监控网等网络的规划、建设方案制定.
2、网络核心设备〔路由器、防火墙、交换机等)的运行维护与治理.
3、绘制网络拓扑图、制定网络核心设备配置参数信息档案、建立网络核心设备台账等.
4、对网络组工作进行技术支持与指导.
3.
3.3效劳台责任故障受理,文档治理、人员治理、数据统计.职位描述
1、负责IT业务的救助的受理工作;
2、故障处理的发起人,同时进行维护工程师指派,跟踪事件处理状态;
3、进行维护故障统计、用户满意度统计、工作报表输出等工作;
4、协助部门负责人,进行文档整理、归类、保存等工作.
5、协助部门负责人,进行人员考核治理、工资核算等.
3.
3.4网络组责任网络线路维护治理,维护集团〔)网络系统正常,解决网络相关故障,网络工程的建设等.职位描述
1、对现有网络设备〔非核心)、局域网络及配线间的日常治理维护;
2、保证外网光纤线路正常,保证局域网运行正常;
3、对网络系统和网络设备的运行状态进行监控;
4、保证通讯网、监控网、播送电视网正常运行,及时解决故障.
5、编写网络局部的应用处理预案并实施.
6、网络工程的建设施工.
3.
3.5效劳器组责任效劳器软硬件、操作系统、数据库、平安软件、应用系统等运行维护以及数据的平安治理.职位描述
1、监测效劳器软硬件运行状况,性能监视及优化,作必要调整;
2、及时处理效劳器软硬件遇到的故障并做好记录;
3、监测业务系统运行状况,应用、数据库性能监视及优化,作必要调整,保证应用和数据库系统的平安性、完整性和运行效率;
4、及时处理应用系统、数据库等遇到的故障并做好记录;
5、制订备份、恢复、迁移和灾备策略,根据业务的需要执行数据转换及迁移等操作;
6、及时更新操作系统、平安软件等系统补丁,保证系统的平安;
3.
3.6桌面组责任维护集团桌面系统运行正常,解决终端、外设故障,保证应用系统客户端正常运行.职位描述
1、各部门电脑、打印机、考勤机、消费机等的维护;
2、ERP、CRP、一卡通等各应用系统客户端的维护、技术支持及培训工作;
3、Windows、Office等及其它办公软件维护、技术支持及培训工作.
3.
3.7IDC机房组责任维护集团桌面系统运行正常,解决终端、外设故障,保证应用系统客户端正常运行.职位描述
1、机房电力、精密空调、UPS等设备的监控、维护与治理;
2、机房通信线路、网络设备、效劳器等的日常监控、维护及治理;
3、检查系统设备,排除平安隐患;
4、分析系统日志,及时发现异常现象;
5、机房日常报表的填报与汇总.
3.
3.8各组组长责任各小组组长除具有本小组所有责任外还应该包括制度建设、人员培训、设备治理等相应责任.
3.4运维效劳流程IT运维效劳治理流程涉及效劳台、事件治理、问题治理、配置治理、变更管理、发布治理、效劳级别治理、财务治理、水平治理、可用性治理、效劳持续性治理、知识治理及供给商治理等,随着运维活动的不断深入和持续改良,其他流程可能会逐步独立并标准.
3.
4.1工程运维效劳工作流程图
3.
4.2效劳台效劳台是支持IT运维效劳的核心功能,与各个流程联系密切.所有治理流程都要通过效劳台为用户提供单点联系,解答用户的相关问题和需求,或为用户寻求相应的支持人员.在本系统中,效劳台是接收各种来源效劳请求和相关信息反应的唯一入口和出□,同时效劳台还负责一般请求、通过知识库(历史事件)能够解决的请求;他也是复杂问题二线处理的桥梁.
3.
4.3事件治理事件治理流程的主要目标是尽快恢复IT效劳提供并减少其对业务的不利影响,尽可能保证最好的IT效劳质量和可用性等级.事件治理流程通常涉及事件的侦测和记录、事件的分类和支持、事件的调查和诊断、事件的解决和恢复以及事件的关闭.本系统把所有效劳请求和报警归结为事件.事件治理是提供效劳台和事件治理者对于事件记录、处理、查询、审核、派发等功能.它也包括通过和IT监控系统对接,把其发送报警形成事件的功能.
3.
4.4工单治理工单治理工单是IT现场运维、二线支持的任务载体,运维工程依据所接收工单进行IT运维工作.工单治理是对工单实现创立、变更、查询浏览、派发、监督等功能的模块.
3.
4.5问题治理问题治理流程的主要目标是预防问题和事故的再次发生,并将未能解决的事件的影响降低到最小.问题治理流程包括诊断事件根本原因和确定问题解决方案所需要的活动,通过适宜的限制过程,尤其是变更治理和发布治理,负责保证解决方案的实施.问题治理还将维护有关问题、应急方案和解决方案的信息.问题治理是针对已处理事件的遗留问题或处理事件的方案只是治标不治本的不能彻底解决问题而考虑的模块.根据事件、及处理方案,问题处理人经过调查、诊断并提出最终解决方法.
3.
4.6变更治理变更治理实现所有IT根底设施和应用系统的变更,变更治理应记录并对所有要求的变更进行分类,应评估变更请求的风险、影响和业务收益.其主要目标是以对效劳最小的干扰实现有益的变更.变更治理是要对重大IT资源的新增、变更、升级等IT运维活动进行审核的功能,以免这些活动对现有IT资源的可用性造成没有必要的影响和破坏;同时,他还要实现在工单中产生的变化进行后审计的功能.
3.
4.7配置治理配置治理流程负责核实IT根底设施和应用系统中实施的变更以及配置项之间的关系是否已经被正确记录下来;保证配置治理数据库能够准确地反映现存配置项的实际版本状态.配置治理实际上是全部IT资源的统一治理的功能,包括IT资源整个生命周期的参数或配置的变化记录的治理.治理信息主要涉及分类、型号、版本、位置,状态、相关资料等根本信息还包括核心参数等
3.
4.8工程师考核绩效考核可以加快运维人才的培养,提升运维队伍专业技能素质,充分调动运维人员的工作热情和积极性,提升工作效率,最大限度地提升部门整体效益
3.
4.9知识库治理知识库治理知识库是提供给IT运维人员重要的技术资料内容,他聚集在工作的遇到的典型案例归纳总结的知识要点和全面实用资料手册.在本系统中,知识库治理提供便于使用的人机接口、快速查询的技术手段和维护手段.
3.
4.10统计及工作报告运维治理系统提供一线解决率统计、客户满意度统计、按分类的事件汇总统计、工作报告生成的功能,根据一定格式根据事件数据、工单数据、问题数据、配置数据、变更数据可以帮助运维治理者能把运维的所做的工作内容清楚的罗列出来.
4、人员治理
3.1轮岗原那么全体运维部人员统一治理,运维工程师实行轮岗制,坚持多岗锻炼、全面培养、科学配置、优化结构的原那么.>有利于治理技术人员多岗位实践锻炼,提升素质>有利于增强治理技术人员队伍建设,优化结构;>有利于增强治理技术人员队伍生机与活力,提升效率;工程师通过轮岗认定合格,个人技术到达相应水平的可以获得所在轮岗小组相对应级别的技能认定,各小组的技能认定做为工程师晋升等级的必要条件.
4.2工程师等级工程师等级按着IT运维技能、工作年限、学历、专业等因素划分为技术员、助理工程师、工程师、资深工程师、主管工程师、高级工程师、特级工程师、专家级工程师、教授级工程师、首席工程.4・3晋升原那么工程师晋升方案是为了完善人力资源成长机制,构建良性循环的人才梯队,实现部门可持续开展的目标.影响工程师晋升的因素包括工作量、绩效考核成绩、IT运维技能水平、工作年限、特殊技能等.〔具体见IT运维效劳部工程师职称晋升治理制度?〕。