还剩42页未读,继续阅读
本资源只提供10页预览,全部文档请下载后查看!喜欢就下载吧,查找使用更方便
文本内容:
IT运维服务部运营方案两篇篇一IT运维服务部运营方案
1、部门宗旨立足集团、结合集团业务工作及信息化建设实际,完善运维管理体系的建设,加强运维人员梯队建设,加强信息系统正常运行保障,”以流程为导向,以服务为核心”提高服务质量水平、转变服务理念、拓宽服务范围、提高服务效率、减少故障发生率,降低运维成本、提升用户服务满意度
2、业务范围基础业务IT基础设施运维(校园网、视频监控网、广播电视网、电话网、服务器及终端设备等);应用软件系统运维IDC机房运维;拓展业务承接网络工程、运维项目;IT咨询服务等等
3、运维服务管理体系运维服务管理体系规定了IT运维活动涉及的各类实体,以及这些实体间的相互关系相关的实体按照IT运维服务管理体系进行有机组织,并协调工作,按照服务协议要求提供不同级别的IT运维服务
3.1运维服务管理对象运维服务管理对象包括基础设施、应用系统、用户、供应商、以及IT运维部门和人员,具体内容如下⑴基础设施包括网络、主机系统、存储/备份系统、终端系统、安全系统、以及机房动力环境等工作报告生成的功能,按照一定格式根据事件数据、工单数据、问题数据、配置数据、变更数据可以帮助运维管理者能把运维的所做的工作内容清晰的罗列出来
4、人员管理
4.1轮岗原则全体运维部人员统一管理,运维工程师实行轮岗制,坚持多岗锻炼、全面培养、科学配置、优化结构的原则有利于管理技术人员多岗位实践锻炼,提高素质有利于加强管理技术人员队伍建设,优化结构;有利于增强管理技术人员队伍生机与活力,提高效率;工程师通过轮岗认定合格,个人技术达到相应水平的可以获得所在轮岗小组相对应级别的技能认定,各小组的技能认定做为工程师晋升等级的必要条件
4.2工程师等级工程师等级按着IT运维技能、工作年限、学历、专业等因素划分为技术员、助理工程师、工程师、资深工程师、主管工程师、高级工程师、特级工程师、专家级工程师、教授级工程师、首席工程
5.3晋升原则工程师晋升计划是为了完善人力资源成长机制,构建良性循环的人才梯队,实现部门可持续发展的目标影响T程师晋升的因素包括工作量、绩效考核成绩、TT运维技能水平、工作年限、特殊技能等(具体见《IT运维服务部工程师职称晋升管理制度》)
6.4绩效管理根据服务台、组长、组员等不同岗位提取考核指标,制定客观、明确的考核标准,选择科学合理的考核方法绩效考核要做到客观、公正、公开、公平、科学;真实、准确;民主与集中相结合;责、权、利相结合;定性与定量相结合;考核方法要科学、可行;考核周期要适当;考核等级或计分要合理;考核结果要反馈;考核人员要合格、到位;考核要规范化、制度化(具体内容需制定考核细则)
5、运维服务内容
6.1服务目标运维服务部提供的运行维护服务包括,信息系统相关的主机设备、操作系统、数据库和存储设备的运行维护服务,保证用户现有的信息系统的正常运行,降低整体管理成本,提高网络信息系统的整体服务水平同时根据日常维护的数据和记录,提供用户信息系统的整体建设规划和建议,更好的为用户的信息化发展提供有力的保障用户信息系统的组成主要可分为两类硬件设备和软件系统硬件设备包括网络设备、安全设备、主机设备、存储设备、通讯设备、监控设备等;软件设备可分为操作系统软件、典型应用软件(如数据库软件、中间件软件等)、业务应用软件等服务项目范围覆盖的信息系统资源以下方面的关键状态及参数指标运行状态、故障情况配置信息可用性情况及健康状况性能指标
7.2IT资产统计服务服务内容包括硬件设备型号、数量、版本等信息统计记录软件产品型号、版本和补丁等信息统计记录网络结构、网络路由、网络IP地址统计记录综合布线系统结构图的绘制其它附属设备的统计记录
5.3网络、安全系统运维服务从网络的连通性、网络的性能、网络的监控管理三个方面实现对网络系统的运维管理设备基础性能检测cpu、内存使用情况监测;设备日志查看;设备snmp状态;测试Ping,tracert等工具的连通性;网络安全策略应用是否正常;Internet带宽流量的实时监测;网络拓扑链路状态监测;异常网络数据包流量;Dos、ddos等网络攻击情况监测;Internet线路的误码率、丢包率监测;
5.4服务器、存储系统运维服务提供的服务器、存储系统的运维服务包括服务器、存储设备的日常监控,设备的运行状态监控,故障处理,操作系统维护,补丁升级等内容进行监控管理的内容包括CPU性能管理;内存使用情况管理;硬盘利用情况管理;系统进程管理;主机性能管理;实时监控主机电源、风扇的使用情况及主机机箱内部温度;监控主机硬盘运行状态;监控主机网卡、阵列卡等硬件状态;主机系统文件系统管理;监控存储交换机设备状态、端口状态、传输速度;监控备份服务进程、备份情况(起止时间、是否成功、出错告警);监控记录磁盘阵列等存储硬件故障提示和告警,并及时解决故障问题;对存储的性能进行监控
5.5数据库系统运维服务提供的数据库运行维护服务是包括主动数据库性能管理,数据库的主动性能管理对系统运维非常重要通过主动式性能管理可了解数据库的日常运行状态,识别数据库的性能问题发生在什么地方,有针对性地进行性能优化同时,密切注意数据库系统的变化,主动地预防可能发生的问题进行监控管理的内容包括数据库基本信息文件系统、碎片、死锁、CPU占用率较大或时间较长的SQL语句表空间使用信息监测;数据库文件I/O读写情况;Session连接数量监控;数据库监听运行状态监测;查看每日数据备份、数据同步是否正常;报警日志监测;对表和索引进行Analyze,检查表空间碎片;检测数据库后台进程;数据库对象的空间扩展情况监测;
5.6桌面、终端运维服务负责对终端PC、笔记本以及工作站的操作系统、应用软件和硬件的维护,解决使用人员在应用过程中遇到的问题并进行简单培训,完成打印机、考勤机、消费机等其他终端的故障处理工作
6、应急服务响应措施运维项目组制定了详尽的应急处理预案,整个流程严谨而有序但在服务维护过程中,意外情况将难以完全避免我们将对项目实施的突发风险进行详细分析,并且针对各类突发事件,设计了相应的预防与解决措施,同时提供了完整的应急处理流程
5.1应急预案实施基本流程
6.2突发事件应急策略1值班人员平时应做好应急事件的监控工作,对于突发事件应认真分析、准确判定故障发生的数据域,负责跟踪该事件直至其结束对于不在运维中心的故障,应在第一时间内通知负责人去现场处理,密切关注事件流程及进展情况,并做好登记工作上报领导2正常情况下,要求值班人员在10分钟内进行事件确认如果属于一般事件则按照事件流程进行分派处理,否则应迅速启动《应急预案》,并严格按照《应急预案》所规定的步骤快速实施应急处置,及时汇报上级领导,掌握实时处理情况3在处理过程中,如需其他部门去现场增援处理,应及时向上级领导部门汇报,协调沟通,尽快联系技术工程师或厂家技术支持赶赴现场援助处理
7、服务管理模式
6.1服务模式由IT运维服务部对整个集团现有IT资源进行普查,并根据普查结果并参考市场运维价格制定运维外包协议,价格至少要比市场价格低三分之一,由信息处牵头与IT运维服务部签订IT运维外包协议,根据协议价格由集团按月拨付运维费用
7.2服务时间在工作时间内设置由专人职守的热线电话,非工作时间设置有专人7*24小时接听的移动电话热线,接听服务请求,并记录服务台事件处理结果e服务响应时间故障级别响应时间故障解决时间10分钟,30分钟I级属于紧急问题;其具体现象为系内提交故障处理4小时以内统崩溃导致业务停止、数据丢失方案10分钟,2小时内II级属于严重问题;其具体现象为出提交故障处理方现部分部件失效、系统性能下降但能正常6小时以内案运行,不影响正常业务运作20分钟,2小时内III级属于较严重问题;其具体现象为提交故障处理方出现系统报错或警告,但业务系统能继续12小时以内案运行且性能不受影响IV级属于普通问题;其具体现象为30分钟,4小时市系统技术功能、安装或配置咨询,或其他提交故障处理方24小时以内显然不影响业务的预约服务案
7.2行为规范1遵守集团的各项规章制度,严格按照集团相应的规章制度办事2与集团运行维护体系其他部门和环节协同工作,密切配合,共同开展技术支持工作3出现疑难技术、业务问题和重大紧急情况时,及时向负责人报告4现场技术支持时要精神饱满、态度温和接听电话时要文明礼貌,语言清晰明了,语气和善5遵守保密原则对集团的网络、主机、系统软件、应用软件等的密码、核心参数、业务数据等负有保密责任,不得随意复制和传播篇二IT运维服务运营方案运行维护服务包括,信息系统相关的主机设备、操作系统、数据库和存储设备及其他信息系统的运行维护与安全防范服务,保证用户现有的信息系统的正常运行,降低整体管理成本,提高网络信息系统的整体服务水平同时根据日常维护的数据和记录,提供用户信息系统的整体建设规划和建议,更好的为用户的信息化发展提供有力的保障用户信息系统的组成主要可分为两类硬件设备和软件系统硬件设备包括网络设备、安全设备、主机设备、存储设备等;软件设备可分为操作系统软件、典型应用软件(如数据库软件、中间件软件等)、业务应用软件等通过运行维护服务的有效管理来提升用户信息系统的服务效率,协调各业务应用系统的内部运作,改善网络信息系统部门与业务部门的沟通,提高服务质量结合用户现有的环境、组织结构、IT资源和管理流程的特点,从流程、人员和技术三方面来规划用户的网络信息系统的结构将用户的运行目标、业务需求与IT服务的相协调一致信息系统服务的目标是,对用户现有的信息系统基础资源进行监控和管理,及时掌握网络信息系统资源现状和配置信息,反映信息系统资源的可用性情况和健康状况,创建一个可知可控的IT环境,从而保证用户信息系统的各类业务应用系统的可靠、高效、持续、安全运行服务项目范围覆盖的信息系统资源以下方面的关键状态及参数指标运行状态、故障情况配置信息可用性情况及健康状况性能指标统计运维数据、提供信息系统管理和工作报告、归纳总结并提供用户想了解的数据报告信息资产统计服务此项服务为基本服务,包含在运行维护服务中,帮助我们对用户现有的信息资产情况进行了解,更好的提供系统的运行维护服务服务内容包括硬件设备型号、数量、版本等信息统计记录软件产品型号、版本和补丁等信息统计记录网络结构、网络路由、网络IP地址统计记录综合布线系统结构图的绘制其它附属设备的统计记录硬件设备清单如下表统计网络、安全系统运维服务从网络的连通性、网络的性能、网络的监控管理三个方面实现对网络系统的运维管理网络、安全系统基本服务内容序服务模块内容描述提供方号配合用户进行,按备件到达1现场备件安装现场时间工程师到达现场首先分析软件升级的必要性和风险,配合用户进行软2现场软件升级件升级⑵应用系统包括内部办公、教学系统、门户网站、各类应用系统等3用户包括使用如上IT应用系统的用户⑷供应商包括基础设施和应用系统的供应商等⑸运维部门和人员包括IT运维服务部及集团内部参与IT运维活动的相关部门和人员
3.2运维系统功能框架根据集团的系统结构和业务开展需要,IT运维服务部将维护框架分为8个具体组成部分,分别为服务台、事件管理、工单管理、问题管理、变更管理、配置管理、工程师考核、知识库管理、统计等9个子项而具体运维流程将以此为依据开展工作
3.3运维管理组织结构IT运维服务部的运维管理结构位三层模式,具体如下图所示由运维部负责人与集团进行业务范围接洽,并签订外包协议,负责集团整体运维工作,包括各按服务级别7义24小时3现场故障诊断5X8小时4电话远程技术支持7X24小时对遇到的问题进行汇总和5问题管理系统发布网络核心交换机巡视典型作业计划书系统管理单位维保单位设备名设备型号管理IP:参考机检查结巡视方法描巡检周检查内容检查结论准果述期电源运行状口正常口态异常硬件风扇运行状口正常口运行态异常状态模块运行状口正常口态异常系统口正常口VLAN状态运行异常状态口正常口配置状态检查异常口正常口OSPF状态异常日志口正常口日志状态检查异常口正常口异常其他口正常口检查异常内容口正常口异常用户现场技术人员值守根据用户的需求提供长期的用户现场技术人员值守服务,保证网络的实时连通和可用,保障接入交换机、汇聚交换机和核心交换机的正常运转现场值守的技术人员每天记录网络交换机的端口是否可以正常使用,网络的转发和路由是否正常进行,交换机的性能检测,进行整体网络性能评估,针对网络的利用率进行优化并提出网络扩容和优化的建议现场值守人员还进行安全设备的日常运行状态的监控,对各种安全设备的日志检查,对重点事件进行记录,对安全事件的产生原因进行判断和解决,及时发现问题,防患于未然同时能够对设备的运行数据进行记录,形成报表进行统计分析,便于进行网络系统的分析和故障的提前预知具体记录的数据包括:配置数据性能数据故障数据现场巡检服务现场巡检服务是对客户的设备及网络进行全面检查的服务项目,通过该服务可使客户获得设备运行的第一手资料,最大可能地发现存在的隐患,保障设备稳定运行同时,将有针对性地提出预警及解决建议,使客户能够提早预防,最大限度降低运营风险巡检包括的内容如下编号巡检内容硬件运行状态检查项目单板状态检查电源模块状态检查风扇状态检查整机指示灯状态机框防尘网检查机房温度、湿度检查1检查设备地线检查软件运行情况检查项目设备运行情况检网络报文分析设备对接运行状况检2查查路由运行情况检查网络整体运行情况1周查3网络运行问题调网络变更情况调查网络历史故障调查查网络运行分析与管理服务网络运行分析与管理服务是指工程师通过对网络运行状况、网络问题进行周期性检查、分析后,为客户提出指导性建议的一种综合性高级服务,其内容包括:服务内容服务优点向客户提供网络专家电话号码保证重大问题第一连线至网络专家网络专家组每周与客户进行不少于2以最小成本保证及时解答客户关心的小时的电话技术交流技术问题,并就某一领域技术问题展开深层次沟通使客户了解网络历史故障情况以及故每月向客户提交CASE汇总分析报告,障预防建议,最大程度减少网络故障隐并可扩展到每年17次(月度、季度、患,更高效的进行网络管理年度)重要时刻专人值守服务保证重要时刻设备稳定运行对客户成功尤为关键,因此,可对客户提供重要时刻的专人现场值守支持,包括政府客户的重大会议期间、金融客户的年终结算日、运营商客户的生产网重大割接或其它任何客户认为可能对其业务运营产生重大影响的时刻如需专人值守,客户需至少提前3周与授权服务商客户服务经理联系对每位合约客户,授权服务商均需按事先合同约定提供专人值守服务客户如需超出合同约定范围的更多值守支持,需额外支付相应人力和差旅费用主机、存储系统运维服务主机、存储系统的运维服务包括主机、存储设备的日常监控,设备的运行状态监控,故障处理,操作系统维护,补丁升级等内容主机存储系统基本服务内容序服务模块内容描述提供方号配合用户进行按备件到达现场时间1现场备件安装工程师到达现场消除软件漏洞给系统带来的安全隐2补丁服务患,并对安装补丁所引起的系统连锁反应进行合理的平衡对系统进行软件或硬件的升级,以改3升级服务进、完善现有系统或消除现有系统的漏洞按服务级别7X24小时4现场故障诊断5X8小时5电话远程技术支持7X24小时6问题管理系统对遇到的问题进行汇总和发布对客户系统的括主机、存储设备、操7系统优化作系统、提供优化服务现场值守人员可进行监控管理的内容包括:CPU性能管理;内存使用情况管理;硬盘利用情况管理;系统进程管理;主机性能管理;实时监控主机电源、风扇的使用情况及主机机箱内部温度;监控主机硬盘运行状态;监控主机网卡、阵列卡等硬件状态;监控主机HA运行状况;主机系统文件系统管理;监控存储交换机设备状态、端口状态、传输速度;监控备份服务进程、备份情况(起止时间、是否成功、出错告警);监控记录磁盘阵列、磁带库等存储硬件故障提示和告警,并及时解决故障问题;对存储的性能(如高速缓存、光纤通道等)进行监控小型机系统巡检典型作业计划书(HP服务器部分)系统管理单位设备型设备序号列号设备名管理IP:参考标检查结状态是否正巡检方法巡检周检查内容准果常描述期硬・正常口电源指示灯异常件面板指示灯■正常口异运小型机系统巡检典型作业计划书(HP服务器部分)系统管理单位设备型设备序号列号设备名管理IP:参考标检查结状态是否正巡检方法巡检周检查内容准果常描述期行常状■正常口异内置磁带机态常■正常口异CPU状态常■正常口异内存状态常■正常口异磁盘状态常■正常口异网卡状态常HBA卡运行状■正常口异态常系系统日志■正常口异小型机系统巡检典型作业计划书(HP服务器部分)系统管理单位设备型设备序号列号设备名管理IP:参考标检查结状态是否正巡检方法巡检周检查内容准果常描述期统常检■正常口异Mail查常文件系统,包,正常口异括磁盘卷剩余常空间■正常口异硬件检测常■正常口异交换分区常■正常口异固件版本常■正常口异补丁包版本常小型机系统巡检典型作业计划书(HP服务器部分)系统管理单位设备型设备序号列号设备名管理IP:参考标检查结状态是否正巡检方法巡检周检查内容准果常描述期■正常口异系统镜像常■正常口异存储磁盘常■正常口异存储驱动常■正常口异进程状态常■正常口异CPU利用率系常■正常口异统性内存利用率能检常■正常口异查磁盘I/O性能常小型机系统巡检典型作业计划书(HP服务器部分)系统管理单位设备型设备序号列号设备名管理IP:参考标检查结状态是否正巡检方法巡检周检查内容准果常描述期数据库安装目■正常口异数录常据库运数据库进程状■正常口异行态常状态集■正常口异集群进程状态群常检■正常口异集群日志查常存储设备故障■正常口异存灯状态常储检SAN交换机端■正常口异查口状态常种制度的制定和实施各运维组组长负责本小组规范化、标准化建设,建立运维档案、知识库等,并带领小组成员进行运维工作各小组成员在小组长的指导下开展维护工作
3.
3.1运维部负责人职责负责部门整体运营,规划、执行、完善信息化运维工作职位描述
1、整体负责运维服务项目计划的制定,领导各组组长并安排运维工作,每周听取各组组长的工作汇报,负责考核各组组长工作完成情况
2、根据运维目标,指导各小组组长开展用户服务工作,确保运维工作能够满足用户的实际需要;
3、建立和持续完善运维管理体系,优化运维流程流程,解决运维服务中出现的特殊问题;
4、规划并提升运维工程师专业服务能力,在整体上提高用户满意度;
5、制定和持续完善绩效考核体系;
6、制定整理运维项目的应急预案系统,并指导运维工程师实施;小型机系统巡检典型作业计划书(HP服务器部分)系统管理单位设备型设备序号列号设备名管理IP:参考标检查结状态是否正巡检方法巡检周检查内容准果常描述期存储交换机环■正常口异境状态常■正常口异系统故障报告常数据库系统运维服务数据库运行维护服务是包括主动数据库性能管理,数据库的主动性能管理对系统运维非常重要通过主动式性能管理可了解数据库的日常运行状态,识别数据库的性能问题发生在什么地方,有针对性地进行性能优化同时,密切注意数据库系统的变化,主动地预防可能发生的问题数据库运行维护服务还包括快速发现、诊断和解决性能问题,在出现问题时,及时找出性能瓶颈,解决数据库性能问题,维护高效的应用系统数据库运行维护服务,主要工作是使用技术手段来达到管理的目标,以系统最终的运行维护为目标,提高用户的工作效率具体数据库运行维护监控的基本服务内容包括序服务模块内容描述提供方号每周7天,每天24小时支持中心电话,隹子邮件答询,以满足业务发展的需要1Oracle产品技术专家直接同客户对话,帮或Oracle数据库解决客户提出的疑难问题7*24电话支持服1根据问题的严重程度,将优先解决客户认为务是关键而紧急的任务对客户提出的一般性问题进行技术咨询、指导定期的客户管理报告,避免问题再度发生数据库宕机Oracle数据库产数据坏块品2影响业务不能进行的产品问题现场服务响应软件产品的更新及维护对系统的配置及运作框架提出建议,以帮助您得到一个更坚强可靠的运作环境Oracle数据库产降低系统潜在的风险,包括数据丢失、安全品3漏洞、系统崩溃、性能降低及资源紧张检查系统健康检查并分析系统日志及跟踪文件,发现并排除数据库系统错误隐患检查数据库系统是否需要应用最新的补丁序服务模块内容描述提供方号集检查数据库空间的使用情况协助进行数据库空间的规划管理检查数据库备份的完整性监控数据库性能确认系统的资源需求明确您系统的能力及不足优化Oracle Server的表现通过改善系统环境的稳定性来降低潜在的系统宕机时间分析用户的应用类型和用户行为评价并修改ORACLE数据库的参数设置评价并调整ORACLE数据库的数据分布Oracle数据库产评价应用对硬件和系统的使用情况,并提出品4建议性能调优利用先进的性能调整工具实施数据库的性能调整培训用户有关性能调整的概念提供用户完整的性能调整报告和解决方法中间件运维服务中间件管理是指对BEA Weblogic、MQ等中间件的日常维护管理和监控工作,提高对中间件平台事件的分析解决能力,确保中间件平台持续稳定运行中间件监控指标包括配置信息管理、故障监控、性能监控执行线程监控WebLogic配置执行线程的空闲数量JVM内存JVM内存曲线正常,能够及时的进行内存空间回收JDBC连接池连接池的初始容量和最大容量应该设置为相等,并且至少等于执行线程的数量,以避免在运行过程中创建数据库连接所带来的性能消耗检查WEBLOG日志文件是否有异常报错如果有WEBLOG集群配置,需要检查集群的配置是否正常运维服务流程建议用户采用的服务方式为两种一种为技术人员现场值守,另一种是定期巡检结合故障现场服务技术人员现场值守运行维护服务的基本操作流程如下图所示:IT资资资资资资资资资资资资资资资资资资定期巡检结合故障现场运行维护服务的基本操作流程如下图所示:服务管理制度规范服务时间接收服务请求和咨询在5*8小时工作时间内设置由专人职守的热线电话,接听内部的服务请求,并记录服务台事件处理结果在非工作时间设置有专人7*24小时接听的移动电话热线,用于解决内部的技术问题以及接听7*24小时机房监控人员的机房突发情况汇报服务响应时间:故障级别响应时间故障解决时间30分钟,2小时内I级属于紧急问题;其具体现象为系提交故障处理方12小时以内统崩溃导致业务停止、数据丢失案30分钟,2小时内II级属于严重问题;其具体现象为出提交故障处理方现部分部件失效、系统性能下降但能正常24小时以内案运行,不影响正常业务运作30分钟,2小时内III级属于较严重问题;其具体现象为提交故障处理方出现系统报错或警告,但业务系统能继续48小时以内案运行且性能不受影响IV级属于普通问题;其具体现象为30分钟,2小时内系统技术功能、安装或配置咨询,或其他提交故障处理方5天内显然不影响业务的预约服务案技术支持人员在解决故障时,会最大限度保护好数据,做好故障恢复的文档,力争恢复到故障点前的业务状态对于“系统瘫痪,业务系统不能运转”的故障级别,如果不能于12小时内解决故障,将在16小时内提出应急方案,确保业务系统的运行故障解决后24小时内,提交故障处理报告说明故障种类、故障原因、故障解决中使用的方法及故障损失等情况行为规范遵守用户的各项规章制度,严格按照用户相应的规章制度办事与用户运行维护体系其他部门和环节协同工作,密切配合,共同开展技术支持工作出现疑难技术、业务问题和重大紧急情况时,及时向负责人报告现场技术支持时要精神饱满,穿着得体,谈吐文明,举止庄重接听电话时要文明礼貌,语言清晰明了,语气和善遵守保密原则对被支持单位的网络、主机、系统软件、应用软件等的密码、核心参数、业务数据等负有保密责任,不得随意复制和传播现场服务支持规范运维服务人员要做到耐心、细心、热心的服务工作要做到事事有记录、事事有反馈、重大问题及时汇报严格遵守工作作息时间,严格按照服务工作流程操作现场支持工程师应着装整洁、言行礼貌大方,技术专业,操作熟练、严谨、规范;现场支持时必须遵守用户单位的相关规章制度现场支持工程师在进行现场支持工作时必须在保证数据和系统安全的前提下开展工作现场支持时出现暂时无法解决的故障或其他新的故障时,应告知用户并及时上报负责人,寻找其他解决途径故障解决后,现场支持工程师要详细记录问题的发生时间、地点、提出人和问题描述,并形成书面文档,必要时应向用户介绍故障出现的原因及预防方法和解决技巧问题记录规范根据使用人员提出问题的类别,将问题分为咨询类问题和系统缺陷类问题二类:咨询类问题是指通过服务热线或现场解疑等方式能够当场解决用户提出的问题,具有问题解答直接、快速和实时的特点,该问题到现场支持人员处即可中止,对于该类问题的记录可使用咨询类问题记录模版进行记录系统缺陷类问题是指使用人员提出的问题涉及到系统相应环节的确认修改,需要经过逐级提交、诊断、确认、处理和回复等环节,处理解决需要项目组的分析确认,问题有解决方案后,将解决方案反馈给用户具体提交流程如下问题提交应用信息系统的用户发现属于系统缺陷类的问题时,填写系统缺陷类问题提交单,提交服务支持中心问题分析服务中心接到用户提交的问题单,要组织相应人员对问题单中描述的问题进行分析研判,确定问题的类型(技术问题、业务问题或者操作问题)属于技术问题,提交服务中心技术人员对存在的问题提出具体的处理意见和建议;属于业务问题,提交服务中心业务人员进行处理;属于操作问题,可安排相关人员对问题提出人进行解释,并将系统缺陷类问题提交单转为系统咨询类问题提交单问题确认、解决服务中心的技术人员和业务人员收到系统缺陷类问题提交单后,对提交的问题进行归类汇总和分析、确认可以解决的,明确问题解决的具体处理建议和措施,经主管领导签字同意后,交实施人员进行解决方案的实施服务人员确认是否解决,并将解决方法附在系统缺陷类问题提交单上反馈给问题提出人员问题上报服务人员收到经业务或技术人员确认的系统缺陷类问题提交单后,上报服务中心问题回复服务中心根据提交问题的进行分析,制定解决方案并进行实施的解决,同时做好变更记录将解决方案汇总后及时向问题提交单位或问题交办单
3.
3.2总工职责网络规划、网络建设方案制定,核心网络设备管理,对网络组工作进行技术支持职位描述
1、集团通信网、电话网、广播电视网、监控网等网络的规划、建设方案制定
2、网络核心设备(路由器、防火墙、交换机等)的运行维护与管理
3、绘制网络拓扑图、制定网络核心设备配置参数信息档案、建立网络核心设备台账等
4、对网络组工作进行技术支持与指导
3.
3.3服务台职责故障电话受理,文档管理、人员管理、数据统计职位描述
1、负责IT业务的救助电话的受理工作;
2、故障处理的发起人,同时进行维护工程师指派,跟踪事件处理状态;
3、进行维护故障统计、用户满意度统计、工作报表输出等工作;
4、协助部门负责人,进行文档整理、归类、保存等工作
5、协助部门负责人,进行人员考核管理、工资核算等
3.
3.4网络组职责网络线路维护管理,维护集团网络系统正常,解决网络相关故障,网络项目的建设等职位描述:位作出回复,并将分析过程和问题产生原因一并提交应急服务响应措施针对项目制定了详尽的设计、应急处理预案,整个流程严谨而有序但是,在服务维护过程中,意外情况将难以完全避免下面,我们将对项目实施的突发风险进行详细分析,并且针对各类突发事件,设计了相应的预防与解决措施,同时提供了完整的应急处理流程应急基本流程问题报告单处理记录情况通报单维护服务应急处理流程预防措施针对上门服务过程中可能遇到的各种各样的风险,针对一些可能出现的情况,制定了一系列预防处理措施,举例如下:类型事件预防措施处理无法启动软件可执行上门人员提前准备好将应用软件数据文应用软件文件各类需维护软件安装件备份后,重新安装类型事件预防措施处理程序上门人员准备好安装判断出错原因,备份软件打开过程中或运程序,操作系统优化和数据,采取相关修复行中异常错误关闭修补软件,查杀病毒软措施件使用者本机操作系统准备好系统检查程序告知使用者错误原异常或系统资源占用及修补程序,以及查因可能类型,提出解决方案,经使用者认严重杀病毒软件操作系统可后采取相应措施检查IE浏览器选项B/S结构系统,IE浏准备流氓软件清理程设置,分析原因进行览器异常或无法下载序、修复浏览器软件、修复控件查杀病毒软件检查网络流量,流量B/S结构系统网络流判断服务器是否异网络或服异常小则报修网络量异常或服务器登录常,否则准备杀毒软务器服务商,流量异常大异常件则查杀病毒突发事件应急策略系统运维应急方案是对中断或严重影响业务的故障,如宕机、数据丢失、业务中断等,进行快速响应和处理,在最短时间内恢复业务系统,将损失降到最低在系统维护过程中,突发事件的出现将是很难完全避免的,针对这种情况,设计了完善的突发事件应急策略系统巡检人员要定期规范检查各硬件设备的运转情况和应用软件运行情况,同时做好日常的数据增量备份和定期全备份对发现的问题在报各级负责人的同时,要协调相关资源分析问题根源,确定解决方案和临时解决措施,避免造成更大的影响问题得到稳定或彻底解决后,要形成问题汇报,避免以后类似重大紧急情况的发生对发现的问题在报负责人的同时,要协调相关资源分析问题根源,确定解决方案和临时解决措施,避免造成更大的影响问题得到稳定或彻底解决后,要形成问题汇报,避免以后类似重大紧急情况的发生当获悉出现突发事件时,技术支持人员可以立即从知识库中获取相应的应急策略,并综合用户方的具体情况,给出相关解决方案,然后在第一时间以电话、邮件支持或现场服务的方式帮助用户解决问题,尽最大努力减小突发事件对用户日常应用的影响紧急情预防措施应急策略况硬件损在磁盘数据未丢失情况下,保证数项目单位操作用电脑硬件损坏坏据安全性,建议项目单位替换相关硬件加强培训力度,掌握培训效果,操作失误未造成即成结果或数据未操作失检验操作人员操作水准,提示丢失情况下,保障数据安全,反之,误注意事项协调相关部门,进行补救对操作人员强调注意事项
1、对现有网络设备(非核心)、局域网络及配线间的日常管理维护;
2、保证外网光纤线路正常,保证局域网运行正常;
3、对网络系统和网络设备的运行状态进行监控;
4、保障通讯网、监控网、广播电视网正常运行,及时解决故障
5、编写网络部分的应用处理预案并实施
6、网络项目的建设施工
3.
3.5服务器组职责服务器软硬件、操作系统、数据库、安全软件、应用系统等运行维护以及数据的安全管理职位描述
1、监测服务器软硬件运行状况,性能监视及优化,作必要调整;
2、及时处理服务器软硬件遇到的故障并做好记录;
3、监测业务系统运行状况,应用、数据库性能监视及优化,作必要调整,保证应用和数据库系统的安全性、完整性和运行效率;
4、及时处理应用系统、数据库等遇到的故障并做好记录;
5、制订备份、恢复、迁移和灾备策略,根据业务的需要执行数据转换及迁移等操作;
6、及时更新操作系统、安全软件等系统补丁,保障系统的安全;
3.
3.6桌面组职责维护集团桌面系统运行正常,解决终端、外设故障,保障应用系统客户端正常运行职位描述:
1、各部门电脑、打印机、考勤机、消费机等的维护;
2、ERP、CRP、一卡通等各应用系统客户端的维护、技术支持及培训工作;
3、Windows Office等及其它办公软件维护、技术支持及培训工作
3.
3.7IDC机房组职责维护集团桌面系统运行正常,解决终端、外设故障,保障应用系统客户端正常运行职位描述
1、机房电力、精密空调、UPS等设备的监控、维护与管理;
2、机房通信线路、网络设备、服务器等的日常监控、维护及管理;
3、检查系统设备,排除安全隐患;
4、分析系统日志,及时发现异常现象;
5、机房日常报表的填报与汇总
3.
3.8各组组长职责各小组组长除具有本小组所有职责外还应该包括制度建设、人员培训、设备管理等相应职责
3.4运维服务流程IT运维服务管理流程涉及服务台、事件管理、问题管理、配置管理、变更管理、发布管理、服务级别管理、财务管理、能力管理、可用性管理、服务持续性管理、知识管理及供应商管理等,随着运维活动的不断深入和持续改进,其他流程可能会逐步独立并规范
3.
4.1项目运维服务工作流程图专,J人各种来源的员服务请求
3.
4.2服务台服务台是支持IT运维服务的核心功能,与各个流程联系密切所有管理流程都要通过服务台为用户提供单点联系,解答用户的相关问题和需求,或为用户寻求相应的支持人员在本系统中,服务台是接收各种来源服务请求和相关信息反馈的唯一入口和出口,同时服务台还负责一般请求、通过知识库(历史事件)能够解决的请求;他也是复杂问题二线处理的桥梁
3.
4.3事件管理事件管理流程的主要目标是尽快恢复IT服务提供并减少其对业务的不利影响,尽可能保证最好的IT服务质量和可用性等级事件管理流程通常涉及事件的侦测和记录、事件的分类和支持、事件的调查和诊断、事件的解决和恢复以及事件的关闭本系统把所有服务请求和报警归结为事件事件管理是提供服务台和事件管理者对于事件记录、处理、查询、审核、派发等功能它也包括通过和IT监控系统对接,把其发送报警形成事件的功能
3.
4.4工单管理工单管理工单是IT现场运维、二线支持的任务载体,运维工程依据所接收工单进行IT运维工作工单管理是对工单实现创建、变更、查询浏览、派发、监督等功能的模块
3.
4.5问题管理问题管理流程的主要目标是预防问题和事故的再次发生,并将未能解决的事件的影响降低到最小问题管理流程包括诊断事件根本原因和确定问题解决方案所需要的活动,通过合适的控制过程,尤其是变更管理和发布管理,负责确保解决方案的实施问题管理还将维护有关问题、应急方案和解决方案的信息问题管理是针对已处理事件的遗留问题或处理事件的方案只是治标不治本的不能彻底解决问题而考虑的模块根据事件、及处理方案,问题处理人经过调查、诊断并提出最终解决方法
3.
4.6变更管理变更管理实现所有IT基础设施和应用系统的变更,变更管理应记录并对所有要求的变更进行分类,应评估变更请求的风险、影响和业务收益其主要目标是以对服务最小的干扰实现有益的变更变更管理是要对重大IT资源的新增、变更、升级等IT运维活动进行审核的功能,以免这些活动对现有IT资源的可用性造成没有必要的影响和破坏;同时,他还要实现在工单中产生的变化进行后审计的功能
3.
4.7配置管理配置管理流程负责核实IT基础设施和应用系统中实施的变更以及配置项之间的关系是否已经被正确记录下来;确保配置管理数据库能够准确地反映现存配置项的实际版本状态配置管理实际上是全部IT资源的统一管理的功能,包括IT资源整个生命周期的参数或配置的变化记录的管理管理信息主要涉及分类、型号、版本、位置,状态、相关资料等基本信息还包括核心参数等
3.
4.8工程师考核绩效考核可以加快运维人才的培养,提高运维队伍专业技能素质,充分调动运维人员的工作热情和积极性,提高工作效率,最大限度地提高部门整体效益
3.
4.9知识库管理知识库管理知识库是提供给IT运维人员重要的技术资料内容,他汇集在工作的遇到的典型案例归纳总结的知识要点和全面实用资料手册在本系统中,知识库管理提供便于使用的人机接口、快速查询的技术手段和维护手段c
3.
4.10统计及工作报告运维管理系统提供一线解决率统计、客户满意度统计、按分类的事件汇总统计、。