摘要
2021年5月,我作为系统规划与管理师主持了XX市“平安XX”“智慧安防”系统的运维项目(包1,东片区监控运维服务),该项目合同金额为348.81万元,运维期为3年。该项目运行维护的内容主要有:线路传输(前端相机至后端服务器、存储之间的所有网络设备的维护和故障排除);前端设备(摄像机、辅材辅件如杆件、补光灯、设备箱、设备取网取电等);其他(公安视频联网平台、点位增删改、监控经纬度、一机一档台帐管理)等;在团队成员的共同努力下,该项目运行的十分平稳,在安保维稳、打击犯罪、服务群众的工作中发挥了非常重要的作用。本文就结合该项目从人员要素、技术要素、资源要素、过程要素四方面对服务运营管理进行阐述。290
正文
近年来,XX市先后展开了“平安XX”“智慧安防”、“长江大保护技防中心”、“人员密集场所增建人脸设别”等公安信息化项目建设,建设内容涵盖视频监控、车辆卡口、人脸设别等前端感知设备及后端应用平台,感知网的整体覆盖面较此前有了大幅度的提升,在安保维稳、打击犯罪、服务群众的工作中发挥了非常重要的作用。
“平安XX”“智慧安防”项目于2016年建设,项目包含视频监控(6917个)、系统平台、公安机房等内容,整体项目分两个批次于2021年5月和2021年12月分别到期,新一期的运维项目(包1、包2、包3)由XX市公安局公开招标,我司于2021年5月顺利中标包1(东片区监控运维服务),项目合同金额为348.81万元,运维期为3年。由于我有过类似运维项目的成功管理经验,公司认命为我为该项目的系统规划与管理师,全面负责该项目的运维管理工作。项目的主要运行维护内容有:线路传输(前端相机至后端服务器、存储之间的所有网络设备的维护和故障排除);前端设备(摄像机、辅材辅件如杆件、补光灯、设备箱、设备取网取电等);其他(公安视频联网平台、点位增删改、监控经纬度、一机一档台帐管理)等。要求7×8×365小值守,故障解决时间由故障级别定义,例如故障级别Ⅰ级,其具体现象为严重影响系统的正常运行,要求接报30分钟到达现场,到达现场1小时内提交问题解决方案,3小时内解决故障(特殊情况,由甲方电话通知或下发纸质通知单,3小时内应修复)。每日进行日常巡检,每月为客户提供系统运行报告报表等。 602
IT服务运营是提升IT服务自身质量的关键,能为客户提供低成本高质量的IT服务,也是确保业务连续性、提升企业整体竞争力的重要手段。为做好该项目的运维工作,我认真参照ITSS的要求,在完成服务规划设计和部署实施的基础上,加强了服务运营的管控,特别是强化了服务台管理和人员绩效考核,加强与干系人的沟通。本文我以该项目为例,从人员要素、技术要素、资源要素、过程要素四方面对论述了IT服务的运营管理。
一、人员要素
由于本项目运维区域覆盖XX市整个东片区,对服务的可用性连续性要求较高,因此我重点关注人员管理的关键成功因素:1、人员是否具有成熟的知道管理体系。2、岗位培训是否充足且适用。3、团队能力的互备性。4、人员绩效考核指标设定是否符合SMART原则。5、人员绩效考核结果应用是否真正落地有效。6、进行人员服务意识、沟通能力培训。7、建立良好的沟通协作机制。8、设计有效的人员储备管理措施等。为此,我针对性的加强了人员培训管理和能力管理,采取了内部资深员工培训和外聘厂家进行培训相结合的方式,提升人员的服务能力,并建立成熟的知识管理体系,同时加强了人员储备管理和绩效考核管理,在重要岗位设备AB角等等。
通过上述多措并举,我们充分的调动人员和积极性,稳定服务团队,保证服务项目人员的连续性,确保人员能力跟上客户需求的变化发展。
二、技术要素
技术要素管理是保证SLA高标准完成的前提,具体包括对技术研发规划、技术研发预算、技术成果运用与改进等几方面进行有效管理。
例如,在技术成果运用与改进中我重点建立了以知识为中心的知识共享体系,促进知识的交流和共享,这有助于提高知识管理的效率和效果。便有助于有计划地、合理地利用技术力量和资源,确保SLA的高标准地完成。
三、资源要素
资源要素是IT服务的基础保障,决定着IT服务的效率。资源要素管理的工作主要包括服务台管理、备品备件库管理、工具管理、知识库管理等。结合此项目的特点,我加了备品备件的管理,针对故障率的设备提前做好申请,然后按规范流程及时申请、采购、到货入库验收登记,需要时做好领用交接手续和台帐登记等,制定了备件报废流程。确保了备品备件的可用性。另外还通过获取、共享、保留、评审的步骤来加强知识管理。
在运维服务中,服务台是一个极为重要的组成部分,通常为所有问题的统一服务窗口,结合该项目的特点,我要求服务台重点做好以下工作:1、及时响应呼叫请求并及时完整记录,如故障报修、参数配置、客户投诉与建议等。2、发布信息:主要是通过内部网站或邮件、电话等方式将消息发布至对应的技术对口人。3、联络供应商:涉及外部联络的统一由服务进行对接,比如联系监控设备供应商、网络设备供应商等。4、基础运营任务:如网点新增监控设备参数配置、工号管理、监控中心服务器定期备份等。5、基础设施监控:利用监控平台对所有接入设备的运行情况、网络连接情况和中心服务器的负载等情况进行监控.(响应呼叫请求、发布信息、联络供应商、运营任务、基础设施监控等。)
通过上述几方面的管理,服务运营的资源得到了有效保障。
四、过程要素
过程要素管理包括服务级别管理、服务报告管理、事件管理、问题管理、配置管理、变更管理、发布管理、信息安全管理、可用性和连续性管理、容量管理等。做为系统规划与管理师,对这些流程进行有效的支持并确保执行。
例如在此项目中我们重点关注了事件管理和问题管理,如针对网点摄像机掉线的问题,我们按流程对事件进行受理与处理,对事件进行监控与跟踪,按故障级别对事件进行升级,故障解决完成后进行满意度调查,并完成事件报告。同时做好更新知识库,预防同类事件重复发生做的问题管理。在所有处理过程中注重事件管理和问题管理过程的完整性。经过项目团队的磨合和配合,问题解决效率越来越高。
项目历练三年后,本运维合同到期。通过我们团队有效的全生命周期的保障,“平安XX”“智慧安防”系统的前端感知设备及后端应用平台均运行平稳,在安保维稳、打击犯罪、服务群众的工具均发挥了重要作用。项目的成功无疑与有效的运营管理是分不开的,当然在整 个项目运维过程中有有存在不足,如在项目初期,没有做好部份工具的管理工作,导致对某品牌的监控设备的故障处理时间较长,后期经过我与团队的调整修订该问题得到了很好的解决。该项目使我充分认识到了服务运营对项目运维的重要性。为学患无疑,疑则有进,在系统规划与管理这个浩瀚无边的大海里,时刻保持空杯心态,学而致知,行而致远,知行合一方能获得成功。 2373
因此我重点关注人员管理的关键成功因素:1、人员是否具有成熟的知道管理体系。2、岗位培训是否充足且适用。3、团队能力的互备性。4、人员绩效考核指标设定是否符合SMART原则。5、人员绩效考核结果应用是否真正落地有效。6、进行人员服务意识、沟通能力培训。7、建立良好的沟通协作机制。8、设计有效的人员储备管理措施等。为此,我针对性的加强了人员培训管理和能力管理,采取了内部资深员工培训和外聘厂家进行培训相结合的方式,提升人员的服务能力,并建立成熟的知识管理体系,同时加强了人员储备管理和绩效考核管理,在重要岗位设备AB角等等。
重点关注人员管理的风险有沟通问题、人员连续性问题、负面情绪问题、考核指标不明确的问题。沟通问题通常影响团队的工作,我们建立良好的沟通协作机制,进行服务意识及沟通培训。人员连续性问题会影响服务的连续性,我们实行效的人员连续性管理措施。负面情绪问题,影响团队士气及工作积极性,需要引导积极向上的团队文化,举行团队活动等其他方式进行团队建设。考核指标不明确的问题会造成无法评估和执行考核,要按照SMART原则定义人员绩效指标。
服务台重点做好以下工作:1、及时响应呼叫请求并及时完整记录,如故障报修、参数配置、客户投诉与建议等。2、发布信息:主要是通过内部网站或邮件、电话等方式将消息发布至对应的技术对口人。3、联络供应商:涉及外部联络的统一由服务进行对接,比如联系监控设备供应商、网络设备供应商等。4、基础运营任务:如网点新增监控设备参数配置、工号管理、监控中心服务器定期备份等。5、基础设施监控:利用监控平台对所有接入设备的运行情况、网络连接情况和中心服务器的负载等情况进行监控.
且本着结合实际、合理定位、着眼实战、讲求实效、精心组织、确保安全、统筹规划、厉行节约的的原则开展了应急预案演练:首先演练启动前参演各部门按照方案进入场景,通过简短仪式我宣布演练启动。接着演练执行,按照演练方案开展应急处置,完成各项活动,并全程录像记录。演练结束后,由我宣布演练结束并由相关部门对演练进行评估与总结,填写《演练实施情况评估表》。对演练暴露出来的问题,我们采取有效措施给予改进,并把相关文件归档备案,要求保存期限不少于6年。最后对参演人员进行考核奖惩。
在此过程中,我们遵循PDCA的原则,按“明确问题--掌握现状--分析问题产生的原因--拟订对策并实施--确认效果--防止问题再发生并标准化--总结”的步骤进行质量改进。
知识管理流程的目标是将运维生产过程中产生的各类信息所包含的知识最大限度的提取、保留,通过评审后加以应用,包括:实现知识共享、实现知识转移,避免知识流失,提高运维响应速度和质量,挖掘,分析IT应用信息。知识管理包括系统规划与管理师对知识的获取、共享、保留、评审。
知识共享,对内共享,对外共享。我们非常重视的知识的时效性,现阶段是否有效,知识的完整性,是否汇总完整,能否与其他知识条目合并。知识的正确性,知识的内容是否正确。
知识管理关键成功因素:一是从流程制度考虑,知识的分类是否准确,2是知识管理流程是否制订,是否合理。另一方面从知识的使用衡量指标进行考核:知识积累的数量、知识的利用率、知识的更新率、知识的完整性,各类知识的比重,知识的新增数量与事件、问题发生数量的对比关系。
注意知识管理的风险:知识私有化观念风险,要提高员工的提交知识的积极入,建立良好的团队文化氛围。知识共享的风险,要建立共享安全制度,建立积极沟通。知识管理工具使用的风险,要考虑工具的易用性。知识持续性风险,要定期评审工作,保证知识的可用性和准确性。隐性知识很难转化成显性知识的风险,要让知识管理系统完全整合到员工日常的工作,把知识管理融入项目管理、客户管理、流程管理和人力资源管理中。
由于本运维项目覆盖XX市东片区,区域广、设备多、人员多,不确定性因素较多,因而服务的风险管理尤其重要。在服务过程中,我参照ITSS要求,执照项目风险管理的理论,重点从人员、技术、资源、过程四个方面开展风险识别,并针对识别出来的问题采用相应的措施,以确保项目风险可控。
一、风险管理过程
IT风险管理过程包括制定风险管理计划、风险识别、风险定性分析、风险定量分析、制定风险处置计划,进行风险监控和风险跟踪。
1、制定风险管理计划
风险管理计划是项目运维正式启动之前或启动之初,基于风险
角度对服务的一个纵观全局的考虑、分析和规划。凡事预则立,不预则废,做为系统规划与管理师我更加注重风险计划的制定。在项目启动之初,我召集了需方代表与我方IT服务团队参加风险规划会议,根据服务范围说明书、服务级别、服务预算、组织过程资产等资料,综合考虑了该运维项目对安全性和可用性要求高的特点,组织项目质量人员、工程师等共同编制了项目风险管理计划,在计划中明确了使用SWOT、头脑风暴等方法进行风险识别。进行了风险责任分工:把风险分为人员风险、技术风险、资源风险和过程风险四大类别,确定了基本的风险管理活动,要求每个月进行一次风险评估会议,依据过往的项目经验例出风险管理的时间表和费用表,对风险的概率和影响时行了定义等。并就上述内容与干系人间达成了共识,为后续的风险管理提供了方向指南。
2、风险识别
风险识别是识别并确定IT服务潜在的风险,引起这些风险的主
要因素及风险可能引起的后果及严重程度。在此过程中,我们以风险管理计划为指导,使用SWOT、头脑风暴等方法最终识别出该项目主要存在以下风险:人员方面存在着团队成员离职的风险;技术方面存在着使用全新的监控平台提升自助设备运行效率的机遇;资源方面存在着备品备件无法按时提供的风险;过程方面存在服务不及时、故障处理过程不规范的风险。随后形成了风险记录表,并在项目运维过程中持续更新。
3、风险定性分析
风险定性分析是对风险概率和风险影响进行评估和汇总,进而对
风险进行排序,以便之后进一步分析或行动。在这个阶段,我们识别出老旧设备的备品备件无法按时提供的风险发生的概率最大,发生后导致修复不及时,对可用性影响极大,其优先级作为第一级风险。其次是团队成员离职的风险以及故障处理过程不规范的风险等等。根据分析结果,我们得到了按优先级排序的风险定义以及风险响应列表。
4、风险定量分析
风险定量分析是我们面对很多不确定的因素时提供了各种量化
的方式,以尽可能做出恰当的决策。在这个过程中,我们评估出各类风险的悲观、乐观的最大值,量化、完善、更新了风险记录优先级表格,并根据这个阶段的分析,对备件库进行了特别的维护,加强了各类型号的监控设备的备件的应急管理。
5、制定风险处置计划
经过上述一系列的工作过程后,风险管理便到了制定风险处置计
划的阶段,我主要根据已完善的风险记录表,针对不同的风险采取了不同的应对措施,主要是通过预留资源的方式应对突发事件。比如,对处于第一级风险的老旧设备的备品备件采取提前申请、采购,冗余备货的方式提高问题解决率,对熟悉监控系统项目的关键技术人员实行AB角色管理,以防范关键人员离职的风险。
6、风险监控
风险监控是运维服务全生命周期的一个持续进行的过程,在运维
过程中,我们对已识别出的风险状态进行跟踪,监控风险发生标志,评估风险应对策略的执行情况。在这个过程中,主要采用风险评估、风险审计和风险定期评审、差异和趋势分析和预留管理的方式。每月一次的的风险会议的方式,及时发现服务过程中潜在的风险。
7、风险跟踪
风险跟踪是对已识别的风险和事先未能识别的突发风险进行观
察、记录的过程。在这个项目运维服务过程中,风险管理员采用偏差分析的方法列出了风险清单。我要求风险管理负责人在项目结束前经常维护更新,并给这些风险排列优先级,更新风险解决情况等。由于风险负责人严格执照要求执行,使得项目风险得到了很好的控制。
项目历经三年后,本运维合同到期,通过我们团队有效的全生命周期保障,“平安XX”“智慧安防”系统的前端感知设备及后端应用平台均运行平稳,在安保维稳、打击犯罪、服务群众的工作中均发挥了重要作用。项目的成功无疑与有效的风险控制是分不开的。当然在整个项目运维过程中有存在不足,如项目初期,对部分新进成员技术能力的伻估不足,导致对某品牌安防设备的故障处理时间较长, 后来我通过以老带新的方式进行指导、帮助、培训,有效地提升了团队成员解决此类故障的水平。得到了很好的解决。该项目使我充分认识到了IT服务部署实施对项目运维的重要性。为学患无疑,疑则有进,在系统规划与管理这个浩瀚无边的大海里,时刻保持空杯心态,学而致知,行而致远,知行合一方能获得成功。
IT运维服务质量管理是为保证SLA的完成,提高运维服务水平做的一系列活动,包括质量管理策划、质量管理检查和质量管理改进。
一、运维服务质量管理策划
“俗话说不打无准备之战”。质量策划是质量管理的前提和基础,明确了质量管理所要达到的目标以及实现这些目标的途径。
在此过程中,我们首先根据本项目对系统可用性要求高的特点,与客户充分进行了沟通,综合团队的运维能力水平,拟定了项目设备系统完好率不低于95%,故障响应率为100%等一系列质量目标。确定了用户满意度调查、客户投诉管理、日常检查以及质量文化和质量教育等。同时安排了每月进行一次内审,每季进行一次质量培训等运维服务质量管理活动。确定了运维服务质量管理的相关的职责和权限,如安排经验丰富的张工担任本项目的QA负责质量保证工作,并负责对团队成员进行质量培训。最终形成了本项目质量策划文件,提交双方高层审核后,以邮件正式发放给相关部门干系人。该质量策划文件为后面的质量管理活动提供了方向指南。
二、运维服务质量管理检查
为确保质量管理落实到实处,我们主要的质量实施和检查活动包括进行满意度调查、运维各项目质量保证工作实施、内审、管理评审、日常检查和质量文化培训等。
我们定期通过文档查阅、抽查记录、现场查验等方式对质量体系运行情况进行全面的内审,以发现项目体系中存在的问题和不符合预期项,若有发现不符合项及时制定整改计划。项目运维中积极开展日常检查,如服务台的录单率、派单准确率等,另外尤其重视客户满意度调查,我们根据不岗位不同责任设计了相应的满意度调查表,如服务台的响应率和解决率的调查表,工程师的响应率和解决率调查表等。同进还加强了质量培训工作,事先做好培训计划,确定培训形式,明确培训纪律并对培训结果时行评估,确保质量培训效果。
同时我们还对质量检查活动进行监督,主要包括定期召开质量会议、定期质量报告和不定期的邮件质量问题沟通等,时刻关注质量检查活动的执行状况,确保各项质量工作按照计划执行。
三、 运维服务质量管理改进
质量改进主要是基于检查和评估的结果,对运维服务进行持续改进,提升服务质量和客户满意度。
质量改进过程中,我们按DMAIC模式(定义、测量、分析、改进、控制)的步骤进行质量改进。首先我们把前期收集到的调查问卷数据进行汇总,如针对服务及时性,我们定义了相应的质量目标:普通问题:接报2小时内到达现场,即时提交或到达现场后1小时内提交解决方案,接报12小时内解决故障。严重问题:接报30分钟以内到场,到现场后1小时内提交故障解决方案,接报6小时内解决故障。重特大故障:接报30分钟以内到达现场,到现场后1小时内提交故障解决方案,3小时内解决故障。特殊情况,由甲方电话通知或下发纸质通知单,3小时内就修复。在项目运维中我们发现某品牌监控设备的及时解决率较低,分析问题发现其原因是该品牌设备属于运行时间较长的老设备,很多新进成员没有该品牌设备的维修经验,由此我明确了改进方向,通过以老带新进行指导、帮助和邀请厂方进行详细培训的方式解决了此类问题。随后我们对改进后的效果进行跟踪监控,服务及时性得到了很好的满足。
项目历经三年后,本运维合同到期,通过我们团队有效的全生命周期保障,“平安XX”“智慧安防”系统的前端感知设备及后端应用平台均运行平稳,在安保维稳、打击犯罪、服务群众的工作中均发挥了重要作用。项目的成功无疑与有效的质量管理是分不开的。当然在整个项目运维过程中有存在不足,如项目初期,部分新成员的质量意识不高,不注重文档管理等,为此我邀请公司质量部门对团队进行了质量管理培训,团队成员质量意识逐步提升。该项目使我充分认识到了IT服务质量管理对项目运维的重要性。为学患无疑,疑则有进,在系统规划与管理这个浩瀚无边的大海里,时刻保持空杯心态,学而致知,行而致远,知行合一方能获得成功。
在该运维项目中为了将服务运营纳入标准化与规范化的管理轨道,在服务部署实施中,我从人员、资源、技术和过程四要素方向展开,通过IT服务部署实施计划、IT服务部署实施执行,最终完成IT服务部署实施验收。
一、服务部署实施要素
IT部署实施要素包括人员素、技术要素、资源要素、过程要素。
人员要素主要包括人员的外聘和内部调岗,建立培训教材库和知识转移方法。由于该项目涉及区域大,团队成员数量需求较多,我采用双管齐下的办法组建项目团队,管理人员主要从公司内部调岗、技术人员和操作人员从外部招聘。同时组织培训教材,涵盖管理、技术、工具、过程、交付和应急培训等方面,再通过内部共享、案例分析等方式进行知识转移不断提升团队的服务能力。
资源要素部署实施包括知识库内容初始化,工具部署,备件库的建立和可用性测试以及服务台管理制度的初始化。本项目运维重点要求备件库的管理与规范,如备件的申请、采购、入库、领用、报废等管理流程规划化,要求做好可用性测试,接报第一时间提供备品备件。同时还对知识库通过批量导入问题的功能,下载模板填写后导入,提高初始化效率。通过建立服务台的组织架构,明确服务台岗位与角色职责,确定服务台的主要工作流程,记录事件与服务请求的具体要求,事件与服务请求分派的原则,事件回访的相关规定和要求,服务台的绩效考核指标等对服务台进行管理制度的初始化。同时对服务工具进行了相应的部署实施,安排专人对工具进行日常维护与适时改进。确保资源要素纳入标准化与规范化的管理轨道。
技术要素部署实施包括做好知识转移、制定SOP标准操作规范、发布技术手册、搭建测试环境、制定应急响应预案和演练等。如在本项目实施过程中,考虑到“平安XX”“智慧安防”系统对系统可用性和连续性要求较高,我们针对系统发生各类问题引发的安全突发事件成立了相应指挥小组和制定了相应的应急预案。
同时对突发事件进行了等级划分,包括特别重大突发事件,重大突发事件,较大突发事件和其他造成区域性业务中断的故障。且本着结合实际、合理定位、着眼实战、讲求实效、精心组织、确保安全、统筹规划、厉行节约的的原则开展了应急预案演练:首先演练启动前参演各部门按照方案进入场景,通过简短仪式我宣布演练启动。接着演练执行,按照演练方案开展应急处置,完成各项活动,并全程录像记录。演练结束后,由我宣布演练结束并由相关部门对演练进行评估与总结,填写《演练实施情况评估表》。对演练暴露出来的问题,我们采取有效措施给予改进,并把相关文件归档备案,要求保存期限不少于6年。最后对参演人员进行考核奖惩。(按如下程序进行了预案演练:演练启动、演练执行、演练的结束与终止、成果运用、文件归档与备案、考核与奖惩)。
过程要素部署实施包括过程与制度发布、过程电子化和数据初始化、体系试运行。在规划设计的基础上,我先后完成了过程电子化等,重点对体系试运行进行了管控,在体系试运行期间,通过多种方式进行检查,以确保向服务运营过程的顺利过渡。如在试运行期间发现服务台的事件分派效率不高,我们调整为就近原则分派,最终满足了接报30分钟以内到达现场的协议要求。
二、IT服务部署实施活动
在部署实施过程中,我结合该运维项目把部署实施活动分成三个
阶段进行,包括IT服务部署实施计划、IT服务部署实施执行、IT服务部署验收阶段。
IT服务部署实施计划阶段,俗话说不打无准备的仗。首先,我与客户相关负责人沟通,了解客户期望,然后明确双方责任义务,就部署实施的交付物、验收标准等达成共识,制定了部署实施计划,再通过评估与确认,再次修订等最终完成了部署实施计划。
IT服务部署实施执行阶段在确定了服务部署实施计划后,我召集了相关干系人组织部署实施了启动会。会中我发布了部署实施计划,确定了人员招聘方案,服务台、工程师的培训计划,并对工作报告、服务意识、绩效考核、客户满意度调查等方面进行了布置与确定,以确保服务的标准化和规范化,提升服务质量和客户满意度。
IT服务部署实施验收阶段是对整个部署实施过程的最终检验。在收尾阶段,我参与编写了《XX监控运维项目的部署实施期报告》,并将其作为交付物的一部分提交给相关干系人进行验收,同时协调组织了项目回顾会议,对服务完成情况、资源、交付物等内容进行了回顾。最终通过了文档验收、系统验收、服务验收和任务验收等顺利进入了服务运营期。
项目历经三年后,本运维合同到期,通过我们团队有效的全生命周期保障,“平安XX”“智慧安防”系统的前端感知设备及后端应用平台均运行平稳,在安保维稳、打击犯罪、服务群众的工作中均发挥了重要作用。项目的成功无疑与有效的部署实施是分不开的。当然在整个项目运维过程中有存在不足,如项目初期,部分工具在部署前没有充分测试,导致对某品牌安防设备的故障处理时间较长,后期经过我与团队的修正该问题得到了很好的解决。该项目使我充分认识到了IT服务部署实施对项目运维的重要性。为学患无疑,疑则有进,在系统规划与管理这个浩瀚无边的大海里,时刻保持空杯心态,学而致知,行而致远,知行合一方能获得成功。
IT服务规划设计处于整个IT服务生命周期的前端,可以帮助IT服务供方了解客户需求,并对其进行全面的需求分析,然后通过对服务要素(包括人员、资源、技术、过程)、服务模式和服务方案的具体设计,最终形成服务经别协议(SLA),包括服务内容、连续性、可用性、服务能力和服务费用等。 130
一、IT服务规划设计主要工作内容
规划设计流程中主要活动包括服务需求识别、服务目录设计、服务方案设计(包含服务模式设计、服务级别设计、人员要素设计、资源要素设计、技术要素设计、过程要素设计)、服务成本评估和服务级别协议。
1、IT服务需求识别
客户需求调研期间,我通过对客户领导访谈、座谈会、收集整理
资料信息、信息化建设现状梳理等方式,获得并总结了该项目面临的问题:现场响应不及时且缺乏必要的管理与技能培训,解决问题率不达标;部门对应的组织结构与体系不完整,系统平台及管理工具没有定期更新升级 。我们分析所识别出的问题,得出客户在提高服务的连续性、可用性和服务力方面有较高的需求。
2、IT服务目录设计
服务目录设计是为所有商定的服务提供单一、连贯的信息来源,
并确保所有获得使用相关服务的人员能够知道这些信息。在客户的帮助与指导下,我们确定了小组成员,服务清单,进行了服务分类与编码,详细描述了服务项,评审并发布了服务目录。在与客户多次沟通确认后,我们最终完善了客户的三类服务目录,第一类是例行维护服务,包含日常巡检、实时监测服务项;第二类是系统优化改善服务,主要包含公安机房的系统集成,性能调优等。第三类是应急响应服务,包含故障排查,设备更换和重大事件保障等服务项。同时每一类服务目录都有对应的服务方式、服务时间以及服务响应、到场时间和解决时间做出定义。
3、IT服务方案设计
IT服务方案设计是整个规划设计阶段的核心工作,包含服务模式设计、服务级别设计、服务要素(人员、资源、技术、过程)设计等。
(1) 服务模式设计
通过梳理客户的问题并进行分类,重点设计了集中监控、现场服务(上门服务)、现场服务(驻场服务)等三种模式。集中监控服务模式是针对监控平台、服务器、数据库及网络做全面监控和预警,用于保障各系统的正常运转。现场上门服务主要是提供日常巡检,驻场服务主要提供驻场工程师7*8小时日常维护工作。
(2) 服务级别设定
服务级别是指服务供方与客户就服务质量、性能等方面所达成的双方共同认可的级别要求。我们根据已确定的服务目录所对应在服务清单,确定了服务内容、服务范围、服务级别的目标和关键指标;确定了服务风险及应对方式,双方的责任定义等;确定了客户所认可的问题响应和解决效率指标,例如:普通问题:接报2小时内到达现场,即时提交或到达现场后1小时内提交解决方案,接报12小时内解决故障。严重问题:接报30分钟以内到场,到现场后1小时内提交故障解决方案,接报6小时内解决故障。重特大故障:接报30分钟以内到达现场,到现场后1小时内提交故障解决方案,3小时内解决故障。特殊情况,由甲方电话通知或下发纸质通知单,3小时内就修复。
(3) 人员要素设计
我从三方面进行人员要素设计,一是根据岗位职责划分,明确技术问题的对口人,确保所有问题都有对口的专人处理;二是设计了人员绩效考核方案;三是落实服务人员培训,我通过分析现有技术人员的能力,有针对性地制定了详细的培训方案,提升技术人员解决问题的能力,并鼓励员工参加外部培训和进修课程,提升个人竞争力。
(4) 资源要素设计
结合该项目特点资源要素我重点从服务台、备件库、知识库等方面着手设计,服务台是所有问题的统一服务的窗口,负责将问题转发到不同的技术对口人,避免服务请求的无响应或重复响应;备件做到充分的可用性测试,以便随时供给,知识库是问题解决方案的共享平台,允许用户共享知识和经验,促进知识交流和学习。
(5)技术要素设计
技术要素设计环节主要围绕发现问题和解决问题进行设计,具体措施有搭建内部测试环境,标准化技术活动,编制应急响应预案等。
(6)过程要素设计
针对该项目的特点,我们设计了与之匹配的需求管理、事件管理、问题管理、安全管理、报告管理等管理流程,使当前的服务更加规范化与标准化。
4、服务级别协议
经双方一致友好的协商,在一定的成本控制下,我草拟了一份该项目的服务级别协议,内容包括协定条款,违约处罚、费用和仲裁机构、修改条款、双方义务等,服务时间是7*8*365小时,服务的可用性指标达95%,提供投诉渠道和投诉流程,对于投诉需要在24小时内响应等。
项目历练三年后,本运维合同到期,通过我们团队有效的全生命周的保障,“平安XX”“智慧安防”系统的前端感知设备和后端应用平台等均运行平稳,在安保维稳、打击犯罪、服务群众等工作中均发挥了重要作用。项目的成功无疑与有效的规划设计是分不开的。当然在整个项目运维过程中,有存不足,比如在项目初期,资源要素中的服务工具设计不足,导致某品牌的安防产品的故障处理时间较长,但经过我后期的协调与修订这些问题得到了很好的解决。该项目使我充分认识到了IT服务规划设计对运维项目的重要性。为学患无疑,疑则有进,在系统规划与设计这个浩瀚无边的大海里,时刻保持空杯心态,学而致知、行而致远,知行合一方能获得成功。
在此项目中,我从服务质量、服务风险和信息安全三个方面对项目进行管理。通过制定质量方针、质量目标、质量计划实施质量控制、质量保证、质量改进等手段,确保项目服务满足服务级别协议。通过风险评估分析,制定风险应对措施等,来最大限度地减少IT服务风险的发生。通过对信息安全管理,确保组织资产、信息和数据的保密性、完整性、可用性、真实性、可控性和可靠性。通过本次项目运维,我组织建立了完整的监督管理体系,对服务过程、交付结果实施监督和绩效评价,确保该项目达到了预期的服务质量。
一、IT服务质量管理
IT运维服务质量管理为了保证SLA的完成,提高运维服务水平所做的一系列活动,包括运维服务质量策划、运维服务质量检查、运维服务质量改进等活动,以全面提升服务的安全性、可靠性、响应性、有形性以及友好性。
我结合该项目运维的实际情况,设定了该项目的运维质量目标。为了达到运维服务质量目标,我们采取了相应质量保证活动,比如针对性的加强了人员培训管理和能力管理,采取了内部资深员工培训和外聘设备厂家进行培训相结合的方式,提升人员的服务能力,并建立成熟的知识管理体系,同时加强人员储备管理和绩效考核管理,在重要岗位设备AB角。
另外质量人员根据质量策划文件对运维服务质量进行检查记录。我们还邀请第三方机构进行内部审计,以提升服务质量。我与网点负责人定期关注质量检查活动的执行情况,确保质量工作按计划进行,并结合现状和能力水平,对质量问题确定质量改进方向和改进目标,之后安排质量人员落实和跟踪,以进一步提升我们的服务质量。
二、IT服务风险管理
在运维服务过程中,会遇到各种风险,可能会对服务带来不利影响,服务风险管理就是对这些可能出现的各种风险进行识别、分析、监控、跟踪,并通过合理使用避免、减轻或转移等方法,对服务运维的风险进行有效控制,确保服务目标的实现。在服务启动初期,我基于风险角度对服务进行全局性的考虑,分析与规划SLA、服务范围说明等关键文件,从而制定风险管理计划,之后再通过团队识别出现的风险形成风险清单。
我们主要根据已完善的风险记录表,针对不同的风险采取了威胁和机遇的应对措施,主要是通过预留资源的方式应对突发事件。比如,我们预留了10天时间进行运维服务改进和完善,尽量避免带问题交付;对熟悉项目运维的关键技术人员设置了AB角色管理,以防范关键人中离职风险。项目实施期间,团队不断对风险进行评估、审计和评审,并进行差异趋势分析,保证运维风险清单的持续更新。
三、IT服务信息安全管理
现在网络信息安全越来越重要,针对服务的安全管理我主要从信
息安全的保密性、完整性、可用性、可靠性这几个方面进行监督管理。
在本运维项目中,我们重点监督系统及网络的可靠性,每周统计重大事故发生情况,并对普通事件的发生做趋势分析与调查;对比服务中断时间、服务恢复时间与SLA的相关规定。根据统计结果,优化应急预案。
项目历经三年后,本运维合同到期,通过我们团队有效的全生命周期保障,“平安XX”“智慧安防”系统的前端感知设备及后端应用平台均运行平稳,在安保维稳、打击犯罪、服务群众的工作中均发挥了重要作用。项目的成功无疑与有效的监督管理是分不开的。当然在整个项目运维过程中有存在不足,如项目初期,部分工具在部署前没有充分测试,导致对某品牌安防设备的故障处理时间较长,后期经过我与团队的修正该问题得到了很好的解决。该项目使我充分认识到了IT服务部署实施对项目运维的重要性。为学患无疑,疑则有进,在系统规划与管理这个浩瀚无边的大海里,时刻保持空杯心态,学而致知,行而致远,知行合一方能获得成功。
在“平安XX”“智慧安防”系统运维的项目中,我通过目标管理、激励管理、执行管理和人员发展管理四个方面对IT服务团队进行有效管理。
一、做好目标分解和监控,促进目标达成,开展目标管理工作
目标管理分为目标分解、目标监控和目标完成三个阶段,在对“平安XX”“智慧安防”服务项目中进行目标分解的具体措施如下:1、把团队目标转化为团队成员的日常思想和行动,并与员工的各种绩效挂钩。2、目标分解必须考虑现有资源和人力情况。3、项目分解目标必须服从并支撑于部门或组织的总体目标。4、个人目标必须符合SMART原则,若有偏差及时调整。5、目标分解要短期目标和中长期目标相结合。
对于项目目标的分解,还要注意目标优先级排序的问题。比如在本项目的目标分解中,为了支撑项目协议中签订的设备完好率不得低于95%的目标。我根据项目人力、资源和目标实际进行细分分解,把目标分解至目标关系比较紧密的服务台、日常巡检工程师、故障维修工程师等岗位,具体目标为服务台用户反馈满意度达到98%,日常巡检任务执行率为100%,维修完成率为98%。
为了保障项目的顺利进行,在对目标监控过程中,我重点关注团队成员对目标内容的充分理解。要求服务台、日常巡检、设备维修三个关键小组的组长根据目标分解,制定各自的行动计划表、我和小组长共同对指标的计划完成时间和衡量指标进行定期检查,并重点关注关键指标的执行情况,每周进行目标监控通报。
二、做好团队和个人的激励工作,进一步提升团队整体效能
对于IT服务项目而言,多数IT服务项目都相对比较枯燥,除了
要求团队成员具有良好的责任心和上进心外,系统规划与管理师更要有创新思维为整个团队鼓气,还要对优秀团队和个人给予及时的激励。
通常可用的团队激励措施有高层表扬、团队资金、请高层领导进行经验分享、请与IT服务相关的部门负责人分享专业知识、请业绩优秀员工进行经验分享,不定期开展团队活动等。本项目中我同样采取了如上的激励措施让大家在集体中有参与感、存在感、幸福感。例如,在2022年一季度的业务回顾工作会议上提出表扬日常巡检的第二小组,在巡检中及时发现并排除了重大隐患,具有非常强的隐患排查意识。会中我邀请了巡检二组对这次工作进行了一次经验分享,并于会后邀请二组成员一起聚餐以示激励。
通常可用的个人激励措施有物质和精神方面的激励。个人激励与前述的团队激励相比便偏重个人的感受,在对员工进行个人激励时,我一般情况下先进行非正式的沟通,了解员工的情况和需求,将个人奖励作为对员工的“雪中送炭”,比如在上述的2022年一季度中给予巡检二组组长带薪休假的奖励以示鼓励。
三、有效开展执行管理,提升团队整体执行力
执行管理是指管理者在特定的组织及社会环境中,充分合理运用
组织资源,不断改进组织环境并提高效率,实现组织战略目标的能力。
团队执行力的强弱与否,与企业文化、组织目标、组织结构、绩效考核等因素有关。为了做好本项目的执行管理,我主要从执行文化与提高执行效率两方面进行管理。
通常思想决定行动,首先要认清来自内外部的挑战,建立信念、建立行动准则。作为一个3年期的项目而言,建立执行文化尤为重要,
最好的方法就是从建立行动准则着手。我们团队就建立了“统一思想,统一目标,提升技能,规范作业”的行动准则。
只有执行文化是远远不够的,想要有较强的执行力来提高执行效率,可以通过让团队充分理解目标和流程规范,提出更多更好的建议来提升。对此我制定了各个岗位的作业规范,如对驻场工程师明确了日常维修时间7*8,工作内容(一机一档、平台标注、点位添加、台账管理、安全管理)等。
四、人力资源是第一资源,做好人员发展管理
人员发展管理包括组织发展管理和自我发展管理。组织发展管理
是将个人职业发展需求与企业的人力资源需求相联系,做出有计划的管理过程,目的是实现企业员工的职业生涯目标与企业发展目标相一致。
在这个项目过程中我充分了解员工兴趣、特长和职业目标、结合本公司战略制定符合员工个人发展的职业规划。定期组织内部培训,鼓励员工参加外部培训和进修课程,提升个人竞争力;提供轮岗和晋升机会,拓展员工职业发展空间;设计清晰的职业发展路径。综上所述,我以人力资源是第一资源的理念持续教育培训建立开放的人员晋升机制、营造鼓励创新文化氛围以增加员工的归属感和团队协作能力,来推动团队的整体发展。
项目历经三年后,本运维合同到期,通过我们团队有效的全生命周期的保障“平安XX”“智慧安防“系统的前端感知设备及后端应用平台均运行平稳,在安保维稳、打击犯罪、服务群众等工作中均发挥了重要作用。项目的成功无疑与有效的团队管理分不开。当然在整个项目运维过程中,有存在不足,比如在项目初期部分新成员对某品牌安防产品不熟悉,故障处理时间较长,后来我通过以老带新的方式进行指导、帮助、培训,有效地提升了团队成员解决此类故障的水平。该项目使我充分认识到团队管理在项目运维中的重要性。为学患无疑,疑则有进,在系统规划与管理这浩瀚无边的大海里,时刻保持空杯心态,学而致知,行而致远,知行合一方能成功。
项目运维工作的有序开展,离不开一个优秀的项目团队的支撑和保障,优秀的IT服务团队具有以下5个特征:
(1)团队人员岗位分为管理岗、技术岗和操作岗,且团队成员相对固定。
(2)团队人员需要有较高的服务意识。IT服务类项目面向的是客户、通过IT技术为客户提供增值服务,从而实现自身的价值。
(3)为了提高服务质量,团队人员会使用专用工具,如IT服务管理工具、监控工具等。
(4)团队工作具有周期期和重复性的特征,注重流程化和规范化。
(5)IT服务团队应该注重知识的积累转移,以便主动发现和解决问题。
运维工作中一个优秀团队是工作的灵魂,其质量的好坏直接决定了运维的质量和客户满意度。在项目管理过程中,我从IT服务团队建设周期和团队管理两方面着手,打造优秀服务团队。
一、服务团队建设周期
服务团队建设周期包括组建期、风暴期、规范期、表现期。
组建期的关键步骤包括了解现状、稳定核心成员、确定目标、确立团队价值观,其前后顺序不能改变。在平安XX”、“智慧安防”系统运维的项目中,我们首先了解现状,通过多听、多问、多观察,少说、少猜、少定论,确保对团队的基本情况有全面的认识。接下来识别并稳定那些在团队中起关键作用的人员,特别是那些一起摸爬滚打的资深老员工。确定目标是组建期的关键环节,确保目标符合SMART原则,既要合适又要量力而行,争取言出必果。最后,确立团队价值观,这是团队文化的核心,表述时需要充满激情和感染力,大部分内容应保持不变。这些步骤的顺序和内容对于团队的稳定和发展至关重要。了解现状为后续步骤提供了基础,稳定核心成员确保了团队的稳定性,确定目标为团队指明了方向,而确立团队价值观则增强了团队的凝聚力和归属感。
风暴期的关键步骤包括完成关键指标、人员沟通、建立信任、强化团队价值观。在“平安XX”、“智慧安防”系统运维的项目中,我们通过促进团队成员之间的坦诚沟通,营造宽松的交流氛围,增强了团队内部的凝聚力。通过聚餐、户外活动和团队学习等方式,团队成员之间的情感得到了加深,彼此之间的信任和依赖也得到了提升。其次,我们将团队成员的个人目标与团队目标相结合,实现了目标同向。通过分享愿景,激发了团队成员的认同感和归属感,使得每个人都能感受到自己工作的重要性,从而更加积极地投入到团队工作中。最后,我们建立了公开透明的激励机制,确保利益平衡。通过个人绩效承诺PBC等机制,团队成员的工作积极性和满意度得到了显著提升,进一步增强了团队的整体效能。这些手段不仅帮助团队成功度过了风暴期,还为团队的长期发展奠定了坚实的基础。
规范期的关键步骤包括团队建设、信任与尊重、激励与鼓舞以及共享愿景。在“平安XX”、“智慧安防”系统运维项目的规范期,团队成员经过激荡期的磨合后,开始形成共同的身份识别和团队文化。这一阶段,团队成员对于任务和工作职责有了清晰的理解,能够自觉遵守团队规范和标准操作规范。通过制定和执行这些规范,团队成员能够更好地协作,减少了冲突和误解,提高了工作效率和质量。具体手段包括:制定明确的团队规范:包括行为规范、工作标准、沟通方式等,确保每个成员都清楚自己的职责和权利。培训和教育:通过培训和教育,让团队成员理解规范的重要性,并掌握执行规范的方法。监督和反馈:通过定期的检查和反馈,确保规范得到有效执行,并及时调整和优化规范内容。通过这些手段,团队成员对规范和标准的认同度提高,团队的整体协作效率和执行力也得到了显著提升。
表现期的关键步骤包括自我管理、授权工作、追求卓越和梯队建设。在“平安XX”、“智慧安防”系统运维的项目中,我们通过自我管理,团队成员可以更好地发挥自己的潜力,提高工作效率和质量。在其阶段我将一定的决策权和责任下放给团队成员,让他们在一定的范围内自主决策和行动。这可以增强团队成员的责任感和归属感,促进团队的协作和创新能力,同时团队成员在工作中不断追求更高的标准和更好的结果,追求卓越。我在团队建设管理中也格外重视梯队建设,梯队建设是指建立和完善团队的人才储备和接班人计划。通过梯队建设,团队可以确保在关键岗位上有合适的人选接替,保证团队的稳定和持续发展。
项目的运维工作有序开展,离不开一个完善的服务目录的支撑,因此在规划计划过程中,我们从服务目录设计关键成功因素入手,确定小组成员、列举服务清单、服务分类与编码、服务项详细描述、评审并发布、完善服务目录等几方面对服务目录进行了设计。
一、服务目录设计的关键成功因素
在服务目录设计过程中,我们特别关注目录设计的关键成功因素:确保向需方提供的每个服务都是独立的,而不是某一个大服务的一部分;可以根据客户的需求和内部情况,对服务内容进行控制和衡量;服务成本可以根据客户需求的不同而进行改变;客户容易认可和感受对服务成本有较大的影响的服务。
二、服务目录设计
1、确定小组成员
由于本项目运维区覆盖整个东片区,团队成员数量需求较多,我采用双管齐下的办法组建项目团队,管理人员、技术人员主要从公司内部调岗、操作人员从外部招聘。最终我组建了一支由系统规划与管理师(我本人)、监控系统工程师、网络工程师和甲方代表等人组成的服务目录设计小组。
每位成员都有明确的职责分工,如我作为系统规划与管理师负责项目整体的管理,监控系统工程师负责监控系统的优化排查等,网络工程师负责网络设施的维护和安全管理,而甲方代表负责需求收集汇总等。通过设计小组的磨合配合,确保了服务目录的完善与专业。
2、列举服务清单
在项目初期,我们与客户进行了深入的需求讨论分析,结合“智慧安防”系统的运维特点,列举出了详细的服务清单,包括第一类是例行维护服务,包含日常巡检、实时监测服务项;第二类是系统优化改善服务,主要包含公安机房的系统集成,性能调优等。第三类是应急响应服务,包含故障排查,设备更换和重大事件保障等服务项。
3、服务分类与编码
为了便于管理和客户理解,我们结合列举出来的清单,按服务对象进行了分类并赋予了相应的编码。分为了软件系统、监控硬件和网络三类服务,例如,软件系统被分为“版本升级(S-V-01)””性能优化(S--S-01)”、监控硬件服务分为“设备安装(S-A-01)”、”故障排除(G-P-01)”和“定期维护(W-H-01)”等;网络服务分为“网络设备例行维护(N-M-01)”、“网络安全(N-S-01)”和“应急响应(N-E-01)”等。这样的分类与编码有助于快速识别服务类型,提高服务效率。
4、服务项详细描述
为使客户服务项能有更深入的理解,仅仅只靠服务分类与编码是远远不够的,因此,我们还对每一项服务进行了详细描述,包括服务的内容、价值、目标、服务级别、技术实现方法等,如智慧安防系统版本升级服务内容包括获取最新的软件版本、兼容性测试、备份系统数据、部署新版本、监控运行状态及提供回退措施等,此项服务的价值在于确保安防系统能够利用最新的技术改进安全性能,修复已知漏洞,增强系统稳定性等。其目标是无疑地完成系统升级,最小化对客户日常运营的影响,服务级别指标包括升级成功率、系统恢复时间等,技术实现方法包括采用自动化工具辅助手动操作的方式进行系统升级,并要进行回退测试等。
五、评审并发布服务目录
在完成上述步骤后,我组织了服务目录设计评审会议,邀请了项目团队的关键成员以及公司的高层管理人员参与,目的是从多个角度获取反馈和建议。通过深入的讨论,我们进一步完善设计出了一个全面的服务目录,其内容包括服务名称、服务内容、服务描述、服务方式和服务级别等。该目录部分内容如表所示:
服务名称 |
服务 内容 |
服务描述 |
服务方式 |
服务级别 |
摄像机定期维护 |
日常巡检、 值守服务、清洁服务 |
日常巡检:可提供摄像告警信息及日志查询和诊断、系统配置参数校对、设备运行状态检查、巡检过程中发现有故障,可及时进行备件更换恢复业务 |
现场 +远程 |
响应时间30分钟到达现场;到达现声1小时内提交解决方案;3小时内修复。 |
值守服务:实时监测,可提供摄像机运行状态指标的实时测试服务 |
远程 |
|
||
清洁保养;摄像机的清洁及养护服务 |
现场 |
响应时间30分钟到达现场;到达现声1小时内提交解决方案;3小时内完成清洁。 |
六、完善服务目录
在项目实施过程中,我们持续跟踪服务的执行情况,并根据客户
的反馈和市场的变化对服务目录进行动态调整。例如,我们在项目中期发现原先未考虑到的一些特殊服务需求如 ,及时补充到服务目录中,并通过适当的培训和流程调整来确保这些新增服务的有效提供。这种持续改进的过程保证了我们的服务始终能够满足客户的需求。
项目历经三年后,本运维合同到期,通过我们团队有效的全生命周期保障,“平安XX”“智慧安防”系统的前端感知设备及后端应用平台均运行平稳,在安保维稳、打击犯罪、服务群众的工作中均发挥了重要作用。项目的成功无疑与有效的目录设计是分不开的。当然在整个项目运维过程中有存在不足,如在项目初期,对目录中的一些可能促进变量没有列举详细,后期经过我与团队的补充问题得到了很好的解决。该项目使我充分认识到了IT服务目录设计对项目运维的重要性。为学患无疑,疑则有进,在系统规划与管理这个浩瀚无边的大海里,时刻保持空杯心态,学而致知,行而致远,知行合一方能获得成功。