一、前言
运维,一般指的是互联网运维,也叫做IT运维,是对网络、服务器的运营与维护。运维工作贯穿了整个产品或服务的生命周期,一般由专门的运维工程师承担。
1.1 物联网项目运维
BN区社区安防智能门禁建设项目(一下简称智能门禁项目)的物联网终端包括数量众多的智能门禁和摄像头。还有大量居民用户在使用这些物联网终端,是一个典型的应用了物联网技术的互联网项目。
BN区社区安防智能门禁建设项目(一下简称智能门禁项目)建设内容包括数量众多的终端设备,并且包含有数量众多居民用户。因此,智能门禁项目运维更加偏重于设备和基础设施的维护。智能门禁的运维目标就是确保门禁系统正常,故障问题可以及时得到解决。
1.2 写作动机
我们的智能门禁产品质量过硬,设备的故障率很低,同时我们建立的项目运维体系将产品的优势进一步放大,我们在项目运维上的投入的人力成本相对于当地其他厂商要小的多大,但是取得了很好的效果和口碑。
由于智能门禁项目使用到物联网、互联网、大数据等最新技术。同时又是披着互联网外衣的系统集成项目,有接近30万的居民用户、1700台智能门禁、5万APP用户……。因此,智能门禁项目的运维经验很具有参考价值的。
二、智能门禁项目运维服务体系
2.1 运维体系建立背景
智能门禁项目运维服务体系并不是一开始就有的。智能门禁完成安装和地推之后,居民可以使用门禁卡或者APP进入小区和单元门。在门禁机使用的过程中,会有很多居民的咨询和投诉,包括客户方反馈系统问题。虽然公司有完善的运维团队和客服中心,但是未建立完善的“反馈—处理—跟踪”机制,导致问题没有得到及时有效的解决,严重了影响了项目的口碑和实施进度。
2.2 风险识别
在建立运维服务体系之前,我们先要确认当前存在的问题以及可能导致的后果,也就是对运维工作进行风险识别。具体情况如下:
流程 |
存在的问题 |
导致的后果 |
接收问题 |
目前有居民拨打400电话、客户主动联系公司人员、内部人员发现上报等几种问题反馈的渠道,没有统一接受问题的机制。 |
|
分析问题 |
对问题的轻重缓急没有定义。 暴露的问题是单体样本还是群体样本? 会造成多大破坏性未知? |
|
反馈问题 |
不同类型的问题没有明确唯一责任人,不知道该找谁,找到了也不知道是否找对了人。经常出现找到人之后给了另外的同事联系方式,让反馈人员自行联系。 |
|
处理问题 |
找到了对应的人,但问题没有得到及时的处理,大家都很忙。 |
|
处理结果 |
处理的结果是否符合预期? 处理之后是否问题得到根本的解决? |
|
2.3 岗位职责
运维虽然主要是运维部门的工作职责,但在故障的处理过程中,还是需要很多部门的共同协作。
岗位 |
负责人 |
职责 |
客服负责人 |
*** |
处理400电话反馈问题的工单新建 负责居民反馈问题处理后的电话回访 |
项目相关人员 |
*** |
接受业主和居民反馈的问题,并且通过钉钉、微信或邮件等文字性的方式反馈给项目助理。 |
运维负责人 |
*** |
对门禁机使用故障进行判断处理; |
运营负责人 |
*** |
负责门禁卡办理过程中遇到的问题反馈 |
项目助理 |
*** |
接收客户和内部反馈的问题记录、判断和分发; |
维修单位 |
*** |
外包商,负责单元门、门禁机设备故障维修 |
产品经理 |
*** |
门禁机硬件、APP、后台等软硬件故障问题接收及跟踪处理。 |
2.4 运维服务流程
为了让运维相关人员更加的直观了解到整个运维服务流程,我们使用流程图对运维服务流程进行了设计和说明。
2.4.1 运维服务流程图
2.4.2 运维服务流程说明
序号 |
流程名称 |
步骤说明 |
操作岗位 |
输入资料 |
输出资料 |
1 |
400电话反馈问题 |
居民通过拨打400电话反馈门禁机使用问题,由成都客服中心接听电话并在客服系统中记录问题情况 |
客服话务员 |
客户电话 |
系统工单记录 |
2 |
客户直接反馈项目成员 |
业主方、现场居民直接联系公司人员反馈问题;接收人员将问题以钉钉、微信或邮件的形式反馈给项目助理 |
项目相关人员 |
|
问题情况文字反馈 |
3 |
公司内部反馈 |
公司内部人员遇到门禁项目出现的问题通过钉钉、微信或邮件的形式反馈给项目助理 |
公司内部人员 |
|
问题情况文字反馈 |
4 |
反馈问题登记 |
将反馈的问题登记到《项目问题反馈跟踪流程记录表》 |
项目助理 |
问题情况文字反馈 |
《项目问题反馈跟踪流程记录表》 |
5 |
反馈问题分发 |
判断问题属于运维故障还是软硬件故障。 |
项目助理 |
《项目问题反馈跟踪流程记录表》 |
记录问题处理人员及方式 |
6 |
录入在线客服系统 |
在工单系统填写接收到的反馈问题 |
客服负责人 |
|
系统工单记录 |
7 |
派发工单 |
判断工单类型是设备维修工单还是门禁机使用故障; |
客服负责人 |
|
更改工单状态,制定负责人 |
8 |
产品经理接受反馈问题 |
产品经理接受反馈的问题并将问题分析分派给对应的问题责任人 |
产品经理 |
问题情况文字反馈 |
问题负责人、解决时间 |
9 |
单元门门禁机故障现场维修 |
外包团队现场对故障进行维修; |
维修单位 |
报修工单 |
维修记录,上传维修前后照片 |
10 |
运维部接单处理 |
运维部接单之后将可处理的问题进行处理,不可处理的问题体提交给产品对接负责人。 |
运维部 |
|
|
11 |
问题处理更新工单状态 |
处理问题后将维修结果反馈在工单系统; |
维修单位 运维部 |
|
|
12 |
反馈问题回访 |
问题解决之后对反馈问题进行回访,居民反馈问题客服电话联系,客户和内部直接反馈的由被反馈者回复处理结果。 |
客服 问题接收者 |
|
|
2.5 重点故障责任人
为了避免有些故障处理的责任不明确,我们对故障责任岗位做了进一步说明。
故障类型 |
责任岗位 |
项目 |
备注 |
设备安装 |
维修单位 |
|
|
设备调试 |
工程团队 |
|
设备故障问题交由产品经理处理 |
门禁卡使用 |
运营团队 |
|
|
门禁机使用 |
运维团队 |
|
|
软硬件BUG |
产品经理 |
|
|
2.6 关键控制点
关键控制点是用来对流程中关键节点的处理要求进行说明,具体如下:
- 所有反馈的问题都必须要有完整记录发起、处理、跟踪、反馈四个流程;
- 居民反馈单元门故障需要在24小时内解决并进行回复;
- 门禁机故障导致无法刷卡和APP开门的问题优先解决,4个小时内无法解决的先采用断电敞开方式解决;
- 软硬件问题暂时无法解决的,优先确保门禁卡刷卡可用。
2.7 服务质量KPI指标
由于有整个服务体系中,有外包商参与。为了确保外包商服务质量,特制定服务质量KIP考核指标。
指标名称 |
指标定义 |
计算方法 |
指标值 |
问题反馈及时性 |
各种渠道反馈的问题可以第一时间进入处理流程 |
未及时反馈问题进行记录 |
友情提醒 |
问题反馈有效性 |
各种渠道反馈的问题需要全面的反馈问题各种细节; |
反馈问题不完整导致沟通成本提高的进行记录 |
友情提醒 |
单元门处理及时性 |
单元门故障现场维修及时性 |
未按照要求及时进行维修的进行记录 |
参考外包合同 |
门禁机故障处理及时性 |
门禁机故障现场维修及时性 |
未按照要求及时进行维修的进行记录 |
友情提醒 |
处理结果满足要求 |
门禁机和单元门问题需要根据要求进行解决,符合使用条件:门禁卡可用、APP可用、单元门正常闭合。 |
现场解决问题引起其他的问题未解决的进行记录 |
友情提醒 |
门禁卡办理错误 |
门禁卡办理的时候选择了错误的楼栋 |
记录办理人员及错误信息反馈给运营部 |
友情提醒 |
三、体系运行效果及分析
智能门禁项目运维服务到底做得好不好,很难有一个标准来判断,还好我后来到了TSL公司,也负责过区县级别的智能门禁项目建设。通过两家公司的门禁运维服务数据,可以侧面分析出智能门禁项目运维服务体系的效果。
3.1 两家门禁公司运维数据对比
以下是CY和TSL两家公司智能门禁项目运维数据统计表。
对比项 |
TSL公司 |
CY公司 |
工单管理 |
udesk客服工单系统 |
EXCEL表格 |
客服成员 |
3名专职白天值班 外包团队夜间值班 |
4人24小时轮班 |
运维区域 |
渝–YZ区 |
渝–BN区 |
智能化设备 |
智能门禁机 |
智能门禁机 |
维护设备数量 |
500 |
1700 |
用户数 |
3万 |
30万 |
运维人员 |
4名专职 3万/月聘请外包运维团队 |
1名兼职 一家外包商维修铁门 |
通过数据对比可以得知,CY公司的维护设备量是TSL公司的三倍,并且在客服和外包商资源投入较少的情况下,使用Excel表格就完成了客服中心的良性运转。
同时在数据对比表中没有体现的情况是,CY公司做的BN区的项目获得了更好的口碑,居民拨打的投诉电话,很多是反馈为什么他们的楼栋还没有安装门禁机。而在TSL公司的项目,却因为门禁机故障被居民反复投诉,最终被政府中断了3个月的工程实施。
3.2 运维效果分析
TSL公司的门禁项目拥有完善的运维团队和资金支持,但是公司没有制定有效的制度和规范来确保项目运维工作有序的进行。因为居民反馈的问题没有得到及时的解决,导致大量居民投诉,导致项目实施终止。
在CY公司的智能门禁运维服务体系下,居民反馈的问题会在短时间内明确责任方,并且有很流程化的事情处理和跟踪机制。这确保了居民反馈的问题很快得到解决,因而没有出现大量居民投诉的情况。
四、经验和不足
4.1 运维经验总结
总结CY公司智能门禁项目运维成功的经验,我觉得制定项目运维体系只是起到了辅助作用。项目运维工作在低投入的情况下取得很好的效果,其真正的原因是产品质量过硬。其实特斯联的运维体系虽然不够完善,但是导致运维效率低效的最重要其实是产品故障太多。因此,要做好项目的运维工作,首先需要有质量过硬的产品和服务,然后再加上科学合理的流程和制度,就可以很好的完成项目运维目标。
4.2 存在的问题
虽然在智能门禁项目中,智能运维服务体系运作非常成功,但依然有很多值得改进的地方。特别是没有一套信息化系统来对整个运维进行管理。在CY公司采用Excel表格和纸质工单很好的完成了任务,在TSL公司有udesk客服工单系统,但是都没有对设备状态的控制和时时运维数据统计分析。
参考书籍
《态度:四十封启明家书》:专业素养意味着遵守流程和行为规范。
《给经理人的第一课》:建立严格的流程来防范潜在的办公室政治,并认真执行。
《硅谷之谜》:怎样才能提高生产效率呢?泰勒最看重的是优化流程和标准化管理。
《结网@改变世界的互联网产品经理》:选用轻量级的、对团队现有工作习惯入侵小的工具,可以事半功倍。