某石油配套设计单位综合运维
用户特性及需求:
用户规模不大,核心设计相关专业人员约60人,设计工作站对硬件要求较高,厂商提供的设备动辄万元起步,有的甚至10w余元,2、3年后就因为软件的升级,硬件需要更换,投入成本较大,折旧金额高是目前的核心问题;
另外就是软件的安装部署专业要求高,偏门软件只能求助安装,每次费用不菲,如果需要厂商现场支持,按美金计价的相关技术服务及差旅费用更是难以承担;
设计出来的图纸的版本控制,图纸中几百兆上G的单个文件是正常现象,另外图纸中所需的各种零件模块版本控制不如意,出现各种莫名bug,继续建造自己的零件库;
用户对数据存储及安全性的要求较高,磁盘空间占用较大,一个项目通过不同岗位的设计师,从开始立项到成品,期间产生的各种文档都是按tb来计算;磁盘容量要求高,单机磁盘经常爆满,存储上磁盘也一直飘红,用户访问存储速度又明显感觉较慢,对存储文件的优化及存储的扩容一直是内部会议的内容之一,由于成本预算的问题,一直没有好的解决办法;
另外就是对数据的丢失问题处理,很多次个人PC磁盘或者移动硬盘,因为爆满再去操作,摔伤等不确定因素,卡死后磁盘出现逻辑错误、或者盘片受损、磁头损坏等情况整盘文件无法读取,数据恢复一次费用不低,服务器上带Raid的sas磁盘阵列出现问题的话,数据恢复的费用足够再新购一套存储,而且不保证数据的完整性和原来的目录结构;
专业性的工作成果,对外人一文不值,对业内人士可能有较高的价值,作为IT运维服务商,总与用户强调,我们可以获取别人的操作记录,但不会主动去记录,用户端有需求我们会满足;唯独不能左右别人的思想,他们主动拷贝泄露数据,我们只能做记录,无法提供相关预警支持服务,除非定义了某些能明确的规则;
1) 整体规划
IT管理架构:
新建一个核心40G的FC光纤网络作为存储集群的内部网络,配置高达4tb的高速缓存,通过vmware虚拟化部署实现内部网络存储,确保终端到存储的链路连接都能走满网卡的极限速率;对数据冗余的同时也可随意扩展磁盘,低于8TB的存储磁盘全都替换成大容量的;
并在机房部署多台分属各部门或者各人的操作跳板主机,在经过多重认证,确保安全的情况下,远程人员可通过外网直接访问自己的主机,并流畅操作;
网络架构:
在原有办公网络基础上升级成核心万兆,终端接入千兆;
开放制定端口供远程vpn接入用户提供远程桌面服务;
数据安全与存储
存储内容根据项目、人员、存储对象重新根据实际情况定义存储的目录及相应权限分配规则,并实现自动日志、图纸版本控制等;
对于远端vpn用户,首先需要知道IP,然后需要获得对于端口号,并需要与端口号相互绑定的用户名及密码,才能访问操作主机,操作主机无法访问存储,只能访问特定的终端PC或者工作站,这里又有一套用户名及密码,才能获取到这个最后登录的终端用户在内网的相应访问权限;
打印、电脑等终端设备
终端电脑及各种工作站都以租赁模式运维,由ITACME去收集各个终端的需求,设计岗位终端PC最少配置raid1的磁盘,并且完成终端软件的安装及数据备份方式方法等规则;
2) 服务承诺
责任与担当,我们以安全第一,提升效率与降低成本,就是我们的使命;;
明码标价:
对于设备及子系统的租赁费用,分门别类,标注固定单价;
对于耗材及易耗品,均以合同日某平台价格为准;
对于运维的费用,按品类分别定价;
合同周期内,原则上合同内定价不做调整,如有特殊情况,需要降价或者涨价,需要双方沟通确认后下个月再生效;
运维流程中,合同内及新增需求,产生的各种交通运输,差旅住宿费用均由我方承担;(因甲方临时需求产生的设备运输费用由甲方承担)
响应时间:
接到用户报修或者新需求的诉求信息后,我们是即时响应;
沟通了解后半小时内给用户端作出明确的答复;(包括但不限于解决的时间,方式方法,解决方案的完成时间)
新需求的完成周期:
针对新需求的内容,如是合同内原有内容,根据实际需求在1-7天内完成;
对于工程建设类的需求,直接安装用户提供的进度表完成;
对于软件开发类及其他无法明确的需求,根据项目不同,了解具体后另行商议;
故障修复的周期:
设备类故障(含云端),不管重要程度,任何原因,不超过3天完成;
对于网络故障,接到报修,次日上班前处理完成;
设备故障,评估后认为48小时内无法修复(某些硬件保修周期长),直接提供备机使用;
故障带来的损失判定规则:
在约定周期内无法完成服务承诺,可能给用户端带来损失,
故障期内,不收取任何费用;
故障期内,不可抗力(比如运营商问题导致宽带中断)因素导致的损失双方各自承担一半;
故障期内,因各人造成的,由各人承担,客户方员工造成由客户承担,我方员工造成由我方承担;
对于数据意外丢失,存储端由我方全额承担,终端电脑由个人承担;
数据泄密判定规则:
我们能做到的,只能是对设备、文件的权限规则定制,具体是否泄密无法控制,但是对文件的操作记录我们能逐一记录;
我们只负责在既定的规则下,创建用户登录、访问、目录、文件的读写权限,并在创建之初提供专业性建议及意见;
我方操作人员,都不具备存储中用户数据的读取权限;
3) 人员保障
客户经理安排一切运维事宜,定制运维、备份等相关计划;
远端提供各细分专业的技术支持,给当地技术人员无法处理的问题提供帮助;
人员配置:
指派一名客户经理负责该客户所有事宜统筹及与客户直接汇报工作;
由客户经理在每地指派两位业务负责人(一主一备),负责日常巡检及日常事务;
存储等相关技术支持由远端技术人员负责;
如遇现场无法处理的状况,联系客户经理,或者后台技术支持人员;
人员的备份:
客户经理不直接参与日常事务,与其他客户经理的区别就是服务的对象不一,手头掌握各种登录地址,账户密码信息,后台负责定期/不定期更换,确保相关信息安全,相关变更记录是有后台系统实时随机生成,根据用户安全级别的要求,新密码随时可能自动生成,并且变更后,均有记录,客户经理完全可以随时更换;
业务负责人,直接负责日常事务,与岗位随时可能调动,但是工作内容、流程都是一致,后台的图纸等相关公开数据,只要开通某客户的权限,随时可以查看配置信息及往记录,也是完全可以替代的。
后端技术支持,我们拥有庞大的技术团队以及过往记录自动生成知识库,业务负责人,可以根据自己经验和技术积累,也可以在知识库查找,还可以与后台技术支持联系,最后还可以上网0查资料,还可以咨询厂商,后端技术支持的方式,只是提升用户端故障恢复效率的手段之一。
施工现场负责人的备份,长期都有各种项目在施工中,只有人员走不开的困扰,但并无可能造成施工进度或者施工工艺、品质上的错误发生,因为我们自己的施工流程中,每道工序都需要验收,并有详细的表格、图文、视频存档;
4) 租赁实施
网络设备
升级改造均由我方提供设备及完成施工相关工作;
办公网络万兆核心改造;
40G光存储网络;
服务器存储设备
扩展前的存储我方折价回收,新增存储及磁盘以及未来磁盘的扩容均由我方提供,以租赁模式计费,目前配置,在2套存储非同期出现故障的情况下,用户端都可无感使用;故障后我方会收到推送信息;
机房其他配套设备
机房主要是增加一套UPS系统及重新安装接地系统;
对于老的机房,我方现场评估后,提交整改计划,与用户商讨后在不影响正常办公情况下完成整改,对于利旧设备,我方回收,抵扣费用;
对于新办公室的机房及网络建设,用户只需要提供需求信息及点位布局图,剩余设计、施工均由我方完成,连验收步骤都直接跳过,用户只需按点位单价*数量如期支付租赁费,一切安全隐患带来的故障后果、损失均由我方承担,后续如有任何故障报修,未在约定时间周期内完成修复,都是直接扣费的;
终端电脑及工作站
约定3年周期更换一次设计岗位电脑,确保公司设计岗位的设备保持在行业领先并且稳定流畅运行状态;其他岗位按需配置必须满足流畅且无故障运行;
5) 结果现状:
终端状态的对比
各终端流畅稳定运行,访问存储和访问本地磁盘无区别;
存储稳定运行从未出现磁盘容量告警情况;
办公室多次搬迁,内部网络配置也从未改变过;
6) 效率对比
与之前的对比,终端操作体验完美,朋友圈经常看见终端用户晒主机的性能;
7) 成本对比
成本与之前相比,降低幅度不大,只有20%,只是因为原来没有专业的IT团队服务,费用都是买设备,现在有ITACME相助,购置成本降低了无穷大,设备本身故障带来的各种开支也未列入对比,终端用户有了满意的体验,这是真正把钢用在刀刃上;
8) 点评总结
我们非常喜欢这样的用户,追求的好,也讲究服务品质,愿意掏钱,只希望有个该有的结果;
最大化利用IT资源是运维岗位应该做的事情,给用户提供更好的解决方案并实施落地是会碰到各种问题,他们替换一次机器,需要对软件的重新部署,他们提要求我们当天处理完,前期我们也千辛万苦到处找资料,后来完善后,有了工作手册,再次部署效率就高了很多。