2012/2/28
目 录
1、 概述… 2
1.1. 改造背景… 2
1.2. 改造需求… 2
2、 改造方案… 3
2.1. 业务系统接入认证… 3
2.1.1. 方案一… 3
2.1.2. 方案二… 3
2.2. 个人用户登录认证… 4
2.2.1. 随机登录密码认证… 4
2.2.2. 优点… 4
2.2.3. 缺点… 5
2.3. 系统架构优化… 5
2.3.1. 改造前系统结构… 5
2.3.2. 改造优化后系统结构… 6
2.3.3. 优化系统引入新功能… 7
2.4. 系统监控管理… 7
2.4.1. 平台内部监控… 7
2.4.2. 短信猫功能与作用… 7
2.4.3. 终端用户收短信规则… 9
2.4.4. 系统对接方式… 11
2.4.5. 系统运营测试… 12
3、 改造周期… 13
1、 概述
1.1. 改造背景
因短信应用高效、便捷、费用低廉等特点,湖南省委办公厅领导也充分认可了短信平台的价值,在此基础上,湖南省委计划于2012年在全省14个地市进行短信平台应用推广,将短信平台真正使用起来,发挥平台的最大作用。
1.2. 改造需求
省委短信平台功能改造主要包括以下几个部分:
1. 业务系统接入认证;
2. 个人用户登录认证;
3. 系统架构优化;
4. 系统监控管理;
2、 改造方案
2.1. 业务系统接入认证
2.1.1.方案一
2.1.1.1.IP地址认证
2.1.1.2.优点
2.1.1.3.缺点
2) 若地市局域网出口经过NAT设备转换,则业务系统的源IP地址会被更改为NAT设备WAN口的IP地址,则IP地址认证失效。
2.1.2.方案二
2.1.2.1.系统标识认证
实现方式:
1) 接口接入的部门,事先需要通过电话或者纸制文件向信息中心申请,并且提供业务系统部署的MAC地址。
2) 业务系统在接口上带上自己部署的机器MAC地址,MAC地址与业务系统帐号绑定,企信通平台在接收到短信之后,对帐号以及MAC地址进行检查。在为业务系统开设短信平台帐号时,必须指定MAC地址,业务系统提交的MAC地址须与该部门的业务系统部署的机器MAC地址一致;
3) 接口中MAC地址字段取值不能为空,否则提交失败;
4) 接口中MAC地址字段取值在短信平台中必须有相同MAC地址,否则返回错误码。
5) 但是平台后台可以设置是否验证MAC地址的选项,要能够有不验证的功能。验证则可以通过接口调用。
2.1.2.2.优点
2.1.2.3.缺点
2.2. 个人用户登录认证
2.2.1.随机登录密码认证
建议采用随机登录短信认证方式对短信平台个人用户进行登录认证。实现方式:
1) 平台管理员为个人用户开设帐号时,必须指定该用户的手机号码,该手机号码即作为用户登录时,随机登录密码的接收号码;
2) 该手机号码用户不能自行更改,变更需由管理员操作;
3) 用户在登录平台时,通过点击“发送随机密码”,短信平台将随机登录密码发送到用户手机,用户凭此密码登录短信平台。
2.2.2.优点
2) 实现简单,该功能已普遍用于移动、联通等网上营业厅登录,可操作性强。
2.2.3.缺点
2.3. 系统架构优化
原有系统不可以达到现在要求,需要在原有基础上做系统优化架构修改。
2.3.1.改造前系统结构
原有系统结构是企业内部架设企信通短信平台,在网闸上开放下行接口通道,通过webservice接口与湖南省委服务器外部企信通网关对接,经过Internet网络传输数据到到大汉三通,三网通运营平台上处理各种短信业务。经过一年的运营,发现有许多不满足现有需求。需要进行系统进一步的二次整合。运营一年来,发现本系统有以下缺点:
1) 系统在一年运营中出现系统短信延迟过高,内部与外部企信通对接增加故障节点,对系统产生传输效率负担;
2) 增加一个节点,在客户端收短信时需要加上节点编号,这无形中增加了客户端接收短信时显示码字长度;
3) 此系统也不满足几年后码字扩展编码规则;
4) 系统终端到三通运营平台,故障安全机制欠缺。没有监控机制,容易产生故障而且不能使管理员第一时间了解到系统性能。
2.3.2.改造优化后系统结构
实施步骤:
1) 在网闸上开放省委短信平台与大汉三通运营平台之间的通道协议下行短信端口,用于短信发送;
2) 在网闸上开放短信状态报告及上行短信监听端口,用于省委短信平台取短信状态报告及相关上行短信;
3) 将接入服务器的通道配置文件复制到内网短信平台服务器;
4) 移除接入服务器;
5) 企业内部企信通经过网闸下行通道,利用webservice协议与短信融合平台对接;
6) 短信融合平台在和大汉三通三网通运营平台进行对接;
7) 三大系统与短信猫利用webservice进行对接。
图(二)
2.3.3.优化系统引入新功能
在三个系统中引入新的功能版块可以有效解决,各系统不安全工作机制。
1) 首先是三通运营平台加入新的功能,可以实时监控网关情况并且可以有义务的形式分享给其它系统平台。三通运营平台要有逻辑判断功能,与系统中间件(融合网关)连接,有时出现异常不可以连接,要有自我恢复功能,尝试多次连接在连接不上时就需要通过短信猫进行短信预警;
2) 企信通、融合网关也需要开发出可以学习到,三通运营平台网关忙闲信息。也需要具有逻辑判断功能,出现故障需要进行系统自我尝试恢复,恢复不了确定是无法运行,及时通过预警短信猫发送短信给系统管理员。
2.4. 系统监控管理
2.4.1.平台内部监控
1) WEB服务进程监控
通过对Tomcat进程进行监控,当Tomcat进程出现异常情况时(如进程卡死、内存溢出等),通过监控客户端及时提醒。
2) 系统线程监控
系统线程监控主要包括短信平台各个线程监控,如下发线程、数据库写入线程等。
3) 通道队列监控
通过对通道队列进行监控,当通道队列达到管理员设置的临界值时,监控软件即产生告警。
4) 操作历史记录
短信平台会对所有操作员做出的每一步操作都做出详细记录,使得所有的操作(包括某些恶意操作)都有据可查。
2.4.2.短信猫功能与作用
大汗三通为了提高短信平台实时监控服务是不是有无延迟情况下,引入新思想在整个短信系统中部署监控预警短信猫,下面就对监控预警短信猫在短信系统中功能和作用分别描述。
2.4.2.1. 功能
1) 研发中要求,企信通要有专门承载发送给预警短信猫的进程通道,而且还需要把测试短信与客户短信数据库存储信息分开存放;
2) 系统中嵌入测试进程发送每日的独立测试日志文件,此功能有利于管理员每日分析网关延迟记录;
3) 测试预警模块还需具备上行接收功能,预警短信猫发送测试短信给平台管理员时需要抄送给平台网关,网关可以判断预警短信猫有没有当机,这样可以保证系统本身自己发起自我测试。要是预警模块没有收到抄送短信时,启用另一个备用预警进程,通知平台管理员预警短信猫出现异常,需要及时处理恢复故障;
4) 测试预警模块还需要具备逻辑判断功能,首先是判断服务器网关忙还是平台运行忙,判断出故障后及时以优先级代码形式表示到短信中(1.表示网关忙。0.有线程关闭。2.内存溢出。3.任务停止。)有标示的代码有利于管理员即时缩小故障范围,在第一时间中找到问题所在并且解决问题,恢复短信平台正常运营;
5) 企信通专门开发出一个告警版块,这个版块主要是分析告警信息,但是考虑安全要求版块只有admin权限可以查看(相当于飞机中的黑匣子),这个功能加入不仅是对平台故障判断,还可以加入统计学功能,统计本地市那个时间段网关忙闲率,有利于这个地方后续发送短信,可以选一个网关闲时,这样好处可以保证短信到达率。
2.4.2.2. 作用
1) 告警方式,通过预警短信猫下发短信,预警短信猫网关也可以通过ctc-server对接。
2) 监控平台的异常,对于可恢复的异常,自动恢复;如果不可恢复的异常,要进行告警。
3) 告警触发条件:a如果通道连接多次连接不上,这个ctc-slidewindow已经有告警接口了。b.有线程关闭。c.内存溢出。d.任务停止。短信平台出现此类告警,要及时把信息反馈给预警短信猫网关,以短信形式发送到管理员手中,并且收录故障信息存入预警模块中。
4) 设置每天相隔10分钟,三网通自动给预警短信猫发送测试短信,预警短信猫收到测试短信,及时发送给短信平台维护员,通过每日短信相隔时间差也可以判断出短信网关准确率。如果时间延迟若干时间的,或者短信收不到,预警短信猫可以触发告警短信,及时把短信发送给短信平台管理员,管理员收到短信后及时登录短信平台后台查看平台日志、tomcat日志、预警短信猫守护进程日志,分析发生异常的原因并且及时解决故障。
5) 此功能的加入不仅是对平台的监控有了保证,而且对后续升级平台提供一个bug库,有利于程序员吸取前期此系统开发不完善之处。可以把上述系统监控日志也抄送到此模块,假如有人恶意操作,并且删除操作日志对后续追究法律责任没有凭证,可是要是抄送到预警模块中,这个模块是隐藏的还可以调用出证据日志,为后续维权提供依据。
2.4.3.终端用户收短信规则
短信系统没有加入融合网关前与短信系统改造后加入融合短信网关,收短信码字长度对比,得出优化后系统码字符合用户提出的改造要求。
2.4.3.1. 方案一
图(一)融合短信平台服务器网关前,系统收短信号码段规则。
短息系统改造前码字计算公式:
10690300+AA+QQQ+SS=10690300AAQQQSSYYNN
AA企信通标识号:范围:0-XX。
QQQ为地区代码:即为730~739和743~746。
SS为市县编号:从00-49为内网应用•50-99暂不使用。
DDD为单位编号:000-999,000-499为党委各单位,500-999为政府各单位。
YY为应用编号、NN应用系统内部的循环序号他们有两种编号方法:
1)单位内部子应用少于10个时采用,YY范围:0-9,NN范围在000-999,NN可有可无;
2)单位内部子应用多于10个时采用,YY范围:00-99,NN应用系统内部的循环序号:00-99. NN可有可无:结算只分到单位编号,即10690300XX746SSDDD,YYMM只便于内部子应用发送和回复信息的区分。
地市
省直/区县
机构
通道总号
通道号码范围
长沙
省 直
党委
#xx73100
#xx73100000~#xx73100499
政府
#xx73100500~#xx73100999
长沙市
党委
#xx73101
#xx73101000~#xx73101499
政府
#xx73101500~#xx73101999
长沙县
党委
#xx73102
#xx73102000~#xx73102499
政府
#xx73102500~#xx73102999
望 城
党委
#xx73103
#xx73103000~#xx73103499
政府
#xx73103500~#xx73103999
浏 阳
党委
#xx73104
#xx73104000~#xx73104499
政府
#xx73104500~#xx73104999
宁 乡
党委
#xx73105
#xx73105000~#xx73105499
政府
#xx73105500~#xx73105999
这个编码规则是参考图(一)原有的系统发送短信规则,用户对此不满意。
*接口号:湖南省委外部网关企信通标识号。
*以下 # 号代表10690300。
*以上内容参考项目通道编码规则文档。
2.4.3.2. 方案二
经过公司研发团队方案优化后,提出新的应对湖南省委短信改造方案如图(二)设计接入拓扑图。
短息系统改造前码字计算公式:10690300+AA+QQQ+SS=10690300QQQSSYYNN
QQQ为地区代码:即为730~739和743~746。
SS为市县编号:从00-49为内网应用•50-99暂不使用
DDD为单位编号:000-999,000-499为党委各单位,500-999为政府各单位
YY为应用编号、NN应用系统内部的循环序号他们有两种编号方法:
1、单位内部子应用少于10个时采用,YY范围:0-9,NN范围在000-999,NN可有可无;
2、单位内部子应用多于10个时采用,YY范围:00-99,NN应用系统内部的循环序号:00-99. NN可有可无:结算只分到单位编号,即10690300AA746SSDDD,YYMM只便于内部子应用发送和回复信息的区分.
地市
省直/区县
机构
通道总号
通道号码范围
长沙
省 直
党委
#73100
#73100000~#73100499
政府
#73100500~#73100999
长沙市
党委
#73101
#73101000~#73101499
政府
#73101500~#73101999
长沙县
党委
#73102
#73102000~#73102499
政府
#73102500~#73102999
望 城
党委
#73103
#73103000~#73103499
政府
#73103500~#73103999
浏 阳
党委
#73104
#73104000~#73104499
政府
#73104500~#73104999
宁 乡
党委
#73105
#73105000~#73105499
政府
#73105500~#73105999
这个编码规则是又换后加入上图(二)融合短信网关之后的编码规则,用户对此满意。
*以下 # 号代表10690300。
*以上内容参考项目通道编码规则文档。
2.4.4.系统对接方式
整个系统方案经过严格审核符合湖南省委短信码子接收情况,参照图(二)表述对接方式。
1)企信通数据流穿过防火墙利用webservice与网关融合系统进行对接,可以提高传输速率。
2)融合系统利用webservice借口通道与三网通系统进行对接。
3)三网通与湖南电信、联通、移动利用webservice借口进行对接,对接后三网通就可以传输短信。
4)短信猫与企信通、融合系统、三网通进行对接实时监控三合系统运行情况,可以有效的把系统信息传输给系统管理员。
2.4.4.1. 系统设计优点
1)有效的提高短信到达率,系统中启用安全机制有利于实时监视系统的运营情况;
2)启用预警短信猫,相当于第三方执法者,每一个环节出现故障短信猫都会以短信形式及时传输给系统管理员,可以使管理员在第一时间了解系统的运营情况。出现意外事件,可以第一时间相应,并且及时处理故障;
3)预警短信猫监视系统时,系统同时也在监视着短信猫。这样可以起到互相监督的作用,更可以提高系统的安全性;
4)系统中嵌入自我恢复机制,出现故障可以尝试多次从新连接。
5)系统内部采用自我恢复机制,再加上引入第三方监控者可以有效提高系统运营安全率。
6)此系统的设计实现人性化介入,可以达到人机完美结合。
2.4.4.2. 系统设计缺点
1)融合网关的引出提高了系统造价。
2)增加节点对维护费用开销增加,也会增加系统管理员的工作。
2.4.5.系统运营测试
系统运营前必须经过各个环节严格测试,保证没有问题可以达到方案中的要求才可以进行正式运营。这就要求实施人员,与开发人员进行有效地合作完成最后环节。具体包括以下环节测试:
1)系统架构优化测试,保证系统正常运营各种参数规格内;
2)系统监控方案是不是达到用户需求,报告tomcat负载是不是可控制范围内等等;
3)三个系统对接是不是运营正常,各种角色是不是承担各自的责任需要经过严格审核。提交给第三方测试文档,以备后期验收工程作为有效的依据;
4)预警短信猫在对系统监视的同时,是不是系统也对预警短信猫实时监视;
5)接收终端是不是符合用户编码手册中的要中;
6)把平台中日志文件清理后,是不是可以在预警模块中找到备份日志;
7)三通运营平台收集到网管信息,融合网关、企信通短信平台有没有分享到网关工作信息;
8)出现故障时,三通运营平台、融合网关、企信通平台有没有自我判断恢复重连功能,并且在尝试多次恢复没有成功后,有没有及时发送短信到预警短信猫中,短信猫有没有及时把系统故障在第一时间传送给系统管理员。
9)系统中嵌入安全模块是不是可以及时收集系统,有没有达到以上各个环节设计要求。
10)测试完成每个环节,并且提交测试数据文档整理归档。
3、 改造周期
功能项
开发工作量(人/天)
1
系统标识认证(接口修改)
2
2
随机登录密码认证功能
5
3
平台预警短信猫模块开发
10
4
系统监控管理
5
5
系统整体测试
5
6
系统稳定维护期
10
省委领导定下的具体时间:
20号需要出来一个可演示的版本,26号全部完成。这个请出一个计划表,还要确定优先级别。
北京玉笛信息技术有限责任公司
地址:北京海淀区知春路23号量子银座903(863软件园)
淘网址:http://shop35321900.taobao.com