更新时间:2022-12-12
本指南的目标
- 提供中国移动物联网卡遇到无法使用时基于OneLink平台的排查思路和解决方案
目录
- OneLink平台官方资料
- 可能出现的故障原因
- 定位故障点
- 打开智能诊断菜单
- 界面说明
- SIM交换信息的详细说明
- 设备APN配置的问题
- 一般故障的排查思路
- 看门狗和通信模组的相关问题
- 转交客户经理排查
- 案例介绍
一、OneLink平台官方资料
OneLink平台:中国移动的物联网卡管理平台,网址:https://ec.iot.10086.cn/ ,在以公司名义首次办理时,平台账号密码发到填写的管理员手机号码上OneLink连接管理平台操作指南:登录onelink连接管理平台后右上角帮助下载OneLink 平台智能诊断功能使用帮助:登录onelink连接管理平台后智能诊断菜单下载
二、可能出现的故障原因
- 设备没有配置APN信息
- 触发了机卡绑定停机,排查方法请进入链接查看
- 触发了区域限制
- 超流量导致停网络
- 访问了人联网应用,如腾讯的一些应用
- Cat.1设备,卡关闭了4G功能,只有2G功能
- 设备不支持物联网卡Volte语音功能
- 设备实际使用的号码登记错误
- 设备供电问题
- 公安要求拦截
- sim卡的内部文件损坏
三、定位故障点
打开智能诊断菜单
- 登录 https://ec.iot.10086.cn ,点击右上角登录,输入账号密码或者输入管理手机号码及短信验证码
- 登录成功后点击页面左上方的“连接管理”,跳转到管理界面
- 点击左侧菜单的智能诊断菜单(下图)
- 在智能诊断页面输入框输入MSISDN/ICCID/IMSI,并点击一键诊断,出现类似下图的结果
界面说明:
- 设备信息:可查看终端上报IMEI信息(最后一次上报),如有此信息,证明曾经有成功联网过
- SIM卡状态:显示目前的物联网卡状态,包括
- 已激活:正常状态
- 停机:停机状态,此状态无法正常使用;停机的原因有:机卡分离停机,申请停机,欠费停机
- 可测试:如果测试流量没有使用完,此状态下物联网卡可以正常使用网络功能
- 待激活:物联网卡号码没有激活,此状态物联网卡可以正常使用网络,产生流量后自动改为已激活状态
- 库存期:此状态物联网无法使用网络功能,也无法自动激活,需要主动方式修改状态
- 预约销户/已销户:此状态物联网无法使用网络功能
- APN名称:移动侧配置的apn信息,需核对设备获取的APN信息与这个信息是否一致
- IPV4/IPV6:有数据证明曾经成功联网过
- 通信服务状态:开启状态时网络功能正常;关闭状态时,即使SIM卡状态为已激活状态但仍然无法使用网络
- 在线状态:在线说明近期有流量产生,离线说明已经有一段时间没有流量产生
- 策略限制:触发区域限制将无法使用网络,需要通过移动客户经理修改,全部管控策略详细介绍请点击这里查看
- 设备注册情况:已经注册说明近期有注册到核心网(HSS网元),但由于该状态非实时,因此存在断网后一段时间内仍会显示设备已注册
- 开关机状态:开机状态可以理解为设备已经成功连接并附着在基站上
- SIM卡交换信息:展示物联网卡在核心网各网元的数据交换时间,后文有详细说明
- 会话状态:如近期有通信话单的记录,说明曾经成功联网
- 数据通信记录:查看话单清单,通过分析时间和数据流量大小来判断设备的故障情况
- 重置数据通信服务:点击后将会断网,并重置网元信息,可通过以下三种方式恢复网络:
- 等待 1.5 小时
- 终端主动发起网络连接
- 终端进行重开机操作
SIM交换信息的详细说明:
SIM卡交换信息界面
用途:通过观察界面的更新时间,定位出问题可能出现的地方
更新时间:指控制信令在该网元的最后更新的时间
如何理解:当设备发起网络访问需求到进入互联网,中间会经过多个通信设备(又称网元),而每个网元都可能拦截这个请求,因此结合现场情况和网元信息进行问题定位,以下是4G设备访问互联网的网络拓扑图:
设备在允许访问互联网前需要走认证流程(经过MME),认证通过后才能允许通过SGW;访问互联网前PGW先获取PCRF的规则,都符合后才进入互联网
SIM卡交换信息时间变化的原因:
- MSC:重新注册,例如重启,由于MSC只负责语音和短信,而物联网卡即使没有成功上网,该网元也会更新,主要用户判断设备是否有开机并上报数据到核心网
- MME:卡的状态变更,更新的区域等信息,主要用于判断上网功能是否认证成功,如没有上报APN,该时间不会更新
- 通用APN:可能是漫游到其他地方,就近原则导致互联网出口(PGW)的变更,主要用于判断是否能正常上网
设备APN配置的问题
APN的用途简单理解为上网前的路由信息注册,假如设备没有上报APN信息,则无法成功上网;如上报的APN信息有误,移动侧会自动校正,校正后设备能正常上网;但校正也有一定概率会失败,失败后设备将无法上网
上报的APN信息可以为设备底层代码预设,或者设备提供手工设置的界面
底层预设可分为固定方式或智能选择方式:
- 固定方式:所有运营商的卡都发送同一个APN,或者不同运营商卡发送不同的APN
- 智能选择:多见于安卓系统,在apns-conf.xml文件里面可以预先设置全球各运营商卡的默认APN信息,该信息是根据IMSI的前五位信息(MCC和MNC)来判断是那个运营商的卡
安卓ROM的预设MNC一般不包括08和13,因此很多安卓设备插入物联网卡会出现有信号但没有网络的情况,是因为安卓识别不了这张卡的运营商信息,导致无法上报默认APN。解决方法为:
- 在安卓设置-移动网络-APN菜单-新增APN(名称和APN参数输入CMIOT),CMIOT适合大部分场景,具体要以开卡时移动侧的配置为准
- 在安卓apns-conf.xml文件补充配置信息,MCC和MNC可以通过IMSI信息获取(MCC是前三位,MNC是第四第五位),IMSI可以通过OneLink平台获取
使用默认APN的弊端:依赖移动侧网元的纠错能力,如果纠错失败则导致设备无法上网,常见现象为:在发货前测试能正常使用,到使用地后无法稳定使用,有时会断一下,重启就恢复了
由于在2022年3月开始,移动系统强制实行工信部的管控规则,将导致新办理的大流量卡(月使用流量大于100M)需要使用非标准的APN(移动标准APN为CMIOT/CMMTM/CMNBIOT),上述问题出现频率可能会增加。非安卓系统解决方案为:
- 设备支持手工配置APN信息
- 优化底层代码的逻辑,支持智能识别,自动保存APN等功能
- 开通OTA功能,根据项目提前修改APN参数
一般故障的排查思路
看物联网卡状态信息:确认状态类型是否已激活、可测试、待激活其中一种,上网功能是否为开启
区域限制是否没触发,但实操过程中发现经常出现数据不准确的情况,即实际已经触发区域限制但平台仍显示没有触发,建议在OneLink的区域限制菜单查看移动侧设置的省份,并与设备实际所在省份做对比(考虑省份交界处可能会连接到省外基站);或者通过api方式查看是否触发了区域限制
看是否有ip地址、imei信息:如果没有则优先考虑apn没有配置的可能性
看开机状态:有开机但不能上网,优先考虑apn没有配置和流量用超停网络的可能
看是否已注册:没有注册的代表设备没有向核心网成功发送注册数据,考虑可能是没有信号,设备没有开机、断电,物联网支持的制式与设备不兼容,实物的卡号记录错等
【重要】看SIM卡交换信息:
- MSC时间:有MSC时间,没有MME时间或MME时间早于MSC,考虑是没有上报APN的可能,如:设备关机,使用Cat.1模组但现场只有2G信号,APN设置错误(默认的APN不正确,同时移动侧APN矫正机制没有生效)等
- MME时间:有MME时间,但晚于通用APN的时间,考虑是区域限制
尝试操作停开机:有少数情况是因为号码的HSS/MSC数据异常和数据不同步导致无法使用,可以尝试操作申请停机,过4-5分钟再申请开机,可更新一次HSS/MSC数据,从而解决该类问题
看门狗和通信模组的相关问题
由于看门狗支持断网重连,自动断电的功能,因此在无法上网的故障时,在SIM卡交换信息的界面可能出现MME时间不停更新的情况
通信模组本身支持不断重新驻网的功能,当遇到某种原因不能访问服务器时(如重启,机卡分分离停机,或者关闭了上网功能),模组会每隔一段时间重新申请入网,每次入网需要刷一次SIM卡,而SIM卡的读写次数上限一般为10万次(工业级是50万次),因此部分模组在该场景下SIM卡很快就会报废。
语音类问题
因部分手机终端(如华为、苹果)不支持物联网卡的volte功能(不支持注册到运营商的IMS网元),当设备发起语音主叫时默认自主回落到2G,结束通话后恢复4G的方式,当新开通的物联网卡同时被禁止2/3G网络接入时,在回落2G的过程中网络将被中断。
在使用过程中小概率出现运营商的核心网数据问题,导致无法使用,需要通过操作物联网号码停机后过5分钟再开机的方式重置数据的方式解决
对于一些148号段使用Volte时,可能因为移动的两个省份对某些参数配置不一致,导致只能接听或者只能呼出,需要移动侧沟通解决
转交客户经理排查
OneLink平台无法解决所有问题,部分需要移动侧客户经理配合解决,常见情况:
- 在物联网CMIOT系统查看HSS配置信息:可以查看网络侧HSS网元的上网功能配置,如2G和4G功能是否关闭。一般情况下两个功能是同时开启或关闭,但在过户和重开户的场景很容易遇到2G功能开启而4G功能关闭的情况,如果设备使用的是Cat.1模组,侧在OneLink平台会显示通信服务状态开启,但提示设备没有注册没开机。解决方法为在OneLink操作一次关闭通信功能,等两分钟再开启,相当于前台和网络同步一次数据即可解决
- 提交中移物联网公司二线工单:可查核移动侧核心网网元的问题,但该工单只能解决归属中移物联网公司维护的网元设备
- 提交物联网系统申告单:可查核移动侧业务系统的问题,该工单只能解决CMIOT系统相关的问题,网络类问题不负责
- 提交省内工单至省网维:可核查由省内负责维护的网元设备的情况,一般为查看设备无法上网的信令情况,如被公安拦截等
- 上述工单所属的系统均不相联,提错系统将无法解决问题
四、案例介绍(更新时间:2022-12-12,新增的案例在最后)
现象:共享充电宝基座能正常租还电池,但广告屏无法使用
- 排查过程:充电宝租还业务正常,说明卡和设备正常,再沟通后了解到新增的广告屏是安卓系统,让客户拍照信号情况,发现有信号Logo但没有4G的Logo,判定为没有设置APN。
- 故障原因:广告屏系统是在原来的纯充电宝基础上增加的,由于两套系统(嵌入式和安卓)不相通但共用4G模组,安卓系统没有设置APN导致没成功联网
- 解决方法:按设置菜单手工增加Apn:CMIOT后业务恢复
现象:机卡分离停机复通后,没有换设备但再次停机
- 故障原因:客户经理操作时,先操作了机卡分离复机,再操作删除机卡绑定信息。由于复机后设备可能马上产生了流量,但此时删除机卡绑定的操作仍没完成,导致再次触发机卡分离停机,因触发后到系统操作停机有滞后,最终出现了该现象
- 解决方法:客户经理需要先操作删除机卡绑定信息,再操作机卡分离复机
现象:视频监控设备运行正常,现场2/4G信号正常,Onlink智能诊断提示没有开机,换手机卡后视频正常
- 排除过程:该设备放在户外高处,维护成本高,在onlink排查了很久仍没发现问题,当时认为是sim卡iccid登记错了;最终去现场换卡测试,发现问题卡放在支持移动4G的手机只有2G信号,经查询CMIOT系统的HSS信息,发现只开启了2G功能,关闭了4G功能
- 故障原因:该卡出问题前做过销户重开,但重开前没注意到号码当月已经超流量停网络,重开后系统提示通信功能正常,就误认为销户重开会自动恢复网络功能。同时摄像头只支持Cat.1制式所以无法使用2G网络,onelink就会提示没有开机
- 解决方法:在onelink操作关闭网络,让系统和网络状态一致,再操作开启网络后恢复4G功能
- 其他建议:在物联网旧系统(pboss),前台显示的通信状态经常与HSS状态不一致,因此对于旧系统的物联卡故障,建议优先检查HSS状态
现象:车联网设备开通了区域限制功能,没有出指定省份但忽然无法使用,Onelink提示触发了区域限制功能,且设备一直没有恢复网络
- 故障原因:该现象非车联网也会出现,但由于车联网设备一直通电,因此出现的概率更高。原因是在省边界地方经常会出现省外的基站信号比省内强,导致在有一段时间切换到省外基站,触发区域限制而无法使用网络并同步更新HSS,即使完全回到本省后由于不会马上再更新HSS,因此还会一直触发区域限制
- 解决方案:在onelink的智能诊断点击重置网络,并重启设备即可马上恢复
- 其他建议:车联网场景由于不方便断电重启设备,对于不能提前预估使用位置的场景,建议不要开通区域限制功能(使用贴片卡+个人实名,或限制流量使用量低于100M/月)
现象:语音号码故障号码有信号,上网功能正常,号码呼出无提示一段时间自动挂断,手机拨打号码提示嘟嘟嘟并挂断
情况1:
排查过程:查看系统一切正常,包括HSS语音状态,但设备使用手机卡可以正常呼出和接听,物联网放在手机提示一样的错误
故障分析:HSS是代表核心网的功能,这个状态基本是准的,没有关闭证明语音功能正常,而测试现象是呼出等待时没有错误提示挂断,这个现象多数是信令路由不正确,导致无法接入到语音网关,而控制信令路由的是HSS/MSC的其中一项配置
解决方案:操作申请停机,过4-5分钟再申请开机,可同步一次HSS/MSC数据,从而解决该类问题
情况2:
排查过程:按照情况1的操作后故障没有修复,通过跟踪信令,发现号码在业务签约时有开通4G Volte功能,同时号码禁止了2/3G网络接入,当设备拨打号码时设备自主回落到2G,结束通话后恢复4G。设备放在三星手机测试没有上述问题,放在华为、苹果手机出现上述问题
故障分析:判定为手机对物联网卡的兼容性问题,估计是手机识别机制(通过mcc和mnc)对物联网卡默认不支持volte,而且采用回落到2G的机制,从而导致没有向运营商发起ims注册,同时因为运营商对新开卡禁止了2/3G网络接入功能,回落2G后网络中断。
解决方案:从设备侧方向入手,优化对物联网号段的处理机制
现象:卡状态功能正常,提示开机和在线,区域限制没有触发。但没有流量产生,也不确定设备目前所在位置,卡办理了定向流量功能(dpi白名单)
分析过程:查看sim卡信息交互,发现通用apn的更新时间晚于mme,证明流量在pgw网元被拦截了,初步判断是触发了pcrf策略导致无法访问互联网。
查核该号码办理两个涉及pcrf策略的功能,一个是dpi白名单,另一个是区域限制功能。由于onelink智能诊断显示区域限制没有触发,因此一开始主要关注白名单问题。后来了解到故障只出现在个别号码,因此认为不应该是白名单问题。
再后来发现虽然onelink网页版智能诊断提示没有触发区域限制,但调用onelink的api接口“物联卡区域限制状态查询”反馈终端已超出业务限制的区域
解决方案:通知移动客户经理修改为正确的省份后,卡恢复正常使用
结论:onelink智能诊断的区域限制的查询结果不一定准确,需要结合多种方式(api,排除法等)对比确认
现象:在用的3000张物联网需要增加短信功能,移动侧办理后发现只有2000张成功收发短信,1000张平台发送短信给号码后没有回复,而设备已经投放市场无法实物排查原因;客户前期已经对接了移动短信网关,操作发送短信后一直没有接收回执,但确认设备是已经通电开机中
排查过程:
- 查询onelink提示设备为开机状态,短信诊断页面提示号码没有加入白名单
- 咨询客户经理,反馈号码已经办理了短信功能,已经向物联网公司申请了白名单
- 移动物联网公司反馈号码已经成功加入了白名单,但故障依旧
- 通过客户技术人员手工查看日志,发现发送短信后发送回执提示DB:0140错误,即物联网号码不在该短端口的白名单内
- 再下单排查,反馈录入到物联网卡的短信端口信息与客户使用的不一致,导致这批物联网号码加入到其他短信端口的白名单上
总结:
- 因为短信端口包含多个数字,里面其中一个数字写错了不容易发现,这个问需要尽量避免
- 因短信回执包括发送回执和接收回执,而客户的公众号目前仅有接收回执处理功能,导致没能识别发送错误的问题,后续将跟进优化
其他非Onelink的故障案例请看《中国移动物联网卡故障分析/处理案例汇总》第2大点"通过其他方式定位分析的故障"内容
(上述内容将一直保持更新)
如有任何疑问,请在评论区告诉我,或直连联系我(13922204911手机和微信),我将及时补充