
昨晚11点45分,正准备睡觉,手机响了。看到是客户来电,心里就知道八成又出事了。果然,电话那头传来急促的声音:"小王,设备又掉线了!这都是这个月第四次了!生产线停了,老板在现场等着,你快帮我看看!"这是一家工厂的项目经理,他们去年上了一套设备联网系统,用的是我们的工业级4G路由器。我一边远程登录设备查看日志,一边问他最近有没有什么变化。折腾了半个多小时,发现是工厂新装了一台大功率变频器,开机瞬间产生的电磁干扰导致路由器死机。调整了一下设备位置,加了屏蔽措施,问题才算解决。
挂了电话已经凌晨12点半,我躺在床上却睡不着。这样的场景这三年来经历了太多次,有时候一个晚上能接三四个这样的电话。做工业通信设备的技术支持,真的是24小时待命,因为工业现场很多是三班倒,设备问题随时可能发生。这三年里,我接待过的客户至少有一千多个,处理过的问题保守估计上万个。有些问题很简单,客户不看说明书导致的误操作;有些问题很棘手,需要深入分析日志、远程调试、甚至现场排查才能解决;还有些问题根本不是设备的问题,而是现场环境、网络条件、甚至是人为因素造成的。
这三年的经历让我对工业级无线路由器这个行业有了非常深刻的理解。我发现很多客户在选购和使用这类设备时,信息是严重不对称的。销售为了完成业绩,什么好听说什么;客户不懂技术,只能听销售的;出了问题两边扯皮,最后倒霉的是我们技术支持。所以我一直想写点东西,把这些年积累的经验和教训分享出来,让客户在选购和使用工业级无线路由器时能少走弯路,也让行业能更透明一些。今天终于下决心把它写出来了。
这篇文章会很长,可能要两万字以上。我会从技术角度详细讲解工业级无线路由器的方方面面,包括硬件设计、性能指标、应用场景、选型方法、安装调试、故障排查、行业内幕等等。有些话可能会得罪同行,有些观点可能会引起争议,但是我觉得该说的还是要说。这篇文章不是为了给我们公司打广告,而是真心想帮助那些正在或者即将使用工业级无线路由器的朋友们。好了,废话不多说,直接开始正文。

很多人第一次听到工业级无线路由器这个概念,都会有疑问:它跟家里用的路由器有什么区别?为什么要叫"工业级"?这个问题看似简单,实际上涉及到很多技术细节。今天我就从硬件设计的角度,详细讲讲工业级无线路由器和消费级路由器的本质区别。
先从最直观的外壳说起。消费级路由器基本都是ABS塑料外壳,看起来挺漂亮,也便宜,但是在工业环境下根本撑不住。我见过太多这样的案例:客户把消费级路由器装在工地上,夏天太阳一晒,塑料外壳就变形了;冬天温度一低,外壳变脆,轻轻一碰就裂了。更要命的是塑料外壳的散热性能很差,设备工作时产生的热量散不出去,内部温度越来越高,最后触发过热保护自动关机,或者干脆烧坏了。我们拆过很多这种坏掉的设备,PCB板都被烤得变色了,有些电容都鼓包了。
工业级路由器为什么要用金属外壳?主要有三个原因。第一是散热,金属的导热系数比塑料高几十倍,可以快速把内部热量传导到外壳表面,再通过空气对流散发出去。而且金属外壳本身就可以设计成散热器的形状,增加散热面积。我们做过对比测试,同样的工作负载下,塑料外壳的内部温度比金属外壳高15-20度。这个温差对于电子元器件来说是非常致命的,因为温度每升高10度,元器件的寿命就会减半。
第二个原因是电磁屏蔽。工业环境里电磁干扰非常强,到处都是大功率电机、变频器、电焊机这些干扰源。塑料外壳对电磁波基本没有屏蔽作用,外界的干扰信号很容易进入设备内部,影响电路的正常工作。金属外壳则不同,它本身就是一个法拉第笼,可以有效屏蔽外界的电磁干扰。同时,设备内部的高频信号也不会泄露到外面,避免对周围其他设备造成干扰。这就是为什么工业级设备都要求有EMC认证,而EMC测试的一个重要环节就是检查设备的屏蔽效果。
第三个原因是强度。工业现场的环境比办公室、家庭恶劣得多,设备可能会被碰撞、跌落、挤压。塑料外壳强度低,容易损坏。金属外壳强度高得多,即使受到外力冲击也不容易变形或者破裂。而且金属外壳可以承受更大的安装应力,比如用螺丝紧固在钢梁上,塑料外壳可能会被拧裂,金属外壳完全没问题。
当然金属外壳也有它的问题,比如重量大、制造工艺复杂、散热片设计要求高等等。但是对于工业应用来说,这些都不是问题,可靠性才是第一位的。我们的外壳是压铸铝合金,表面做了阳极氧化处理,既能防腐蚀又能增加散热效果。外壳内侧设计了散热鳍片,增大散热面积。关键发热部件通过导热硅脂与外壳紧密贴合,热量可以快速传导出去。这样的设计虽然复杂,但是确实有效,我们的设备即使在60度高温环境下满负荷运行,内部芯片温度也能控制在85度以内,远低于芯片的最高耐温105度。
PCB电路板是设备的核心,但是一般用户看不到,也很少关注。其实PCB的设计和制造工艺,对设备的性能和可靠性有非常大的影响。消费级路由器为了控制成本,一般用双层板或者四层板,工艺也比较简单,喷锡或者镀银。这种板子短期使用没问题,但是长期在恶劣环境下工作,就会出现各种问题。
工业级路由器一般用六层板甚至更多层,为什么要这么多层?因为电路越复杂,需要的走线越多,如果只有两层或者四层,很多走线要绕很远,不仅增加信号延迟,还容易产生串扰和反射。多层板可以让电源层、地层、信号层分开,互不干扰。而且中间的地层和电源层可以起到屏蔽作用,减少层与层之间的串扰。特别是对于高速数字信号和射频信号,多层板的性能优势非常明显。
我们做过对比实验,同样的电路设计,用四层板和六层板制作,在电磁兼容测试中,六层板的抗干扰能力明显更强。在辐射发射测试中,六层板的辐射水平比四层板低5-10dB。在抗扰度测试中,六层板可以承受更高强度的干扰而不出现误动作。这些测试数据充分说明了多层板在电磁兼容性方面的优势。
PCB表面处理工艺也很重要。消费级路由器一般用喷锡或者镀银,这两种工艺便宜但是不耐用。喷锡表面不平整,焊接后可能有虚焊,而且锡在高温下容易氧化。镀银表面虽然平整,但是银容易硫化变黑,时间长了会影响焊接质量。工业级路由器一般用沉金工艺,也就是在铜箔表面化学镀一层金。金的化学性质稳定,不会氧化和硫化,而且导电性能好,焊接质量高。沉金板的保存期长,即使放几年不用,焊盘表面依然光亮如新,不会影响焊接。
另外PCB的厚度、铜箔厚度也有讲究。消费级路由器的PCB一般是1.0mm厚,1盎司铜(35微米)。工业级路由器的PCB一般是1.6mm厚,2盎司铜(70微米)。更厚的板子强度更高,不容易弯曲变形。更厚的铜箔载流能力更强,发热更小,而且抗机械应力的能力更强。我们见过一些廉价产品,用很薄的板子,装配时候螺丝稍微拧紧一点,板子就弯了,导致焊点受力,时间长了就会开裂。
还有一个细节是PCB的阻焊油墨和字符油墨。工业级PCB用的是高温阻焊油墨,可以承受多次回流焊的高温而不变色、不脱落。字符油墨也是耐高温、耐磨损的,不会因为长期使用而磨掉。消费级PCB用的油墨质量差一些,时间长了可能会变色、脱落,虽然不影响功能,但是看起来不专业。
电子元器件是设备的基本组成单元,但是同样的元器件,也分不同的等级。一个电阻、一个电容,外表看起来都一样,但是内在质量差别很大。这种差别不仅体现在性能参数上,更重要的是体现在可靠性和一致性上。
电子元器件按照应用领域分为几个等级:军用级、工业级、汽车级、商业级、消费级。军用级最高,要求能在极端环境下长期可靠工作,比如温度范围-55℃到+125℃,要经过严格的筛选和老化测试,故障率极低。工业级次之,温度范围一般是-40℃到+85℃或者+105℃,也要经过较为严格的测试,可靠性比商业级高一个数量级。汽车级类似工业级,但是对振动、冲击的要求更高。商业级是常温范围0℃到+70℃,可靠性一般。消费级最低,只保证常温范围工作,可靠性最差。
工业级路由器应该用什么等级的元器件?理论上应该全部用工业级,但是实际上很难做到,因为不是所有元器件都有工业级版本,而且工业级元器件的供应有时候不稳定。所以一般的做法是,关键元器件用工业级,比如主控芯片、通信模组、电源芯片、高精度电阻电容等。非关键元器件可以用商业级,但是要经过筛选,确保性能满足要求。绝对不能用消费级元器件,那是对产品质量不负责任。
怎么识别元器件的等级?一般元器件的型号里会有等级标识,比如TI(德州仪器)的芯片,型号后缀I代表工业级(-40℃到+85℃),E代表扩展级(-40℃到+125℃),C代表商业级(0℃到+70℃)。但是有些不规范的小厂商,会用商业级的芯片标成工业级,这种造假行为很难从外表看出来,只有实际测试或者用专业仪器检测才能发现。我们采购元器件都是从原厂授权代理商那里买的,有正规的质保书和可追溯性,绝不会从二手市场或者不明渠道采购。
除了等级,还有一个重要因素是品牌。同样是工业级元器件,不同品牌的质量也有差别。国际大厂的产品,比如TI、Infineon、Murata、TDK等,质量是有保证的,虽然价格高一点,但是可靠性好,故障率低。国内也有一些不错的品牌,比如比亚迪半导体、兆易创新等,性价比不错。但是也有一些小品牌甚至是山寨货,外表做得跟大厂一模一样,但是内在质量差得远,用在产品里就是定时炸弹。我们的原则是,关键元器件必须用国际大厂的,非关键元器件可以用国内品牌,但是要经过严格测试验证。
还有一个容易被忽略的问题是元器件的一致性。即使是同一批次的元器件,性能参数也会有差异,这就是参数的离散性。好的元器件,参数离散性小,一致性好。差的元器件,参数离散性大,每个都不一样。对于模拟电路和射频电路来说,元器件的一致性非常重要。如果一致性差,每个产品的性能都不一样,有些好有些差,这在批量生产时是很大的问题。我们在设计电路时会考虑元器件的离散性,留出足够的余量,即使元器件参数有波动,也能保证电路正常工作。而且我们在生产时会对关键参数进行测试,确保每台产品都符合规格要求。

这是一个经常引起争议的话题。很多客户看到我们的产品只有一个以太网口,第一反应就是:这也太少了吧,怎么够用?为什么不做多几个口?这背后其实涉及到工业产品的设计理念问题。
首先要明确一点,工业产品的设计理念和消费产品是不一样的。消费产品追求功能多、性价比高、外观漂亮,因为要吸引普通消费者。工业产品追求的是可靠性、适用性、维护性,功能不需要多,够用就好,但是每个功能都要做到极致可靠。这是两种完全不同的设计哲学。
从可靠性角度考虑,接口越多,故障点越多。每增加一个接口,就增加一个潜在的故障源。接口要焊接在PCB板上,焊点可能虚焊;接口要连接外部设备,连接器可能接触不良;接口要做防护,密封可能失效。特别是在工业环境下,如果要做到IP66的防护等级,每个接口都需要用防水接头,而防水接头恰恰是最容易出问题的地方。橡胶密封圈会老化,螺纹会磨损,时间长了防护能力就下降了。我们统计过故障数据,多口路由器的故障率比单口路由器高20%左右,而且很多故障就是出在多余的接口上。
从应用场景考虑,工业网络的组网方式和家庭网络不同。家庭网络是星型拓扑,路由器作为中心,直接连接多个终端设备,所以家用路由器需要多个LAN口。但是工业网络一般是分层架构,路由器作为接入层设备,负责提供广域网连接,然后通过工业交换机进行局域网扩展,再连接各种终端设备。这种架构层次清晰,管理方便,而且可以利用交换机的高级功能,比如VLAN划分、QoS、环网冗余等。在这种架构下,路由器只需要一个口连接交换机就够了,不需要多个口。我们统计过客户的应用数据,95%以上的应用场景,一个千兆口就完全够用了。
从维护角度考虑,接口少意味着故障点少,维护工作量小。工业现场的维护人员不一定都是网络专家,如果设备有很多接口,接线就很复杂,容易接错。而且接口多了,排查故障也更困难,不知道问题出在哪个接口上。单口设计非常简单明了,一根线连接交换机,出了问题很容易定位。
当然我们也理解,确实有一些特殊场景需要多个口,比如不想额外部署交换机,或者空间受限,或者有特殊的网络隔离要求。所以我们也提供多口型号,但是那是针对特定需求的,不是标准配置。对于大部分应用,我们还是坚持推荐单口方案,这是经过大量实践验证的最优选择。
另外说说WiFi的问题。很多人觉得WiFi是标配,应该都有。但是在工业应用中,WiFi往往不是必需的。工业设备大多是有线连接,因为有线连接更稳定、更可靠。WiFi在工业环境下面临很多挑战:金属设备遮挡严重、电磁干扰强、覆盖范围有限、安全性问题等等。所以我们把WiFi设计成可选配置,需要的客户可以选配,不需要的可以省掉,这样更灵活。而且去掉WiFi还有一个好处,就是降低功耗和发热,提高稳定性。
这是工业级设备区别于消费级设备的一个重要特征。消费级设备都是单电源,工业级设备很多都支持双电源冗余。有些客户不理解,觉得这是厂商为了多卖钱搞的噱头。实际上,双电源冗余在工业应用中是实实在在的刚需。
工业现场的供电环境往往不够理想,可能会出现各种问题。电源线路老化、接触不良、负载波动、雷击浪涌、人为误操作,都可能导致短暂或长时间的供电中断。对于消费级设备,供电中断就意味着设备断电重启,一般也就几分钟的事,影响不大。但是对于工业设备,情况完全不同。工业设备很多是24小时不间断运行的,连接的是关键业务系统,比如生产线控制、监控系统、数据采集等。如果因为电源问题导致设备断网,轻则业务中断几分钟,重则可能导致生产事故、数据丢失、经济损失。
我们有个客户是做注塑成型的,生产线上有几十台注塑机,通过网络连接到中控系统。有一次车间里一台大功率设备启动,瞬间压降导致路由器重启,注塑机失去控制信号,模具里的塑料凝固了,结果整套模具报废,损失几十万。这就是典型的因为电源问题导致的生产事故。如果当时用的是双电源路由器,这个事故完全可以避免。
双电源冗余的工作原理很简单,设备有两个独立的电源输入接口,可以同时连接两路电源。设备内部有智能电源管理电路,实时监测两路电源的状态。正常情况下,主电源供电,备用电源待机。当主电源出现故障(电压过低、断电、短路等),管理电路会在几毫秒内检测到异常,立即切换到备用电源。切换过程非常快,设备内部的电容可以在切换过程中维持供电,不会出现断电重启的情况。当主电源恢复正常后,可以自动或手动切回主电源。
这个功能看似简单,但是工程实现并不容易。首先要选择合适的电源管理芯片,既要有快速的故障检测能力,又要有可靠的切换机制。切换过程要平滑,不能出现电压跌落或者尖峰。其次要设计合理的切换逻辑,什么情况下切换,什么情况下不切换,都要仔细考虑。比如主电源瞬间压降又马上恢复,这种情况要不要切换?如果切换太频繁,反而影响稳定性;如果不切换,可能会出现供电不足的情况。我们的方案是设置一个延迟阈值,只有故障持续时间超过阈值才触发切换,避免误切换。
双电源冗余不只是硬件上的冗余,还涉及到系统可靠性的设计理念。工业系统的高可用性,是通过多层冗余来实现的。双电源只是其中一层,还有双网口、双SIM卡、双设备等冗余措施。每增加一层冗余,系统的可用性就提升一个数量级。单电源设备的可用性可能是99%,双电源设备可以达到99.9%,再加上其他冗余措施,可以做到99.99%甚至更高。这对于关键应用来说是非常重要的。
当然双电源也增加了系统的复杂度和设计难度。两路电源要确保独立,不能从同一个电源引出两根线,那样没有冗余效果。要考虑电源的兼容性,支持不同电压等级的电源同时接入。要考虑故障隔离,一路电源故障不能影响另一路。这些都需要精心设计和大量测试。我们在这个功能上投入了很多研发精力,经过几百次测试,才做到了现在的性能水平:切换时间小于10ms,切换过程TCP连接不断,业务不受影响。

技术指标和性能参数是选购设备的重要依据,但是很多客户对这些参数的理解存在误区。有些参数看起来很高,实际上达不到;有些参数看起来不重要,实际上很关键。今天我就来详细讲讲那些容易被误解的技术指标。
工作温度是工业级设备最基本也最重要的指标之一,但也是最容易被误解的。我们的产品标称工作温度-35℃到+75℃,经常有客户问:那我的环境夏天最高60度,是不是就可以放心用了?表面上看确实是这样,60度在75度的范围内,应该没问题。但实际情况要复杂得多。
首先要明白,标称的工作温度是指环境温度,也就是设备外部的空气温度,不是设备内部的温度。设备工作时会产生热量,内部温度会比环境温度高很多。一台功耗10瓦的设备,在密闭环境下,内部温度可能比环境温度高20-30度。如果环境温度是60度,设备内部可能就达到80-90度了。虽然主控芯片的最高工作温度可能是105度,看起来还有余量,但是电路板上还有很多其他元器件,它们的耐温可能没那么高。而且在高温下,元器件的性能会下降,寿命会大幅缩短。
我们做过详细的温度测试。在不同的环境温度下,测量设备内部各个关键点的温度,包括主控芯片、通信模组、电源芯片、PCB板等。结果发现,在60度环境温度下,设备满负荷运行,主控芯片的温度可以达到82度,通信模组85度,电源芯片90度。这些温度虽然没有超过器件的最高工作温度,但是已经很接近了。长期在这种温度下工作,器件的老化速度会加快,故障率会上升,寿命会缩短。
所以我们的建议是,虽然设备可以在75度环境温度下工作,但是为了保证长期稳定性,建议环境温度不要超过60度。如果实在没办法,环境温度就是很高,那就要想办法改善散热条件。比如加装遮阳罩、增加通风、加装散热风扇、降低设备负载等。这些措施看起来简单,但是效果很明显,可以让设备内部温度降低10-15度,大幅提高可靠性。
另外还要注意一点,工作温度范围不只是指设备能开机工作的温度范围,更重要的是指设备能保证性能和可靠性的温度范围。有些设备在极端温度下虽然能工作,但是性能会大幅下降,比如网络速率降低、时延增加、丢包率上升等。我们的设备在整个工作温度范围内,性能指标都能保持在规格要求以内,不会因为温度变化而出现明显的性能下降。这是通过精心的热设计和大量的测试验证实现的。
低温方面相对简单一些,因为设备工作时会发热,低温环境反而有助于散热。但是极低温也会带来一些问题。比如LCD显示屏在低温下响应会变慢,甚至不显示。锂电池在低温下容量会下降,性能会变差。润滑油会变稠,机械部件会变脆。不过工业路由器一般没有这些部件,所以低温影响相对较小。但是要注意一点,设备在极低温环境下长时间放置后,不要立即通电,要让设备先回到常温,避免冷凝水的产生。我见过有客户把设备从零下20度的室外拿到常温室内,立即通电,结果电路板上凝结了水珠,导致短路。正确的做法是,让设备在常温环境下放置至少1小时,等温度平衡了再通电。
IP防护等级是另一个容易被误解的参数。很多客户看到IP66就觉得很厉害,可以防水了。实际上IP66只能防喷水,不能浸水。这个必须说清楚,否则客户用错了,设备进水损坏,责任很难界定。
IP防护等级是一套国际标准(IEC 60529),由两个数字组成。第一个数字代表防尘等级,从0到6,6是最高级,表示完全防止灰尘进入。第二个数字代表防水等级,从0到9,数字越大防护能力越强。我们的产品是IP66,意思是防尘等级6(完全防尘),防水等级6(防强力喷水)。
防水等级6的具体定义是:使用内径12.5mm的喷嘴,水流量100升/分钟,压力100kPa,从任意方向对准设备喷射,持续至少3分钟,测试后设备内部不能有进水现象,功能正常。这个测试模拟的是强力喷水的场景,比如用高压水枪冲洗设备,或者暴雨天气。但是注意,测试时间只有3分钟,不是持续几小时几天。而且水压和水流量是有限的,不是说任何强度的喷水都能防。
如果要防浸水,需要达到IPX7或IPX8。IPX7的标准是,设备浸入1米深的水中,持续30分钟,不能进水。IPX8的标准更高,可以在更深的水中持续浸泡,具体深度和时间由厂商和用户协商确定。很多客户把IPX6和IPX7搞混,以为能防强力喷水就能防浸水,这是完全错误的。IPX6强调的是高压喷水,但时间短;IPX7强调的是浸水时间长,但水压低。两者的测试方法和应用场景完全不同。
我们的产品是IP66,适合户外使用,可以经受风吹雨淋,可以用水枪冲洗(短时间),但是不能长时间泡在水里。如果设备掉进水池、河流、海里,肯定会进水损坏。所以安装时一定要注意,设备要装在不会被水淹没的位置,即使下大雨积水也不能淹到设备。
另外还要强调一点,IP防护等级不是永久不变的,会随着时间推移而下降。橡胶密封圈会老化,螺纹会磨损,表面涂层会脱落,这些都会导致防护能力下降。我们建议,设备投入使用后,每年至少检查一次防护状况,特别是各个接头部位。如果发现密封圈有老化迹象,要及时更换。如果长期在盐雾、高温、强紫外线环境下使用,检查频率要更高,可能需要每半年甚至每季度检查一次。
还有一个容易被忽略的问题是,IP防护等级的测试是针对整机的,但是在实际使用中,用户可能会打开外壳,更换SIM卡、调整配置等。如果外壳没有盖好,密封圈没有到位,防护能力就会大打折扣。我们遇到过很多这样的案例,客户反映设备进水了,我们拿回来检查,发现是外壳盖没有拧紧,或者密封圈装偏了。所以使用时一定要按照说明书的要求,正确安装外壳盖,确保密封到位。
网络速率是客户最关心的性能指标之一,但也是最容易产生误解的。厂商宣传的速率都是理论峰值,实际使用中根本达不到。这不是厂商故意欺骗,而是网络通信的特性决定的。
以4G网络为例,Cat4模组的理论下行速率是150Mbps,上行速率是50Mbps。但这是在理想条件下的峰值速率:信号强度最好(RSRP>-70dBm),信噪比最高(SINR>20dB),基站不拥塞,使用最高的调制编码方案(64QAM),载波聚合全开。在实际应用中,这些条件很难同时满足。
信号强度受距离、遮挡、天气等因素影响。在城市里,距离基站500米范围内,信号一般还不错,RSRP能到-75dBm左右。超过1公里,信号就开始变弱,RSRP可能降到-90dBm甚至更低。郊区和农村,基站密度低,信号更差。遮挡也是个大问题,金属建筑、地下室、山体遮挡,都会严重衰减信号。
信噪比受干扰影响很大。基站周围如果有其他发射源,比如其他基站、WiFi热点、对讲机、雷达等,都会产生干扰,降低信噪比。工业环境的电磁干扰特别强,变频器、电焊机、大功率电机都是干扰源,SINR可能只有几个dB。
基站负荷也是重要因素。一个基站同时服务几十上百个用户,带宽是大家共享的。高峰时段,用户多、流量大,每个用户分到的带宽就少。我们测试过,同一个位置,凌晨三四点钟速率能到70-80Mbps,晚上八九点钟只有20-30Mbps,差距三倍。
调制编码方案也会根据信道质量动态调整。信号好的时候用64QAM,速率高;信号差的时候用QPSK,速率低但是可靠性高。这个调整过程是自动的,用户感觉不到,但是速率会实时变化。
综合这些因素,4G网络的实际速率,在城市里一般是30-80Mbps下行,10-30Mbps上行。在郊区和农村,可能只有10-30Mbps下行,5-15Mbps上行。这是一个比较真实的数据范围,虽然远远达不到理论值,但对于很多应用来说已经足够了。
5G网络的情况类似,理论速率可以到几个Gbps,但实际使用中,在信号好的地方,也就是300-800Mbps下行,50-150Mbps上行。如果信号不好,或者基站负荷高,速率还会更低。所以看速率指标的时候,不要被理论值迷惑,要看实际能达到多少。最可靠的方法是在实际使用环境中测试,用专业的测速工具,测试不同时间段、不同位置的速率,取平均值,这才是真实的性能。
还有一个容易被忽略的问题是上行速率。很多客户只关注下行速率,觉得下行快就行了。但是对于工业应用,上行速率往往更重要。因为很多工业应用是数据采集、视频监控,需要把数据从现场上传到云端或者中心机房,这都是上行流量。4G的上行速率本来就比下行低很多,再加上基站的上行资源比下行更紧张,实际的上行速率可能只有下行的1/5到1/3。如果应用需要大量上行流量,一定要重点测试上行速率,不要只看下行。
时延是实时性应用非常关心的指标,但是很多人对时延的理解不够准确。时延有很多种定义:空口时延、端到端时延、往返时延、单向时延等等。不同的定义,测试方法不同,数值也不同,不能简单对比。
空口时延是指数据在无线接口(手机或CPE到基站)上的传输时延。4G的空口时延理论值是10-20ms(单向),5G可以做到1-5ms。这是无线通信的固有特性,受调制方式、帧结构、调度算法等影响。空口时延是整个网络时延的一部分,但不是全部。
端到端时延是指数据从源端到目的端的总时延,包括空口时延、核心网时延、传输网时延、互联网时延等。这是用户实际感受到的时延,也是最有意义的指标。但是端到端时延的组成很复杂,受很多因素影响,很难精确测量和预测。
往返时延(RTT)是最常用的测试方法,就是ping命令测出来的时延。ping从源端发一个ICMP包到目的端,目的端收到后原样返回,测量这个来回的时间,就是往返时延。往返时延等于单向时延的两倍(理想情况下),但是实际上去程和回程的路径可能不同,时延也可能不同,所以往返时延不能简单除以2当成单向时延。
我们测试过,4G网络的端到端往返时延,在信号好、网络不拥塞的情况下,一般是50-100ms。5G网络可以做到30-60ms。但是这只是到运营商网关的时延,如果目的地是互联网上的服务器,还要加上互联网的时延,可能要再加几十毫秒。
时延不是固定不变的,会实时波动。无线网络的时延波动比有线网络大得多,有时候可能几十毫秒,有时候可能几百毫秒。时延波动(jitter)对实时应用影响很大,比如语音通话、视频会议、远程控制等。时延大一点还能忍受,但是时延波动大,会导致通话断断续续、视频卡顿、控制延迟不稳定,用户体验很差。
我们在测试时延时,不只测平均值,还要测时延的分布情况,包括最小值、最大值、标准差、99百分位值等。99百分位值的意思是,99%的包的时延都小于这个值,只有1%的包超过。这个指标比平均值更能反映实际体验。比如平均时延50ms,但是99百分位值200ms,说明虽然大部分时候时延不错,但是偶尔会出现很大的时延峰值,这对实时应用是不可接受的。
对于时延敏感的应用,我的建议是,不要只看厂商给的理论值,一定要在实际环境中长时间测试。测试时间至少要几个小时,最好是24小时,覆盖不同的时间段,因为时延会随着网络负荷变化。测试方法可以用持续ping,每秒ping一次,记录所有的时延数据,然后做统计分析。如果平均时延和99百分位时延都满足要求,那就可以放心使用;如果经常出现很大的时延峰值,那就要考虑优化网络或者换其他方案。

讲了这么多理论,该说说实际应用了。工业级无线路由器的应用场景非常广泛,不同的场景对设备的要求完全不同。今天我就挑几个典型场景,详细讲讲技术选型的思路和方案设计的要点。
户外视频监控是工业级无线路由器最常见的应用场景之一。看似简单,就是把摄像头的视频通过无线网络传回来,但实际上有很多技术细节需要注意。
首先是带宽需求的计算。很多客户对带宽的概念比较模糊,不知道要多大的带宽。其实这个计算并不复杂。一路1080P的视频,用H.264编码,码流一般是4-6Mbps。如果是H.265编码,码流可以降到2.5-4Mbps。4路摄像头,用H.264编码,总带宽需求就是16-24Mbps。再加上一些协议开销、重传等,实际需要的带宽大概是30Mbps左右。
这个带宽用4G完全可以满足,不需要上5G。但是要注意,这是上行带宽,也就是从现场传到中心的方向。4G的上行带宽本来就比下行小,而且上行资源更紧张。实际测试时,要重点测试上行速率。如果上行速率能稳定在40-50Mbps以上,那传4路1080P视频是没问题的。如果上行速率只有20-30Mbps,那就要考虑降低视频码流,或者减少摄像头数量,或者改用H.265编码。
其次是信号覆盖的问题。户外监控点往往比较分散,有些位置离基站很远,信号不好。信号弱不只是影响速率,更重要的是影响稳定性。信号弱的时候,丢包率会上升,连接容易断开,视频会卡顿或者黑屏。所以部署前一定要做信号勘测,用专业的4G/5G测试手机或者频谱仪,测试每个监控点的信号强度。
如果信号不好,有几种解决办法。第一是调整安装位置,尽量装在高处、开阔处,避免遮挡。第二是更换高增益天线,用定向天线对准基站方向,可以提升5-10dB的信号强度。第三是加装信号放大器,但是要注意放大器的合法性问题,有些地区不允许私自使用信号放大器。第四是考虑换运营商,不同运营商在同一位置的信号强度可能差别很大,可以都测试一下,选信号最好的。
第三是防护等级的要求。户外监控面临风吹雨淋、日晒雨淋,设备必须有足够的防护能力。IP66是基本要求,能防雨水、防尘。但是还要考虑其他因素,比如防晒、防雷、防盐雾等。
防晒很重要但经常被忽略。设备长期暴露在阳光下,外壳温度可以达到70-80度,内部温度更高。即使设备标称工作温度到75度,但长期在这种温度下工作,寿命会大打折扣。所以建议给设备加装遮阳罩,或者装在有遮挡的位置。遮阳罩不只是遮阳,还能挡雨,一举两得。
防雷也很关键。户外设备,特别是装在高处的,容易遭雷击。虽然直击雷的概率很小,但是雷电感应的影响很大。雷击附近的地面或建筑物,会在电源线、网线、天线上感应出高压脉冲,瞬间可以达到几千伏,足以击穿电路。所以电源线、网线、天线馈线上都要加装防雷器,把雷电能量导入大地。设备本身也要做好接地,接地电阻要小于4欧姆。
防盐雾是沿海地区特别要注意的。海边的空气含盐量高,盐雾对金属腐蚀很严重。普通的金属外壳,半年就会锈蚀。要用耐腐蚀的材料,比如铝合金、不锈钢,而且表面要做防护处理,比如阳极氧化、喷涂等。接口部位是最容易腐蚀的,要定期检查,发现腐蚀及时处理。
第四是供电的问题。户外监控点往往没有市电,或者市电不稳定。这时候要考虑备用电源方案。常见的有两种:UPS和太阳能。
UPS方案适合有市电但供电不稳定的情况。市电正常时给设备供电,同时给UPS充电。市电故障时UPS供电,可以撑几个小时到十几个小时,取决于UPS的容量。这种方案简单可靠,但是UPS本身也是有寿命的,一般3-5年要更换电池。
太阳能方案适合没有市电的偏远地区。太阳能板给蓄电池充电,蓄电池给设备供电。这种方案的难点是要计算太阳能系统的容量。设备功耗是多少,每天工作多少小时,当地的日照条件如何,阴雨天能撑几天,这些都要考虑。一般的经验是,太阳能板功率至少要是设备功耗的5-10倍,蓄电池容量要能保证3-5天的阴雨天供电。比如设备功耗10瓦,24小时工作,一天耗电240瓦时。考虑转换损耗和余量,蓄电池至少要500瓦时,也就是12V 40Ah左右。如果要保证5天阴雨天,蓄电池要2000瓦时,也就是12V 160Ah。太阳能板按当地日照4小时计算,要给500瓦时充电,考虑效率,太阳能板要150瓦以上。
第五是视频编码和传输协议的选择。前面说了H.265比H.264省带宽30-40%,所以如果摄像头和录像机都支持H.265,优先用H.265。但是H.265对解码性能要求更高,如果录像机或者客户端性能不够,可能会卡顿。
传输协议方面,建议用RTSP over TCP而不是UDP。虽然UDP理论上延迟更低,但是在无线网络中,UDP丢包率很高,而且丢了就丢了,不会重传,导致视频花屏、卡顿。TCP虽然有点延迟,但是有重传机制,丢包了会重传,保证数据完整性。对于监控应用来说,延迟几百毫秒是可以接受的,但是视频花屏、丢帧是不能接受的。
还有一个技巧是调整视频参数。I帧间隔不要设置太长,建议2秒。I帧间隔太长,网络波动时容易出现长时间花屏。码率模式用CBR(固定码率)而不是VBR(可变码率)。CBR虽然压缩率稍低,但是带宽需求稳定,便于网络规划。VBR虽然压缩率高,但是码率波动大,复杂场景时码率会飙升,可能超过网络带宽,导致卡顿。
最后说说管理和维护。户外监控点分散,数量多,如果靠人工去现场维护,成本很高。所以一定要有远程管理能力,可以远程查看设备状态、信号质量、流量统计、系统日志等。发现问题及时处理,不要等到设备完全不能用了才去现场。
还要建立设备档案,记录每个设备的安装位置、安装时间、配置参数、维护记录等。这样出了问题可以快速定位,不用到处找。建议每季度巡检一次,检查设备外观、接头、防护状况,发现问题及时处理。虽然工业级设备可靠性高,但是定期维护还是必要的,可以大幅延长设备寿命。
工业设备联网和一般的IT应用有很大区别,对网络的要求也不同。工业设备包括PLC、工控机、传感器、执行器等,它们通常使用工业通信协议,比如Modbus、Profinet、EtherCAT、OPC UA等。这些协议和普通的TCP/IP协议有区别,对网络的时延、抖动、可靠性要求更高。
首先是协议的支持。工业级无线路由器要能透传各种工业协议,不能像家用路由器那样做深度包检测、应用层网关之类的,那样会破坏工业协议的报文结构。工业路由器应该工作在透明传输模式,把数据原封不动地传递,就像一根透明的网线一样。
其次是时延和抖动的控制。工业控制系统,特别是实时性要求高的,比如运动控制、过程控制,对时延和抖动的要求很严格。PLC和远程I/O之间的通信,时延要控制在10ms以内,抖动要小于2ms。这对无线网络是很大的挑战。4G网络的时延一般是50-100ms,抖动可能有几十毫秒,很难满足要求。5G网络时延可以做到20-50ms,抖动也更小,相对好一些。
但即使是5G,也很难达到有线网络的时延水平。所以对于实时性要求特别高的控制回路,不建议用无线,还是用有线更可靠。无线可以用在监控、数据采集、非实时控制这些对时延要求不那么严格的应用。
第三是可靠性的要求。工业控制系统,特别是连续生产的流程工业,对网络可靠性要求极高。网络中断哪怕几秒钟,都可能导致生产事故。所以一定要有冗余措施,比如双CPE、双SIM卡、双链路等。主链路故障时,备用链路立即接管,保证业务不中断。
第四是安全性的考虑。工业控制网络的安全性要求比IT网络更高,因为一旦被攻击,可能导致生产停工、设备损坏、甚至人员伤亡。所以工业无线路由器要有完善的安全机制,包括防火墙、VPN、访问控制、入侵检测等。
我们的设备支持IPsec VPN、L2TP VPN、OpenVPN等多种VPN协议,可以在设备和控制中心之间建立加密隧道,保证数据传输安全。支持基于MAC地址、IP地址、端口的访问控制列表(ACL),可以精确控制哪些设备可以访问哪些资源。支持网络隔离,可以把控制网络和管理网络隔离开,即使管理网络被攻击,也不影响控制网络。
第五是环境适应性。工业现场的环境比办公室恶劣得多。温度可能很高或很低,湿度可能很大,粉尘可能很多,振动可能很强,电磁干扰可能很强。设备必须能适应这些恶劣环境,长期稳定工作。
我们的设备工作温度范围-35℃到+75℃,可以适应绝大多数工业环境。外壳是金属的,可以承受振动和冲击。内部PCB板用硅胶固定,防止振动导致的虚焊。电源有过压、过流、短路、反接保护,即使供电不稳定也能正常工作。
还有一个容易被忽略的问题是安装方式。工业现场不像办公室有机柜、桌面可以放设备。工业设备一般是装在DIN导轨上,或者用螺丝固定在墙上、钢梁上。所以工业路由器要提供灵活的安装方式,我们的设备既可以装在DIN导轨上,也可以用螺丝固定,还可以挂在墙上,适应各种安装场景。
最后说说工业设备联网的组网架构。常见的有两种:集中式和分布式。
集中式架构是所有现场设备通过无线路由器连接到中心机房的服务器,服务器做集中控制和数据处理。这种架构简单,管理方便,但是对网络依赖性强,网络故障会影响所有设备。适合设备数量不多、地理位置分散的场景。
分布式架构是在现场部署边缘计算节点,现场设备连接到边缘节点,边缘节点做本地控制和数据处理,只把重要数据或者汇总数据通过无线网络传到中心。这种架构对网络依赖性低,即使网络故障,现场设备还能继续工作。适合设备数量多、实时性要求高的场景。
移动设备包括车辆、船舶、无人机、机器人等,它们在移动过程中需要保持网络连接。移动组网比固定组网复杂得多,主要的挑战是切换和覆盖。
切换是指设备在移动过程中,从一个基站切换到另一个基站。切换过程中,可能会出现短暂的连接中断,导致业务受影响。无线通信系统有各种切换技术来减少切换时延,但是完全无感知的切换是很难做到的。
4G网络的切换时延一般是几百毫秒到1秒,这对于浏览网页、看视频等应用影响不大,但是对于实时性要求高的应用,比如远程控制、视频会议,切换时可能会出现卡顿。5G网络的切换时延更短,一般在几十毫秒到几百毫秒,相对好一些。
覆盖是另一个大问题。移动设备的移动范围可能很大,跨越多个基站甚至多个城市。如果有的地方没有网络覆盖,或者信号很弱,设备就会失联。所以部署前要做好覆盖规划,了解移动路线上的网络覆盖情况,对于覆盖不好的地方,要考虑备用方案。
移动设备的天线安装也有讲究。车辆上安装天线,一般用吸盘天线或者打孔安装。吸盘天线安装简单,但是牢固性差,高速行驶时可能被吹掉。打孔安装牢固,但是要在车顶打孔,有些用户不愿意。船舶上安装天线,要考虑防盐雾腐蚀,天线和馈线都要用防腐材料。无人机上安装天线,要考虑重量和空间限制,一般用轻量化的小型天线。
移动设备的供电也是个问题。车辆可以从车载电源取电,一般是DC12V或DC24V。但是车载电源的质量不太好,电压波动大,有时候会有很大的尖峰和浪涌,比如启动发动机时。所以设备的电源要有宽电压输入,要有过压、欠压、浪涌保护。
船舶的供电一般是蓄电池,电压比较稳定,但是要考虑功耗问题。如果是小船,蓄电池容量有限,设备功耗要尽量低。无人机的供电更严格,因为无人机对重量和功耗要求极高,设备要尽量轻、尽量省电。
移动应用还要考虑一个特殊的问题,就是移动过程中的网络性能。设备静止时,网络性能一般比较稳定。但是设备移动时,特别是高速移动时,网络性能会下降。这是因为多普勒效应、快速切换、信道快速变化等原因。我们测试过,车速100km/h时,网络速率会比静止时降低20-30%,丢包率会上升。所以做方案时要留有余量,不要卡着极限用。
还有一个问题是移动中的视频传输。车载监控、无人机航拍,都需要实时传输视频。移动中的视频传输比固定位置更困难,因为网络质量不稳定,时好时坏。如果用固定码率编码,网络不好时会丢包、卡顿。更好的方案是用自适应码率编码,根据网络带宽实时调整视频码率。网络好时用高码率,画质好;网络不好时降低码率,保证流畅。这种技术需要摄像头和编码器支持,不是所有设备都有。
写这篇文章不是为了显摆自己懂得多,也不是为了给公司打广告。我只是觉得,这个行业信息太不透明了。客户不懂技术,全靠销售和厂商的一面之词,吃亏的太多。如果这篇文章能让一部分人少踩坑、少花冤枉钱、少走弯路,那就值了。很多同行可能会觉得我说得太直白了,把行业的一些灰色地带都扒出来了,会不会得罪人。但我觉得,行业要健康发展,就需要更透明。客户有知情权,厂商也应该坦诚相待。藏着掖着,短期能骗到一些客户,长期来看还是会被市场淘汰的。当然这篇文章是站在厂商技术人员的角度写的,难免会有一些偏向性。我尽量做到客观公正,但肯定不可能完全中立。建议大家多方求证,多看几家厂商的说法,多听听用过的人的意见,形成自己的判断。如果这篇文章对你有帮助,麻烦点个赞,或者转发给需要的朋友。如果你有问题或者不同看法,欢迎在评论区交流。我虽然不是专家,但愿意分享经验,共同学习进步。