更多
工控机 重启故障原因及防治 工控机 重启原因 防治 2 引起工控机重启的|北京天拓明达电子科技有限公司
      

工控机重启故障原因及防治

 


关键词:工控机 重启原因  防治

2 引起工控机重启的因素

散热器

2.1  CPU过热自动从新启动

CPU风扇

由于散热不良导致CPU温度过热,到达一定温度程度为了保护CPU引起保护性自动重启是蕞大嫌疑。CPU温度过高的原因基本是由于机箱、CPU散热不良,CPU散热不良的原因有:散热器积尘太多;散热器与CPU接触面之间接触不良; 风扇转速低、风扇转速异常、风扇上的灰尘过多或润滑不良或磨损严重或严重老化的话,那么CPU的散热就存在问题了,久而久之,随着情况的不断恶化,就会出现频繁重启的现象。

设备装机已经两年,原装CPU风扇已经到达使用寿命,设备因风扇和接触不良造成CPU过热引发的重启故障统计如下:

2.2 内存接触不良重启

由于工控机工作环境差,震动较大,加之内存与主板的插槽连接设计不够完善(如下图)。

内存与主板连接方法

连接采用的是内存两边卡子结构内存与卡子的粘接不够牢固,经过长期的过车震动就会造成内存和主板插槽连接松脱,特别是一侧松脱现象,当有松脱时工控机重启,间隔时间为30分钟至60分钟重启一次。该故障多发生在机引起工控机共振较严重的环境。

2.3 工控机电源引起系统自动重启的

   2.3.1  ATX电源老化造成输出功率不足,当接车时设备对接车数据进行处理占用CPU资源较大的时,CPU需要大功率供电,电源功率不够而超载引起电源保护,停止输出。电源停止输出后,负载减轻,此时电源再次启动。由于保护/恢复的时间很短,所以监测中心的显示就是开机正在接车工控机自动重启后无接车数据上传造成漏车。

2.3.2  ATX电源老化造成直流输出不纯,数字电路要求纯直流供电,当电源的直流输出中谐波含量过大,就会导致数字电路工作出错,表现是经常性的重启。

2.3.3设备开机接车时CPU的工作负载是动态的,对电流的要求也是动态的,而且要求动态反应速度迅速。有些ATX电源老化造成输出动态反应时间长,也会导致重启。

 

2.4 工控机主板故障引起系统自动重启的

设备主板导致自动重启的故障很少见。一般是ISA插槽与主板接触不良;主板金手指有氧化现象;个别芯片、电容等元件性能下降。

2.5工控机功能扩展板引起的系统自动重启的

2.5.1各功能扩展板与工控机主程序不能正常交换数据超过时间造成工控机重启。
 2.5.2  ISA插槽接触不良,底板或板件接插部氧化导致工控机重启

 

3           改进措施

3.1   在春季整修更换工控机CPU散热风扇一年更换一次。

3.2    利用春、秋季整修检查CPU风扇散热片的底部硅胶是否变干,如果变干,将CPU风扇上的硅胶清理干净,然后重新涂上好的硅胶即可。接着检查CPU的风扇转动,及CPU的温度是否正常。
3. 3  春、秋季整修可将主板从机箱取出检查主板是否出现老化、电容失效或爆浆。同是对主板和内存金手指,用橡皮擦擦拭。将擦拭后的内存插入主板同时采用帮扎带将卡内存的两个卡子连接绑扎。


采用绑扎带加固

3. 4  利用春、秋季整修对工控机内的灰尘用鼓风机吹尘处理。

3. 5  春、秋季整修对工控机ATX电源吹尘。连续满负荷工作,同时用万用表测量电压变化情况,电压下降不超5%。

3. 6  在设备每月进行检修进入BIOS查看CPU温度不超61℃;CPU风扇转速变化不超1000RPM;查看工控机电压值不超5%。


风扇转速


主板电压值


CPU温度

 

接触不良或有问题,用橡皮擦擦拭各板件金属片或更换ISA插槽,再不行更换板件。

3.9         对所有工控机必须加装2小时在线式UPS电源。防止电力影响工控机。

 

 

经过上述改进,一方面有效地减少因重启带来的情况,降低了设备故障率;另一方面有效地控制了设备重启导致的故障处理次数,既保障了作业安全,又节约费用支出,缓解了处理故障导致维修人员紧张给生产组织带来的压力。