文章目录
矿机白天正常晚上掉算力,先别急着加风扇:把这份“分时排查清单”跑完再花钱
很多矿工都有过这种体验:白天看着一切正常,到了晚上却开始掉算力、报错增多、重连频繁,第二天早上又像没事一样。最容易想到的解释通常是“天热”“网络差”“矿池抽风”,然后顺手买风扇、换路由、改超频,折腾一圈,问题却不一定真解决。
这类故障最麻烦的地方,不在于它严重,而在于它“像随机”。一旦问题带有明显的时间段特征,排查思路就不能再按普通故障那套来。因为能在固定时段反复出现的事,往往不是单点硬件坏了,而是环境、供电、网络、温度、邻居设备负载、运营商高峰拥堵这些外部条件在某个时间窗口里共同作用。
今天这篇教程,就专门讲一个很实用的主题:矿机白天稳、晚上掉,究竟该怎么查,先查什么,后查什么,怎样避免把小问题修成大成本。
先确认是不是“真掉算力”,别被面板误导
很多人说“晚上掉算力”,其实说的是矿池后台显示低了。但矿池面板并不等于矿机实时状态,它有统计窗口,有延迟,还会受拒绝率、提交波动、网络抖动影响。你如果只盯着矿池页面,很容易把“收益波动”误判成“机器故障”。
第一步要分清三件事。
第一,矿机本地算力有没有掉。看矿机后台或管理系统里的实时算力、芯片状态、风扇转速、温度、报错记录。
第二,矿池有效算力有没有掉。注意不是瞬时曲线,而是 1 小时甚至 6 小时的平均值。
第三,掉的是提交效率,还是机器输出本身。很多机器本地算力看着没问题,但 shares 提交延迟高、拒绝率上升,最后体现在矿池上就是收益变差。
有个很常见的情况是,晚上家里其他设备一起上网,直播、电视盒子、NAS 备份、监控回传全开,矿机本地依旧在算,但提交变慢了,于是矿池端看起来像掉算力。这个时候你去拆风道、换硅脂,基本等于白忙。
所以先把“本地输出”和“远端结算表现”分开看,这是整套排查最关键的一步。
晚上出问题,优先怀疑供电和散热的“组合波动”
很多家庭和小型场地有一个误区:觉得晚上环境温度下降,矿机应该更稳才对。实际并不总是这样。
晚上虽然室外可能凉一点,但室内负载常常更集中。空调、电热水器、电磁炉、烘干机、充电设备、照明系统都可能在晚间同时工作。对于老旧线路、排插过多、接线不规范的环境来说,真正影响矿机的不是单纯温度,而是“供电波动加局部热堆积”。
尤其是以下几种场景最容易中招:
一是矿机和大功率家电共用同一路电。白天家里没人,矿机跑得挺好;晚上电器一开,电压波动加大,电源保护更频繁,矿机开始重启或者丢板。
二是白天门窗开着,通风反而比晚上强。到了晚上关窗开空调,房间整体凉了,但热空气排不出去,矿机进风口附近形成热回流,芯片温度局部升高。
三是排风路径设计有问题。白天外界风压小,问题不明显;晚上某些空间门窗关闭后,风道失衡,热气在设备周围打转。
之前有位小矿工,机器每天晚上 8 点后开始出现掉板,最初怀疑矿池不稳,后来又怀疑固件问题。结果最后发现是厨房和矿机共用一组线路,晚饭时段电磁炉一开,电压就掉,矿机电源频繁进入保护边缘。处理办法不是换矿机,而是把线路独立出来,问题当天就缓了大半。
所以只要故障集中在晚间固定时段,供电和散热一定要一起看,不能只查一头。
网络问题别只测“能不能上网”,要看高峰时段的抖动
矿工排查网络时,最爱做的一件事,就是打开测速网站跑一下,看到带宽正常,就觉得网络没事。这个方法对挖矿帮助有限,因为矿机对带宽要求不高,但对稳定性、延迟抖动、丢包和 DNS 解析状态更敏感。
晚上是大多数家庭和小商用宽带的高峰时段。你白天 ping 值很漂亮,不代表晚上也一样。更麻烦的是,有些网络问题不是彻底断,而是偶发卡顿,比如每隔十几分钟抖一下,每次只持续几秒。对于看视频的人来说没感觉,但对于矿机持续提交 shares 来说,足够造成拒绝率抬升和有效算力下滑。
排查网络时,建议你重点看四项:
一是晚间固定时段的丢包率。不要只测一次,最好连测半小时。
二是 DNS 是否偶发失效。有些矿机其实不是算不动,而是域名解析抽风,导致重连矿池异常。
三是路由器是否过热或者连接数打满。尤其是低端路由器,白天轻载没事,晚上设备一多就变慢。
四是矿池线路本身是否适合你当前网络。换一个备用矿池地址,或者切到同矿池的其他区域节点,常常能快速验证问题是不是出在链路上。
如果你用的是无线桥接、PLC 电力猫,或者多层 NAT 的复杂网络结构,晚间问题会更明显。矿机这类设备最怕“平时能用,忙时掉链子”的网络环境。
先停“自动乱调”,再查是不是参数太激进
不少矿工为了多挤一点收益,会开自动调频、轻度超频,甚至混用不同版本固件。机器在白天跑得过去,不代表在晚上的波动环境里也稳得住。
原因很简单。白天环境较平稳,供电、温度、网络都相对均衡,边缘参数还能撑住。到了晚上,一旦电压稍微飘一点、热量堆一点、风速弱一点,原本卡在稳定边缘的设定就容易失控。掉算力、硬件错误率升高、芯片失步,甚至直接重启,往往都是这么来的。
这里有个经验很重要:如果问题是“到点出现”,先把所有激进参数退回保守档,至少观察两个晚上。不要一边出问题,一边继续开着自动调频,让系统不停自我修正。这样你看到的日志会非常乱,很难判断到底是环境问题,还是调参本身造成的二次故障。
有位做小规模托管的用户就碰到过类似情况。机器白天稳定在较高算力区间,晚上从 9 点开始频繁报硬件错误。他以为是风扇老化,连着换了两组配件。后来把频率整体下调一档,错误率立即明显下降。再往下查,发现真正诱因是晚间电压波动加机房回风升温,超频只是把问题放大了。
所以别把“白天能跑”当成参数没问题。真正合格的参数,是在日夜波动里都能稳住。
用两晚时间做一次“对照实验”,比凭感觉判断更靠谱
排查这类故障,最忌讳的就是今天换个电源,明天换个风扇,后天又改矿池,最后自己都不知道哪个动作起了作用。
最省时间的办法,不是同时改很多东西,而是做一个简化版对照实验。
第一晚,只改网络。例如更换备用路由、直连主路由、切备用 DNS、切备用矿池节点,其余一概不动。记录晚间故障时段里的拒绝率、重连次数、有效算力变化。
第二晚,只改供电和运行参数。例如把矿机接到独立插座、取消排插串联、关闭超频、提高风扇策略,其他条件尽量不变。再看问题有没有明显改善。
如果第一晚改善很明显,问题多半偏网络;如果第二晚改善更明显,问题多半偏供电或散热;如果两边都改善一些,那就说明是复合问题,不是一颗螺丝能解决。
这种排查思路看起来慢,其实比“想到哪修到哪”快得多。因为矿机晚间故障最怕误判,一旦误判,就会进入反复花钱、反复停机、反复拆装的低效率循环。
哪些迹象说明你该换思路,而不是继续修小问题
不是所有晚间掉算力都值得长期修。有些场景修来修去,最后发现问题根子在环境本身不适合继续部署矿机。
如果你已经出现下面几种情况,就该考虑换思路了。
第一,线路老旧,且无法独立分路。只要晚间家电一开就波动,这不是矿机的问题,是基础供电条件不够。
第二,设备放置空间无法形成稳定风道。比如封闭阳台、杂物间、吊顶夹层这类位置,白天和晚间温差、气流都不稳定,长期跑机器只会反复出故障。
第三,家庭宽带本身高峰期质量差,且无法升级或更换运营商。挖矿最怕这种“不断但不稳”的网络。
第四,机器必须依赖激进参数才能维持你期待的收益。一旦退回安全档就觉得“不划算”,那说明这套设备与当前场景本来就不匹配。
教程的价值,不只是告诉你怎么修,更是帮你判断哪些问题该修,哪些问题该止损。很多人亏钱,不是因为不会开机,而是因为在不适合的环境里硬撑太久。
今天这篇教程,给矿工的落地建议
如果你的矿机最近也出现“白天正常、晚上掉算力”的情况,别急着下单买配件,先按这个顺序做:
先核对本地算力、矿池有效算力、拒绝率是不是同时异常,确认问题到底在机器还是在提交链路。
再查晚间供电负载,看看矿机是否和大功率电器共线,插座、排插、接头有没有发热和松动。
然后做半小时以上的晚间网络测试,重点不是带宽,而是丢包、抖动、DNS 和矿池节点表现。
接着把超频、自动调频、激进风扇策略先退回保守配置,连续观察两个晚上。
最后用对照实验的方式一项项验证,不要同一晚同时改三四个变量。
对矿工来说,真正省钱的从来不是“配件买得少”,而是少走弯路。晚间掉算力这种事,看着像小毛病,背后往往是环境和参数一起失衡。把时段、供电、散热、网络这四个点捋顺了,很多问题根本不用大修就能解决。
