静看光阴荏苒
不管不顾不问不说也不念

解决Proxmox在Hetzner独服日常失联的问题

最近发现一个特别蛋疼的问题,在Hetzner独服上装的Proxmox经常会失联,只能到后台硬重启,但是重启了没几天又失联了。。一共搞了3次,第一次我自己重启恢复了没2天又挂了,发了个工单他们技术貌似也是给我重启了一下,然后没过几天又挂了。。

这问题有两个症状:

1.带宽不能跑高,比如长期跑满1GBps会经常出现短暂的断网(一开始我还以为是线路不好丢包)

2.就是上面说的了,莫名其妙失联,只能硬重启。

第一次挂的时候我就觉得有点莫名其妙,侥幸心理觉得可能是偶尔挂了一下,但是现在发现总是挂,这不是个办法啊,只能自己先判断一下是哪里出问题了。

凭HZ后台的那个服务器状态初步推断应该就是网断了,不是机器死机了之类的,硬件问题可能性不大。然后就一个劲的翻系统日志和内核日志,看的老子眼睛都快看花了,终于发现了一点有用的东西:

关键字:enp0s31f6:Detected Hardware Unit Hang

然后Google搜了一下,找了半天终于在Proxmox的论坛上发现这个帖子:

https://forum.proxmox.com/threads/proxmox-node-freezes.44618/

看来有这问题的还不止我一个,这个帖子里面至少有5个都和我一样碰到过这种问题,而且多数都是在Hetzner的机器上。。

至于解决办法,这个帖子很详细了。。(我是观察了2天确定用帖子里面的方法解决了才发的这篇文章)

如果你要临时解决:

apt -y install ethtool

执行:

/sbin/ethtool -K 主网卡名 tx off rx off

彻底解决(需要重启机器),编辑网卡配置文件:

nano /etc/network/interfaces

在一个有自启动(auto)的网卡下面加上:

post-up /sbin/ethtool -K 主网卡名 tx off rx off

比如我是vmbr0桥接的主网卡,主网卡我没有设置自启动,但vmbr0设置了,那就配置在vmbr0下面也是可以的:

重启之后验证是否生效:

/sbin/ethtool -k enp0s31f6

确定rx-checksumming和tx-checksumming都是off:

搞定收工~

赞(4)
未经允许不得转载:荒岛 » 解决Proxmox在Hetzner独服日常失联的问题
分享到: 更多 (0)

评论 4

  • 昵称 (必填)
  • 邮箱 (必填)
  • 网址
  1. #1

    :arrow: 怪不得网站经常挂

    Sensei5年前 (2019-02-16) Firefox 65.0 Firefox 65.0 Windows 10 x64 Edition Windows 10 x64 Edition回复
  2. #2

    这样就稳多了吧 :smile:

    Sensei5年前 (2019-02-16) Firefox 65.0 Firefox 65.0 Windows 10 x64 Edition Windows 10 x64 Edition回复
    • 应该是稳了。。再多观察几天看看。。

      LALA5年前 (2019-02-17) Google Chrome 71.0.3578.98 Google Chrome 71.0.3578.98 Windows 10 x64 Edition Windows 10 x64 Edition回复

分享创造快乐

广告合作资源投稿