Proxmox VE (PVE) 集群管理指南:节点加入与退出操作详解
哈喽大家好!今天咱们来聊聊 PVE 集群管理中两个非常常见的操作:往集群里加新节点,以及把旧节点从集群里踢出去。
别看这操作听起来挺高大上,其实只要步骤对了,一点也不复杂。
先说最重要的:操作前的准备
不管你是要加节点还是减节点,有几件事必须提前准备好,不然分分钟翻车:
1. 网络要通:所有节点必须在同一个局域网里,能互相 ping 通。最好给集群通信单独划个网段,避免和其他业务抢带宽 2. 时间要同步:所有机器的时间必须一致!不然节点之间会认为对方挂了,导致集群分裂。用 chrony
或者ntpdate
命令都能同步时间3. 主机名不能乱改:节点加入集群后,主机名和 IP 地址就锁死了,千万别随便改 4. 备份!备份!备份!:重要的事情说三遍。动集群配置前,一定要备份重要虚拟机和数据
如何加入新节点?
假设你现在已经有个 PVE 集群在运行了,想加台新服务器进去,跟着下面几步走:
第一步:在新节点上做基础配置
# 设置主机名(重启后生效)
hostnamectl set-hostname pve-node-new
# 确保能解析集群其他节点
echo "192.168.1.10 pve-node-1" >> /etc/hosts
echo "192.168.1.11 pve-node-2" >> /etc/hosts
第二步:从老节点复制加入信息 登录到现有集群的任意节点,打开 Web 管理界面:
• 点开"数据中心" → "集群" → "加入信息" • 点击"拷贝信息"按钮,把内容复制下来
第三步:在新节点上执行加入命令 把下面命令里的 <现有节点IP>
替换成你刚才复制的信息里的 IP:
pvecm add <现有节点IP>
按提示输入 root 密码,等它跑完就行了。正常情况下你会看到一堆输出,最后告诉你加入成功。
第四步:验证一下 在新节点上执行:
pvecm status
如果看到新节点已经出现在成员列表里,并且显示 Quorate: Yes
,那就恭喜你,加入成功了!
常见坑点:
• 如果新节点上原来跑过虚拟机,最好先删掉或者迁移走,避免 ID 冲突 • 防火墙没开相关端口(UDP 5404, 5405),会导致节点加不进去 • 时间不同步,节点会一直处于"离线"状态
如何移除旧节点?
有时候服务器要下线维修,或者干脆淘汰了,就需要从集群里移除。这个操作要小心点,顺序错了可能把整个集群搞挂。
第一步:迁移虚拟机 先把要移除的节点上的所有虚拟机和容器都迁到其他节点上。
在 Web 界面上点几下就能完成,记得选"在线迁移",这样业务不会中断。
第二步:在要移除的节点上操作
# 先停掉集群服务
systemctl stop pve-cluster
systemctl stop corosync
# 进入本地模式操作
pmxcfs -l
# 删除集群配置
rm /etc/pve/corosync.conf
rm -rf /etc/corosync/*
# 重启服务
killall pmxcfs
systemctl start pve-cluster
这时候这个节点已经从集群里剥离出来了,Web 界面上应该看不到它了。
第三步:在其他节点上清理配置 登录到集群里任意一个正常节点,执行:
pvecm delnode <要移除的节点名>
如果提示仲裁失败,可以先用这个命令临时调整:
pvecm expected 1
然后再执行删除操作。
第四步:收尾工作 在已经被移除的节点上,清理残留文件:
rm -f /var/lib/corosync/*
建议重启一下这个节点,确保所有服务都恢复正常状态。
遇到问题怎么办?
节点退出后集群卡住了? 可能是仲裁丢失了,在其他节点上执行:
pvecm expected 1
pvecm status # 查看状态是否恢复正常
新节点加不进去?
• 检查防火墙: iptables -L -n
• 检查时间同步: date && chronyc sources
• 查看日志: journalctl -xe
Web 界面看不到新节点? 强制刷新浏览器缓存(Ctrl+F5),或者换个浏览器试试。
最后说几句
PVE 集群管理其实没那么可怕,关键是按步骤来,别跳步。
生产环境操作前,一定要在测试环境先演练一遍。
好了,以上就是 PVE 集群节点加入和移除的完整操作流程。
如果你在实际操作中遇到其他问题,欢迎在评论区留言讨论!
本文链接:https://www.kinber.cn/post/5530.html 转载需授权!
推荐本站淘宝优惠价购买喜欢的宝贝: