====== 第五章:部署超融合Ceph集群 ======
原文链接:https://pve.proxmox.com/pve-docs/chapter-pveceph.html
最后更新:2026-02-25
===== 概述 =====
Ceph是一个统一的、分布式存储系统,具有出色的可靠性、可扩展性和性能。Proxmox VE集成了Ceph,允许您通过Web界面部署和管理超融合存储集群。
===== Ceph概念 =====
=== 什么是Ceph ===
Ceph是一个软件定义的存储解决方案,提供:
* 对象存储
* 块存储
* 文件系统存储
=== Ceph组件 ===
* OSD - 对象存储守护进程
* MON - 监视器
* MGR - 管理器
* MDS - 元数据服务器(可选)
===== 安装Ceph =====
=== 通过Web界面安装 ===
1. 转到节点 → Ceph
2. 点击"安装Ceph"
3. 选择版本
4. 确认安装
=== 通过命令行安装 ===
apt install ceph
===== 创建Ceph集群 =====
=== 创建Monitors ===
使用Web界面:
1. Ceph → 创建Ceph集群
2. 添加监视器节点
3. 配置网络
=== 初始化集群 ===
ceph-deploy new node1 node2 node3
===== 配置OSD =====
=== 创建OSD ===
添加OSD:
ceph-deploy osd create --data /dev/sdb node1
=== 设备类型 ===
* HDD - 机械硬盘
* SSD - 固态硬盘
* NVMe - NVMe设备
=== 缓存层 ===
使用SSD作为缓存:
ceph-deploy osd create --data /dev/sda --bluestore --wal /dev/nvme0n1 node1
===== 存储池 =====
=== 创建存储池 ===
通过Web界面:
1. Ceph → 存储池
2. 点击"创建"
3. 命名和选择类型
=== 存储池类型 ===
* Replicated - 复制池
* Erasure Coded - 纠删码池
=== 副本数 ===
* 3副本(默认)
* 2副本
* 自定义
===== 块设备(RBD) =====
=== 创建RBD镜像 ===
rbd create pool/image --size 10G
=== 使用RBD作为存储 ===
在Proxmox中添加:
1. 存储 → 添加 → RBD
2. 输入池名称
3. 配置参数
===== CephFS =====
=== 创建CephFS ===
1. 创建元数据服务器
2. 创建CephFS
3. 配置配额
=== 挂载CephFS ===
mount -t ceph node1:6789:/ /mnt/cephfs -o name=admin,secret=AQDD...
===== 高可用 =====
=== MON高可用 ===
* 多个监视器
* 自动故障转移
* Quorum机制
=== OSD高可用 ===
* 副本机制
* 自动恢复
* PG重平衡
===== 监控 =====
=== Ceph状态 ===
查看状态:
ceph status
ceph health
=== 详细统计 ===
ceph -s
ceph osd df
ceph pool ls
=== Web界面 ===
Proxmox Web界面提供:
* 集群状态
* OSD状态
* 存储使用
* 性能图表
===== 故障排除 =====
=== 常见问题 ===
* OSD故障
* 存储池不健康
* 性能下降
* 网络问题
=== 诊断命令 ===
# 检查健康状态
ceph health detail
# 检查OSD
ceph osd tree
# 检查PG状态
ceph pg stat
=== 恢复 ===
* 替换故障OSD
* 重新添加MON
* 修复存储池
===== 性能优化 ====
=== 硬件建议 ===
* SSD用于日志/WAL
* 足够的内存
* 10GbE网络
=== 调优参数 ===
* osd_op_queue
* osd_memory_target
* bluestore_cache_size
===== 备份Ceph =====
=== 配置备份 ===
备份Ceph配置:
ceph-deploy config backup node1
=== 导出地图 ===
ceph osd getmap -o osdmap
ceph mon getmap -o monmap
===== 升级Ceph =====
=== 升级流程 ===
1. 停止OSD
2. 升级软件包
3. 重启OSD
4. 验证状态
5. 继续下一个节点
=== 注意事项 ===
* 避免同时升级所有节点
* 保持集群健康
* 做好回滚计划
===== 最佳实践 =====
1. 使用奇数个MON(3或5)
2. 合理的PG数量
3. 定期监控健康状态
4. 保持固件更新
5. 使用专用网络
===== 与Proxmox集成 =====
=== 存储类型 ===
Proxmox支持:
* RBD - 块存储
* CephFS - 文件存储
* RGW - 对象存储(将来支持)
=== 虚拟机存储 ===
将Ceph RBD用于:
* 虚拟机磁盘
* 容器存储
* 备份目标