维护记录¶
按时间倒序整理(时间更近的在前)。
Warning
TBC
2025-03-24¶
- 11:44:预计 14:00 重启集群。
- 14:00:开始维护。
- 16:22:维护结束。
Note
构建镜像可参考 https://github.com/tiankaima/Dockerfile/blob/master/cuda/Dockerfile,建议安装 curl、sudo 并创建 uid=1000 无密码用户;pool2-legacy 预计近期重格式化,请尽快备份数据。
2025-03-04¶
- 11:21:提醒 20 分钟后断电。
- 11:41:开始断电维护。
- 2025-03-10 12:03:维护结束。
Note
- 服务入口 https://coder.lab.tiankaima.cn:8443
- 监控 https://grafana.lab.tiankaima.cn:8443,使用 USTC GitLab 登录
- 仅
/data下pool子目录持久,当前 7 个存储池,其中/data/cls1-srv{2...5}-pool为私有存储/data/cls1-pool2-legacy为共享只读历史目录。
2025-03-04¶
- 15:31:通知 03-08 18:00 开始维护。
2025-01-21¶
Note
TBC
2025-01-20¶
- 11:47:新 Coder 平台上线,支持 USTC GitLab 登录注册,并新增
cls2-srv[1-4,6-7]。
Note
重启 Workspace 前后不保留 /home/,仅 /data/ 保留;切换 host 需先关闭 Workspace 再改 Parameters。
2025-01-06¶
- 下午:开始停机维护,容器内数据可能丢失。
Note
Coder创建容器可选a6000/4090- 原路径
~/data、~/share保持不变 - 新增
~/data.new(4090 SSD RAID4,约 21T)和~/master-mnt(只读)。 - 现有容器 upgrade 弹窗务必选择
8xa6000;容器创建后暂不支持迁移宿主。
2024-12-15¶
- 当日:4090 脚本管理方案上线。
- 使用提醒。
- 安全说明。
Note
创建后请修改默认账号密码(user/password);如需访问容器内网 IP,可在 WireGuard 增加路由 192.168.10.0/2。
2024-12-04¶
- 12:05:服务器搬迁,需要重启。
2024-11-06¶
- 09:20:提醒用户将数据迁移到 HDD(
~/share)。
2024-11-04¶
- 15:44:通知计划 16:00 开始维护,安装新的 48T 存储。
- 16:00:开始维护。
- 18:10:维护结束。
2024-11-02¶
- 12:43:发布重启维护通知。
- 21:29:开始重启服务器并完成维护。