一Cron 与 launchd:无人值守怎么做才稳
远程机上别指望交互式 shell:cron 与 launchd 必须显式注入 PATH、NODE_OPTIONS 与 npm_config_prefix,与登录会话同源,否则「人 SSH 进去一切正常、定时任务全挂」会反复出现。建议把健康探针拆成两步:先 openclaw doctor --json 落盘,再 curl 本机回环的健康 URL;失败只告警、不自动大版本升级,避免与正在跑的 Gateway 抢锁。
二五地低价节点:谁适合做「值守出口」
| 地区 | 低价侧重点 | 值守 | 磁盘 |
|---|---|---|---|
| 香港 | 对内 RTT 友好 | 客服窗 ✓ | 先 1TB |
| 新加坡 | 骨干均衡 ✓ | 主哨 | 1TB→2TB |
| 日本 / 韩国 | 镜像与依赖近 | 夜间构建 | 按日志增速 |
| 美东 | 对齐 App 审核时区 | 发版窗 | 2TB 归档 |
Gateway、Skills 与 doctor 分层的落地顺序,可与 OpenClaw 渠道自动化与低价节点选型对照阅读,把「哨兵机」和「主构建机」拆开买。
doctor 升级与回滚顺序
升级 v2026.5.x 小版本时,先冻结配置与模型路由表,再跑 openclaw doctor:网络与证书、磁盘 inode、监听端口、Node 与全局前缀一致通过后,才执行包级更新。若提供 --fix 类子命令,务必在维护窗执行并保留上一版二进制与配置 tarball,launchd 回滚只切 plist 中的 ProgramArguments 指向即可。
三2026.5.6 前后:Codex / OpenAI 路由要核对什么
该小版本前后常见症状是「CLI 已升级、旧环境变量仍指向废弃 host」或「模型别名表与渠道配置不同步」。排障时依次核对:base URL 是否带版本前缀、CODEX 与 OPENAI 相关键是否被合并迁移、以及是否仍混用系统代理与直连。清掉 shell profile 里重复的 export,重启 Gateway 与一次 cron 探针,再用最小对话请求验证 200 与首 token 延迟。
四合并发版前 checklist
-
前缀:
which openclaw与 plist/cron 一致。 - doctor 全绿:再动 Gateway;失败项写进工单模板。
- 路由:Codex/OpenAI 各跑一条冒烟,日志落盘路径可轮转。
1TB / 2TB 扩容落地案例
典型拆法是:低配 M4 先加 1TB 扛 ~/Library/Logs、npm 缓存与 doctor 报告;当出现合规留痕或单机构建缓存长期超过 600GB,再上 2TB 单卷给发版与归档。扩盘后用同一套 cron 跑 df 与目录体积曲线,两周无告警再下调告警阈值。安装前缀、Node 与 Gateway SSH 隧道细节见
v2026.5.x 前缀安装与 Gateway SSH 值班流。
五角色与磁盘矩阵(简表)
用一张表把「谁跑哨、谁吃盘」钉死,避免多人 SSH 改同一前缀。
| 角色 | 低配 + 值守 | +1TB | +2TB 触发 |
|---|---|---|---|
| 哨兵 / doctor | cron 只读 | 报告与缓存 | 多通道日志 |
| 渠道对话 | 单区低峰 | 会话落盘 | 审计导出 |
| 发版 / 构建 | 灰度 | 主力缓存 | 合规镜像仓 |
五地并联时把 plist 与 crontab 放进仓库,用标签区分地区,合并前跑 diff。
六在 Mac mini 上对齐这套值守模型
定时任务、原生 Node 与图形会话在 macOS 上共享同一套 TCC 与签名链路,比 Windows 服务 + WSL 混搭更少「环境分叉」。Apple Silicon 统一内存让 doctor 全量扫描与轻量 Gateway 可同机并存,M4 / M4 Pro 待机约 4W、静音,适合 7×24 哨兵;Gatekeeper、SIP 与 FileVault 也降低无人值守机被误装木马的长期风险。
若你希望本地黄金机与五地云机共用同一 plist 与 cron 片段,先在 Mac mini M4 上跑通再推广——这是目前最具性价比的对照起点;确认无漂移后,再点击下文 CTA 开通与之一致的云主机规格。
Cron/plist 与登录环境同源;doctor 门禁后再升级;2026.5.6 前后校准 Codex/OpenAI 路由;五地低配优先 1TB、合规与重日志再上 2TB。Runbook 与 plist 进仓,合并前全量 diff。