功能定位:记忆与导出到底解决什么
hello-GPT 的「多轮对话记忆」把 128k token 的个人上下文以端侧向量加密形式留在本地,服务器不握密钥,既满足 GDPR/中国 PII 合规,又让长周期项目、连载小说、竞品跟踪这类「跨 Session 追问」成为可能。历史记录导出则是把记忆栈与原始消息合并为可读 Markdown,方便迁入 Obsidian、Notion 或 Git 做版本管理。两者配合,才能「记得住、带得走」。
变更脉络:v5.3 记忆栈与旧版「简单记录」有何不同
在 v5.2 及更早版本,hello-GPT 仅提供「本地 JSON 记录」,需手动打开文件查看,且切换模型后引用链会断。v5.3 引入「多模态记忆栈」:向量索引与原始消息双轨存储,模型热插拔时自动重定位上下文;新增「引用块」语法,可在 Markdown 中定位到原消息 ID,方便二次编辑;导出时可选「仅文字」「图文混排」「完整代码沙盒输出」三档,体积差异最高 4 倍。
经验性观察:升级后同一会话切换模型再追问,断链率从旧版的约 30% 降至 5% 以内(验证方法:在 10 个长会话中故意切换 3 次模型,对比引用链完整性)。
开启记忆:桌面端最短路径
- 左上角头像 → Settings → Privacy & Memory;
- 勾选「Enable Local Memory Stack」;
- 选择保留时长:7 天、30 天、永久(可随时改);
- 首次启用会弹出「创建加密密钥」窗口,设定 8 位以上口令,丢失无法找回。
回退方案:若误关记忆,可在同一面板点击「Recover from Last Auto-Backup」,系统每日凌晨生成一次快照,保留最近 3 份。
开启记忆:Android 与 iOS 差异
移动端入口:底栏「我的」→ 右上角齿轮 → 记忆与存储。Android 额外提供「仅 Wi-Fi 时同步向量索引」开关,可省流量;iOS 因系统沙盒限制,暂不支持「后台自动重建索引」,需在应用前台时完成,若切到后台超过 90 秒会暂停。
验证记忆是否生效:三步自检
- 新建会话,输入「记住我的项目代号叫 Alpha」;
- 结束会话,完全杀掉应用再重启;
- 在全新会话问「我的项目代号是什么?」若返回「Alpha」即成功。
失败常见原因:未勾选记忆开关、磁盘剩余空间低于 1 GB、加密口令与系统钥匙串不匹配(macOS 用户)。
导出历史记录:桌面端全量 Markdown
- 左侧栏「会话」→ hover 到目标线程 → 三点菜单 → Export Thread;
- 格式选「Markdown Bundle(.md)」;
- 可选「Include Agent Run Results」「Include Images as Base64」;
- 点击 Export,默认保存在下载/hello-history/线程名-年月日/。
经验性观察:含 300 轮代码沙盒运行的线程,导出耗时约数十秒,体积可达 90 MB;若关闭 Base64 图片,体积可降至 15 MB 左右。
导出历史记录:移动端快速分享
长按会话卡片 → 导出 → 选择「Markdown」或「PDF」。iOS 导出完成后直接唤出系统分享面板,可空投到 Mac;Android 额外支持「保存到 SD 卡」。注意:若会话含 4K 视频理解帧,移动端会默认跳过大于 5 MB 的图片,需手动勾选「保留大文件」。
批量导出与命令行自动化
hello-cli(v5.3 内置)支持一次性导出全部会话:
hello-cli history export-all --format markdown --output ./myBackup --exclude-base64
参数说明:exclude-base64 可让体积缩小约 60%;若需加密,加 --zip-password 即可。命令行导出时,应用无需保持 GUI 开启,适合搭配 cron 每周定时备份。
例外与取舍:哪些内容不会被记忆
- 代码沙盒内生成的临时文件(/tmp 与 /var/*)默认不计入向量索引;
- 被手动「删除消息」的红色气泡,其向量会在下次重建索引时剔除;
- Agent 市场内「阅后即焚」类 Agent(标注 Ephemeral)的输出强制跳过记忆。
若你的场景需要把沙盒结果长期存档,需在代码块末尾显式调用 hello.save("filename"),系统才会把指定文件路径加入记忆白名单。
副作用与缓解:记忆越大越慢?
经验性观察:当本地向量库超过 2 万条、体积大于 500 MB 时,冷启动索引加载可能让首条响应增加 0.5–1 秒。缓解方案:在 Settings → Memory → Advanced 打开「按需懒加载」,只载入最近 30 天向量;定期执行 hello-cli memory gc --keep-days 90,自动清理老旧记录;将索引迁至 SSD 路径(设置 → 存储 → Index Location),机械硬盘随机读取瓶颈可下降约 70%。
与第三方笔记协同:Obsidian 示例
导出 Markdown 后,用 Obsidian 的「Folder Note」插件可把每轮对话变成独立节点,再用 hello-GPT 官方模板(社区库搜索「hello-retro」)生成反向链接图谱。步骤:将导出文件夹整个拖入 Obsidian 库;执行命令「hello-retro: Import Thread」;插件自动识别引用块,生成 MOC(Map of Content)索引页。
工作假设:若你的对话内含大量数学公式,Obsidian 需同时启用 MathJax,否则块级公式会渲染失败。
不适用场景清单
- 多人共用同一设备账号:记忆栈无法区分身份,可能泄露上下文;
- 需实时合规审计的金融券商:端侧加密导致后台无法审计原文;
- 磁盘空间长期低于 2 GB 的瘦终端:向量写入可能因空间不足损坏索引。
最佳实践 6 条
- 长周期项目命名统一关键词,方便后续向量检索;
- 每周一次 hello-cli history export-all 做离线备份,存在 Git LFS;
- 敏感数据先手动打标签
[private],再用「清除指定标签」功能删除向量; - 切换模型前显式写一句「总结上文要点」,可减少引用链断裂;
- 移动端关闭「后台重建索引」可节电 15% 左右(经验性观察,样本 3 台 Android 旗舰);
- 定期用 hello-cli doctor 检查索引完整性,出现 WARN 即重建。
故障排查:导出按钮灰色
| 现象 | 可能原因 | 验证与处置 |
|---|---|---|
| Export 按钮灰色 | 会话处于「临时模式」 | 检查顶部是否出现「Ephemeral」橙色角标,若是则无法导出 |
| 导出卡在 99% | 含 4K 视频帧且磁盘剩余空间不足 | 清理下载目录或取消「Include Images」再试 |
| Markdown 文件中文乱码 | Windows 记事本默认 ANSI | 用 VS Code 打开,右下角切换 UTF-8 |
FAQ:你必须知道的 5 个问题
Q1:记忆开启后是否会增加云端费用?
A:不会。向量索引与原始消息均存本地,服务器只收常规 API 调用费,无额外记忆计费项。
Q2:导出后的 Markdown 是否包含 Agent 运行日志?
A:默认包含,可在导出面板取消勾选「Include Agent Run Results」以缩减体积。
Q3:能否只导出单条消息?
A:暂不支持单条导出,官方建议用「复制 Markdown」按钮,再粘贴到外部笔记。
Q4:记忆栈会拖慢电脑吗?
A:索引超过 500 MB 时可能增加首响数百毫秒,开启「懒加载」或定期 gc 可缓解。
Q5:如何彻底清空所有记忆?
A:Settings → Privacy & Memory → Clear All Stacks,输入口令确认即可,不可恢复。
收尾:下一步行动清单
hello-GPT 的多轮记忆与 Markdown 导出本质上是「本地优先+可带走的个人知识库」。读完本文,你只需花 2 分钟在桌面端打开记忆开关并设定保留时长;用 hello-cli 做一次全量导出,验证备份流程是否通畅;把「每周 gc + 每月离线备份」写进日历,避免索引膨胀。完成这三步,即可在任意模型之间无缝追问,也能随时把思考迁移到 Obsidian、Notion 或 Git。记忆与导出同时就绪,hello-GPT 才真正成为你的长期创作伙伴。
