haibao-tts-cli/changelog.md

# 版本变更记录 (changelog.md)

## [0.1.0] - 2026-04-24

### 新增
- 初始化 Rust 项目结构（edition 2021）
- 配置 Cargo.toml 依赖（使用国内源，稀疏索引协议）
- 创建项目文档体系（taolun.md、changelog.md、agents.md）
- 实现配置管理模块 (config.rs) - Singleton 模式
  - 统一配置文件路径为 `~/.config/tts/config.toml`（所有平台）
  - 使用 home 库获取家目录
- 实现 API 调用模块 (api.rs) - Builder 模式
  - TtsClient 结构体封装 API 调用
  - 支持双 Header 认证（api-key + Authorization）
  - Base64 解码音频数据
- 实现 CLI 模块 (cli.rs) - clap derive 模式
  - 添加 Onboard 子命令（引导式配置）
  - 添加 Voices、Config、ShowConfig 子命令
- 实现主程序入口 (main.rs)
  - 异步主函数（tokio）
  - 错误处理和退出码规范（0-4）
  - 支持从文本或文件输入
- 创建 `project.config.toml` 管理项目版本
- Release 版本构建成功（无警告）
- 语音合成功能测试成功

### 技术栈
- Rust (edition 2021)
- clap 4.6 (CLI 参数解析)
- reqwest 0.12 (HTTP 客户端)
- tokio 1.52 (异步运行时)
- serde + serde_json (序列化)
- toml (配置文件)
- base64 0.22 (音频解码)
- home 0.5 (跨平台家目录获取)
- anyhow 1.0 (错误处理)

### 功能列表
- ✅ 文本转语音（TTS）
- ✅ 支持多种音色（default_zh, default_en, mimo_default）
- ✅ 配置文件管理（~/.config/tts/config.toml）
- ✅ CLI 引导式配置（onboard 命令）
- ✅ 列出可用音色（voices 命令）
- ✅ 配置管理（config set/show 命令）
- ✅ WAV 音频输出

---

## 版本规范
遵循 [语义化版本 2.0.0](https://semver.org/lang/zh-CN/)：
- 主版本号：不兼容的 API 修改
- 次版本号：向下兼容的功能性新增
- 修订号：向下兼容的问题修正

### 修改（第三轮 - 流式输出）
- 修改 `synthesize()` 返回音频数据而非保存文件
- 支持输出到 stdout（二进制流）
- 保留 `--output` 参数用于保存到文件
- 输出到 stdout 时自动抑制提示信息
- 便于作为 claw skill 集成


### 修改（第四轮 - 音频播放）
- 添加 rodio 0.19 依赖（音频播放库）
- 添加 --play 参数（直接播放音频）
- 修改 synthesize() 返回音频数据
- 新增 play_audio() 函数（使用 rodio 播放）
- 支持三种输出方式：播放/保存/流式输出
- --play 和 --output 互斥

## [0.1.0] 最终状态

### 新增功能（第四轮）
- 添加 rodio 0.19 音频播放库
- 新增 --play 参数：直接播放音频（单次播放，不循环）
- synthesize() 函数改为返回音频数据 Vec<u8>
- 新增 play_audio() 函数：使用 rodio 从内存播放 WAV

### 修改（第四轮）
- 修改 Cargo.toml：添加 rodio 依赖
- 修改 cli.rs：添加 --play 参数（与 --output 互斥）
- 修改 main.rs：
  - synthesize() 返回 Result<Vec<u8>>
  - 添加 play_audio() 函数
  - run() 支持三种输出方式

### 修复（第四轮）
- 修复 synthesize() 重复代码问题
- 修复 stdout 输出被 println 污染的问题
- 移除未使用的导入警告

### 功能列表（最终）
- ✅ 文本转语音（TTS）
- ✅ 支持多种音色（default_zh, default_en, mimo_default）
- ✅ 配置文件管理（~/.config/tts/config.toml）
- ✅ CLI 引导式配置（onboard 命令）
- ✅ 列出可用音色（voices 命令）
- ✅ 配置管理（config set/show 命令）
- ✅ 直接播放音频（--play 参数）
- ✅ 保存文件（--output 参数）
- ✅ 流式输出（stdout 二进制流）
- ✅ WAV 音频输出

### 修改（第五轮 - 音色扩展）
- 更新音色列表为 Mimo-TTS 完整列表（8个音色）
- 默认音色从 default_zh 改为 mimo_default
- 添加音色验证（无效时使用 mimo_default）
- 更新 list_voices() 显示详细音色信息
- 废弃 default_zh 和 default_en

### 修改（第六轮 - UI 主题化）
- 新增 ratatui 0.26 + crossterm 0.27 依赖
- 新建 src/ui.rs 模块（主题、组件）
- 美化所有 CLI 输出（voices、config、onboard 等）
- 重写 onboard() 为交互式表单页面
- 支持 API Key 隐藏输入（显示 *）
- 所有命令输出统一主题风格
- 使用 crossterm 实现彩色输出（未使用完整 ratatui Terminal）

### 实施完成（第六轮）
1. ✅ 创建 src/ui.rs 模块（使用 crossterm 美化输出）
2. ✅ 修改 main.rs 引入 ui 模块
3. ✅ 美化 list_voices() 输出（彩色表格）
4. ✅ 美化 show_config() 输出（彩色标签）
5. ✅ 重写 onboard() 为交互式表单（支持密码隐藏输入）
6. ✅ 美化播放和保存完成消息
7. ✅ Release 构建成功（仅有未使用代码警告）
8. ✅ 功能测试通过（voices、show-config）

## [0.2.0] - 开发中

### 新增（第十轮 - 自动语气转换器）
- ✅ 创建 `src/tone.rs` 独立模块（高内聚低耦合）
- ✅ 实现 `apply_tone()` 函数（自动语气转换）
- ✅ 实现 `insert_mid_tone()` 函数（细粒度控制）
- ✅ 实现 `analyze_tone()` 函数（分析语气）
- ✅ 实现 `has_tone_tag()` 函数（检测已有标签）
- ✅ 默认启用，无需额外参数
- ✅ 支持整体风格标签 `[语气]`
- ✅ 支持细粒度控制标签 `（描述）`

### 修改（第十轮）
- 修改 main.rs：引入 tone 模块
- 修改 main.rs：在 synthesize() 中调用语气转换

### 语气映射规则
- `！` → [激动] + ！（激动）
- `？` → [疑惑] + ？（疑惑）
- `。` → [平静] + 。（停顿）
- `……` → ……（拖长音）
- 多种标点 → 组合标签如 [激动 疑惑]

### 技术细节
- 使用 `[语气]` 格式添加整体风格
- 使用 `（描述）` 格式添加细粒度控制
- 符合 Mimo-TTS 音频标签控制规范
- 检测已有标签，避免重复添加
- 4 个单元测试全部通过

## [0.2.0] - 开发中

### 新增（第九轮 - 流式输出完成）
- ✅ 实现 `--stream` 参数功能（流式 API 调用）
- ✅ 使用 SSE（Server-Sent Events）处理流式响应
- ✅ 流式输出时自动使用 pcm16 格式
- ✅ 支持流式输出到 stdout 或保存到文件
- ✅ 修改 api.rs 添加流式请求方法
- ✅ 使用 futures::StreamExt 处理字节流
- ✅ 流式 API 返回原始 PCM16 数据（无 WAV 头）
- ✅ 支持 `--stream` 和 `--play` 同时使用
- ✅ 新增 pcm16_to_wav() 函数（自动封装 WAV 头）

### 修改（第九轮）
- 修改 Cargo.toml：添加 futures、tokio-util 依赖
- 为 reqwest 添加 stream feature
- 修改 main.rs：synthesize() 支持 stream 参数
- 修改 main.rs：支持流式数据播放（PCM16 → WAV）
- 修改 api.rs：修复 read_stream_response 实现

### 修复（第九轮）
- 修复 StreamReader 编译错误（改用 futures::StreamExt）
- 修复 reqwest stream feature 缺失问题
- 修复播放时未识别 PCM16 格式问题

### 技术细节
- PCM16 转 WAV：24000Hz, 16bit, 单声道
- WAV 头 44 字节，包含必要的格式信息
- 流式播放时自动添加 WAV 头再播放

### 新增（第七轮 - 配置分层设计）
- 实现分层配置设计：
  - `project.config.toml` - 项目默认配置（base_url、default_format）
  - `~/.config/tts/config.toml` - 用户配置（api_key、default_voice）
- 用户配置覆盖项目默认配置中的对应项
- 临时文件生成在当前目录（不允许离开当前目录）

### 修改（第七轮）
- 重写 `config.rs` 实现分层配置加载
- 修改 `cli.rs` 移除 base_url 参数
- 修改 `ui.rs` 简化显示和表单（只处理 api_key 和 default_voice）
- 修改 `main.rs` 使用新的配置结构
- 更新 `project.config.toml` 添加 base_url 和 default_format

### 修复（第七轮）
- 修复默认音色未生效问题（config.rs 默认值改为 mimo_default）
- 修复配置文件只保存用户配置项

## [0.1.0] - 2026-04-24