Hacker News 音频技术 - 2026-05-31
1. Ask HN:最佳免费本地语音转文字工具?
作者: thillel | 发布于: 2026-05-26 05:31
2. 最佳TTS模型盲测基准
作者: sixhobbits | 发布于: 2026-05-24 19:56
3. Show HN: 在移动版Safari中运行的Pocket TTS
使用Codex修复了wasm在Safari上的兼容问题,原因是Safari不支持simd relaxed,只支持simd-fixed。Pocket TTS可流式播放音频。
作者: ldenoue | 发布于: 2026-05-22 02:01
4. 流媒体延迟的权衡:为何某些TTS模型在实时应用中会损失准确性
作者: ChicknNuggt | 发布于: 2026-05-17 05:37
5. Ask HN:你是如何听研究论文的?(通勤时的TTS工作流程)
作者: vinxu | 发布于: 2026-05-15 09:49
6. VUI – 开源 Jarvis 技术栈,配备 3 亿参数 TTS 模型
作者: bazlan | 发布于: 2026-05-14 14:56
7. DramaBox:一款能朗读舞台指示的开源权重文本转语音工具
作者: steveharing1 | 发布于: 2026-05-14 12:00
8. 2026年最佳TTS:盲测基准
作者: ritzaco | 发布于: 2026-05-14 08:24
9. Hi-Vis:伪装成LLM“软件补丁”的一次性越狱,攻击成功率高达100%
作者: emmakrentz | 发布于: 2026-05-13 00:17
10. Grok TTS 对比 OpenAI
作者: ritzaco | 发布于: 2026-05-08 21:01
11. Grok TTS:X最新文本转语音模型树立新基准
作者: ritzaco | 发布于: 2026-05-07 09:09
12. Show HN:Docker AI 栈,一个 Compose 文件自托管 LLM/STT/TTS/MCP
作者: hwdsl2 | 发布于: 2026-05-06 13:40
13. Show HN: TTS Studio: 人工智能驱动的文本转语音工具
作者: shmayro | 发布于: 2026-05-01 23:35
14. 在树莓派 Zero 2W 上运行自定义训练的 Piper TTS 模型
作者: yakkomajuri | 发布于: 2026-05-01 23:07
15. 本地TTS正变得强大且易于使用
作者: speckx | 发布于: 2026-04-29 14:11
16. PAVO-Bench:5万轮语音对话与8.5万参数路由器,实现ASR→LLM→TTS
作者: vnmoorthy | 发布于: 2026-04-28 14:58
17. Show HN: STT.ai
作者: nadermx | 发布于: 2026-04-28 14:06
18. 使用Soniox语音识别与合成构建语音代理
作者: easwee | 发布于: 2026-04-28 09:31
19. Show HN: Out Loud – 开源桌面TTS应用,支持macOS/Windows/Linux
一款免费、MIT许可的跨平台桌面TTS应用,无需订阅或联网,解决现有TTS应用痛点。
作者: julia-kafarska | 发布于: 2026-04-26 22:19
20. Stt.ai MCP 服务器
作者: nadermx | 发布于: 2026-04-26 04:52