Hacker News 音频技术 - 2026-05-28
1. Ask HN:最佳免费本地语音转文字工具?
作者: thillel | 发布于: 2026-05-26 05:31
2. 最佳TTS模型盲测基准
作者: sixhobbits | 发布于: 2026-05-24 19:56
3. Show HN: 在移动版Safari中运行的Pocket TTS
使用Codex修复了Wasm在Safari上的兼容问题:Safari不支持simd-relaxed,仅支持simd-fixed。Pocket TTS可流式播放生成的音频。
作者: ldenoue | 发布于: 2026-05-22 02:01
4. 流媒体延迟的权衡:为何某些TTS模型在实时应用中会损失准确性
作者: ChicknNuggt | 发布于: 2026-05-17 05:37
5. Ask HN:你如何听研究论文?(通勤时的TTS工作流)
作者: vinxu | 发布于: 2026-05-15 09:49
6. VUI – 开源 Jarvis 技术栈,配备 3 亿参数 TTS 模型
作者: bazlan | 发布于: 2026-05-14 14:56
7. DramaBox:一款能朗读舞台指示的开源权重文本转语音工具
作者: steveharing1 | 发布于: 2026-05-14 12:00
8. 2026年最佳文本转语音:盲测基准
作者: ritzaco | 发布于: 2026-05-14 08:24
9. Hi-Vis:伪装成LLM“软件补丁”的一次性越狱攻击,ASR达到100%
作者: emmakrentz | 发布于: 2026-05-13 00:17
10. Grok TTS 对比 OpenAI
作者: ritzaco | 发布于: 2026-05-08 21:01
11. Grok TTS:X最新文本转语音模型树立新基准
作者: ritzaco | 发布于: 2026-05-07 09:09
12. Show HN: Docker AI 栈,一个 compose 文件自托管 LLM/STT/TTS/MCP
作者: hwdsl2 | 发布于: 2026-05-06 13:40
13. Show HN: TTS Studio: 一款AI驱动的文本转语音工具
作者: shmayro | 发布于: 2026-05-01 23:35
14. 在树莓派 Zero 2W 上运行自定义训练的 Piper TTS 模型
作者: yakkomajuri | 发布于: 2026-05-01 23:07
15. 本地TTS正变得强大且易用
作者: speckx | 发布于: 2026-04-29 14:11
16. PAVO-Bench – 5万轮语音对话与85K参数路由器的ASR→LLM→TTS系统
作者: vnmoorthy | 发布于: 2026-04-28 14:58
17. Show HN: STT.ai
作者: nadermx | 发布于: 2026-04-28 14:06
18. 使用Soniox STT和TTS构建语音代理
作者: easwee | 发布于: 2026-04-28 09:31
19. Show HN:Out Loud – 开源桌面TTS应用,支持macOS/Windows/Linux
一款免费、MIT许可的跨平台桌面TTS应用,无需订阅或联网,解决现有TTS应用的痛点。
作者: julia-kafarska | 发布于: 2026-04-26 22:19
20. Stt.ai MCP 服务器
作者: nadermx | 发布于: 2026-04-26 04:52