hacker_news_audio_tech_2026-05-30

Hacker News 音频技术 - 2026-05-30

1. Ask HN:最佳免费本地语音转文字工具?

作者: thillel | 发布于: 2026-05-26 05:31


2. 最佳TTS模型盲测基准

作者: sixhobbits | 发布于: 2026-05-24 19:56


3. Show HN: 在移动版Safari中运行的Pocket TTS

使用Codex修复了Wasm在Safari上的兼容问题,原因是Safari不支持simd-relaxed,仅支持simd-fixed。Pocket TTS可流式传输音频。

作者: ldenoue | 发布于: 2026-05-22 02:01


4. 流媒体延迟的权衡:为何某些TTS模型在实时应用中会损失准确性

作者: ChicknNuggt | 发布于: 2026-05-17 05:37


5. Ask HN:你如何听研究论文?(通勤时的TTS工作流)

作者: vinxu | 发布于: 2026-05-15 09:49


6. VUI – 开源 Jarvis 堆栈,配备 3 亿参数 TTS 模型

作者: bazlan | 发布于: 2026-05-14 14:56


7. DramaBox:一款能朗读舞台指示的开源权重文本转语音系统

作者: steveharing1 | 发布于: 2026-05-14 12:00


8. 2026年最佳TTS:盲测基准

作者: ritzaco | 发布于: 2026-05-14 08:24


9. Hi-Vis:伪装成LLM“软件补丁”的一次性越狱攻击,ASR达100%

作者: emmakrentz | 发布于: 2026-05-13 00:17


10. Grok TTS 对比 OpenAI

作者: ritzaco | 发布于: 2026-05-08 21:01


11. Grok TTS:X最新文本转语音模型树立新基准

作者: ritzaco | 发布于: 2026-05-07 09:09


12. Show HN: Docker AI Stack,一个compose文件自托管LLM/STT/TTS/MCP

作者: hwdsl2 | 发布于: 2026-05-06 13:40


13. Show HN: TTS Studio: 人工智能驱动的文本转语音工具

作者: shmayro | 发布于: 2026-05-01 23:35


14. 在树莓派 Zero 2W 上运行自定义训练的 Piper TTS 模型

作者: yakkomajuri | 发布于: 2026-05-01 23:07


15. 本地TTS正变得强大且易用

作者: speckx | 发布于: 2026-04-29 14:11


16. PAVO-Bench – 5万次语音轮次与8.5万参数路由器,用于ASR→LLM→TTS

作者: vnmoorthy | 发布于: 2026-04-28 14:58


17. Show HN: STT.ai

作者: nadermx | 发布于: 2026-04-28 14:06


18. 使用Soniox语音识别与合成构建语音助手

作者: easwee | 发布于: 2026-04-28 09:31


19. Show HN: Out Loud – 开源桌面TTS应用,支持macOS/Windows/Linux

一款免费、MIT许可的跨平台桌面TTS应用,无需订阅或联网即可使用。

作者: julia-kafarska | 发布于: 2026-04-26 22:19


20. Stt.ai MCP 服务器

作者: nadermx | 发布于: 2026-04-26 04:52