hacker_news_audio_tech_2026-06-02

Hacker News 音频技术 - 2026-06-02

1. Mozilla数据集体上的开放家庭基金会TTS数据集

作者: santiiim | 发布于: 2026-06-01 14:32


2. 一个本地优先的讲解视频生成器(Kokoro TTS,无需云端,无需付费SaaS)

作者: nemock | 发布于: 2026-05-31 14:05


3. Ask HN:最佳免费本地语音转文字方案?

作者: thillel | 发布于: 2026-05-26 05:31


4. 最佳TTS模型,盲测基准

作者: sixhobbits | 发布于: 2026-05-24 19:56


5. Show HN: 在移动版Safari中运行的Pocket TTS

作者用Codex修复了wasm在Safari上的兼容问题,原因是Safari不支持simd-relaxed。Pocket TTS能流式播放生成的音频。

作者: ldenoue | 发布于: 2026-05-22 02:01


6. 流媒体延迟的权衡:为何某些TTS模型在实时应用中会失去准确性

作者: ChicknNuggt | 发布于: 2026-05-17 05:37


7. Ask HN:你是如何听研究论文的?(通勤时的TTS工作流程)

作者: vinxu | 发布于: 2026-05-15 09:49


8. VUI – 开源Jarvis技术栈,配备300M TTS模型

作者: bazlan | 发布于: 2026-05-14 14:56


9. DramaBox:一款能朗读舞台指示的开源权重文本转语音工具

作者: steveharing1 | 发布于: 2026-05-14 12:00


10. 2026年最佳TTS:盲测基准

作者: ritzaco | 发布于: 2026-05-14 08:24


11. Hi-Vis:伪装成LLM“软件补丁”的一次性越狱攻击,ASR达到100%

作者: emmakrentz | 发布于: 2026-05-13 00:17


12. Grok TTS 对比 OpenAI

作者: ritzaco | 发布于: 2026-05-08 21:01


13. Grok TTS:X最新文本转语音模型树立新基准

作者: ritzaco | 发布于: 2026-05-07 09:09


14. Show HN:Docker AI 栈,一个 compose 文件自托管 LLM/STT/TTS/MCP

作者: hwdsl2 | 发布于: 2026-05-06 13:40


15. Show HN: TTS Studio: 人工智能驱动的文本转语音工具

作者: shmayro | 发布于: 2026-05-01 23:35


16. 在树莓派 Zero 2W 上运行自定义训练的 Piper TTS 模型

作者: yakkomajuri | 发布于: 2026-05-01 23:07


17. 本地TTS正变得强大且易于使用

作者: speckx | 发布于: 2026-04-29 14:11


18. PAVO-Bench – 5万次语音轮次与8.5万参数路由器,用于ASR→LLM→TTS

作者: vnmoorthy | 发布于: 2026-04-28 14:58


19. Show HN: STT.ai

作者: nadermx | 发布于: 2026-04-28 14:06


20. 使用Soniox语音识别与合成构建语音助手

作者: easwee | 发布于: 2026-04-28 09:31