hacker_news_audio_tech_2026-03-23

Hacker News 音频技术 - 2026-03-23

1. Show HN:macOS Kokoro-TTS 文档朗读器——聆听任意文本

一款macOS应用,利用Kokoro TTS模型,可将ePub、PDF和纯文本文件转换为自然语音进行朗读。

作者: mattcheston | 发布于: 2026-03-20 03:20


2. STT.ai如何保护您的音频与转录数据:客户端加密存储方案

作者: nadermx | 发布于: 2026-03-19 20:14


3. Show HN:三款新的 Kitten TTS 模型发布,最小体积不到 25MB

Kitten TTS发布三个开源小模型,支持八种语音,无需GPU即可在树莓派等设备运行,旨在缩小本地与云端TTS的差距。

作者: rohan_joshi | 发布于: 2026-03-19 15:56


4. Show HN:面向阅读障碍者的 Chrome 文本转语音阅读器

HoverSpeak是一款为阅读障碍者设计的免费Chrome扩展,无需选中文本,通过悬停和快捷键即可快速朗读指定内容。

作者: yaronl_elh | 发布于: 2026-03-19 15:46


5. Qwen-ASR-CLI:纯Rust编写的本地Qwen语音识别命令行工具

作者: huang4fun | 发布于: 2026-03-19 12:28


6. Show HN:实时本地文本转语音(3100万参数,5.6倍CPU速度,语音克隆,ONNX)

作者发布了一个基于VITS的小型TTS模型,支持语音克隆和混合,采用Apache 2.0许可,注重低延迟本地推理,但音质和相似度有限。

作者: ZDisket | 发布于: 2026-03-18 20:48


7. Show HN:STT.ai – 音频视频转文字工具

作者: nadermx | 发布于: 2026-03-18 09:12


8. 用手机语音输入在笔记本电脑上打字

作者开发了一个工具,可通过手机键盘语音输入在电脑上打字,支持vim、浏览器等环境。

作者: theSage | 发布于: 2026-03-16 06:56


9. Show HN:SciTeX 通知——为 AI 代理赋予声音:支持 TTS、电话与短信

为AI代理构建的多级通知系统,通过语音、邮件、短信直至电话呼叫提醒用户任务进度,支持本地和远程服务器。

作者: ywatanabe1989 | 发布于: 2026-03-15 22:19


10. Show HN: TTS.ai – 文本转语音

作者: nadermx | 发布于: 2026-03-15 16:41


11. Show HN:在浏览器中使用设备端语音识别实现语音跟踪的提词器

基于语音识别的浏览器端提词器,可根据说话节奏自动滚动和高亮文本,支持暂停和跳行定位。

作者: lbaune | 发布于: 2026-03-15 09:15


12. Show HN:CastReader – 免费为 Kindle Cloud Reader 提供语音朗读的扩展

CastReader浏览器扩展通过解码字体和OCR技术,解决Kindle等平台因非标准渲染导致的文本提取问题,支持多站点内容提取和开源TTS语音合成。

作者: vinxu | 发布于: 2026-03-12 19:07


13. 自托管TTS代理与语音管理器

作者: mooreds | 发布于: 2026-03-10 13:32


14. Show HN:TTS.ai

作者: nadermx | 发布于: 2026-03-08 07:01


15. Qwen3-ASR-Swift

作者: handfuloflight | 发布于: 2026-03-05 10:00


16. Show HN:KokoClone——使用 Kokoro TTS 实现零样本语音克隆

KokoClone项目在Kokoro TTS基础上实现零样本语音克隆,支持多语言,可在CPU/GPU上运行,保持原系统实时性。

作者: Ashish106 | 发布于: 2026-03-04 19:07


17. 多语言ASR中的音调保真度:一项诊断性评估

作者: ibobev | 发布于: 2026-03-04 18:10


18. Ask HN:Mac 上有类似 willowvoice 的 TTS 工具吗?

用户寻求在Mac上通过快捷键调用高质量文本转语音服务的工具,类似WillowVoice。

作者: fiiico | 发布于: 2026-03-04 11:24


19. 原生 Swift/MLX 全语音处理流程:端侧语音识别、合成与语音转换

作者: ipotapov | 发布于: 2026-03-03 06:41


20. Qwen3-ASR 0.6B与1.7B转录模型的C语言推理实现

作者: Curiositry | 发布于: 2026-02-28 00:05