Reddit ML - 2026-03-21
1. 医学AI用自动标注数据训练,性能暴跌66%,而基准测试竟未察觉![R][P]
研究发现乳腺癌分割模型对年轻患者效果差,因肿瘤更大、更复杂。使用自动标注训练会放大偏差40%,但评测时可能被掩盖。
作者: /u/ade17_in | 发布于: 2026-03-20 20:20
2. [项目] GPT-2 交互式二维与三维可视化
作者创建了一个GPT-2模型的交互式2D/3D可视化网站,用于展示其前向传播过程中的真实注意力分数和激活值,旨在作为解释Transformer基础及KV缓存等概念的教育资源。
作者: /u/Greedy-Argument-4699 | 发布于: 2026-03-20 17:47
3. [D] Scale AI机器学习研究工程师面试经验分享
用户询问Scale AI机器学习研究工程师岗位的面试形式,包括考察重点和准备方向。
作者: /u/BagAway2723 | 发布于: 2026-03-20 03:56
4. “AI研究实验室”这个词是不是已经彻底失去意义了?
作者探讨AI研究实验室的定义,认为真正的实验室应以探索前沿为核心,而非服务于产品路线图。
作者: /u/Shoddy_Society_4481 | 发布于: 2026-03-20 19:23
5. [讨论] 关于CVPR最终稿件提交的疑问
作者提交CVPR终稿后未收到确认邮件,担心提交是否成功,询问他人是否有相同情况。
作者: /u/darkbird_1 | 发布于: 2026-03-20 16:52
6. [P] PyTorch训练零代码运行时可视化
TraceML开源工具新增零代码模式,可在PyTorch训练时实时显示系统和进程指标,便于快速排查性能问题,无需额外插桩。
作者: /u/traceml-ai | 发布于: 2026-03-20 13:55
7. [D] CVPR 2026 研究结果赛道最终版提交
询问选择CVPR 2026 Findings Track的作者是否已收到终稿提交指南。
作者: /u/Resident-Concept3534 | 发布于: 2026-03-20 20:50
8. [P] 本地微调小型语言模型至视觉语言模型适配器,并撰写了简短文章分享
作者分享了一个视觉语言模型训练项目,详细介绍了从文本模型到视觉能力的实现过程、Q-Former工作原理及数据集,并开源了代码。
作者: /u/AvvYaa | 发布于: 2026-03-20 09:24
9. [P] 量化端侧模型超越Whisper Large v3(FP16)——LALM与转导器对比,1.5万次推理测试,完全可复现
开源语音AI库测试显示,Qwen3-ASR与Parakeet TDT两款量化模型在准确率上超越Whisper Large v3,且参数量更小,适合设备端运行。
作者: /u/ivan_digital | 发布于: 2026-03-20 21:39
10. [项目] neuropt:基于大语言模型的超参数优化工具,可解读训练曲线
Neuropt是一个利用LLM分析训练曲线来优化超参数的开源工具,支持PyTorch等框架,相比传统方法能更智能地调整配置。
作者: /u/dloevlie | 发布于: 2026-03-20 18:52
11. [D] 如何看待AI公司赞助的创作者基金?
用户讨论欧盟AI征税提案,认为遵守法规的欧盟公司可能处于劣势,同时担心该基金将增加所有人的自动化成本。
作者: /u/gized00 | 发布于: 2026-03-20 18:50