Reddit ML - 2026-06-02
1. 目前世界模型的实际研究重点是什么?[R]
用户询问当前世界模型研究焦点,指出学术社区关注点已从Barlow Twins和DINO转向大型实验室的视频生成扩展。
作者: /u/nat-abhishek | 发布于: 2026-06-01 02:09
2. 用监督学习还是强化学习来微调推理型大语言模型?[D]
用户询问微调小语言模型进行推理和工具调用的最佳方法,包括SFT数据构建和是否需结合RL。
作者: /u/zdeneklapes | 发布于: 2026-06-01 16:23
3. 使用滚动缓冲区和单语模型的实时多语言ASR [P]
一种轻量级实时多语言ASR方案,通过路由音频到多个小型单语模型,实现低延迟转录和语言切换,WER约13%。
作者: /u/JeanMichelRanu | 发布于: 2026-06-01 15:53
4. [D] 简单问题讨论帖
这是一个简单的问答帖,鼓励用户在此提问而非开新帖,并感谢之前回答问题的用户。
作者: /u/AutoModerator | 发布于: 2026-06-01 15:00
5. 你认为图神经网络在天体物理学研究中会发挥重要作用吗?[D]
被RWTH Aachen计算机科学录取的学生询问:图神经网络是否已用于天体物理学研究,以及ML其他子领域如何与天体物理交叉。
作者: /u/pandemic_179 | 发布于: 2026-06-01 11:21
6. 我的欧盟AI法案风险等级评估工具反馈 [P]
免费EU AI法案风险评估工具,10题问卷即可分类风险等级并生成PDF报告,无需注册。
作者: /u/aiandi | 发布于: 2026-06-01 20:29
7. 为什么我们最重要的LightGBM特征反而让预测效果变差 [D]
LightGBM中排名第一的特征在严格消融测试中失效,导致测试MAPE上升0.28pp,原因是编码器学习了不可泛化的标签方差信号。
作者: /u/Nj-yeti | 发布于: 2026-06-01 18:20
8. 5060 Ti 16GB 还是云服务:哪个更适合深度学习、强化学习和大型语言模型的学习与研究?[D]
用户询问在求职阶段,为ML/DL学习购买本地GPU(如5060 Ti 16GB)是否值得,还是使用云服务更合适。
作者: /u/hedgehog0 | 发布于: 2026-06-01 14:09
9. 求购ICML会议门票 [D]
用户因等待资助确认错过ICML购票,现求购门票或寻找取消名额。
作者: /u/TopPerformance1255 | 发布于: 2026-06-01 23:08
10. 全双工 vs 半双工 - AI语音模型的频谱 [D]
讨论了语音AI的半双工与全双工模式。全双工支持重叠、反馈和打断,更接近人类对话,而半双工则显得机械。
作者: /u/Chilly5 | 发布于: 2026-06-01 22:56
11. ICML 经济援助 [D]
ICML经济资助结果已出,用户未被选中,询问是否意味着志愿者申请也被拒,或需等单独通知。
作者: /u/RussB3ar | 发布于: 2026-06-01 16:39
12. MLE-Bench 的进步有多少来自算法,又有多少来自更好的模型和更多搜索? [R]
MLE-Bench评分从30%升至80%,但大部分进步来自更好的模型而非算法改进。新基准FML-Bench显示,旧算法在控制变量后仍能匹配现代系统。
作者: /u/Educational_Strain_3 | 发布于: 2026-06-01 14:34
13. 你在工作中是否曾被迫“折磨数据”以勉强得出正面结果?[D]
作者: /u/XTXinverseXTY | 发布于: 2026-06-01 04:40