Reddit ML - 2026-04-01
1. TurboQuant作者在OpenReview上作出回应
作者质疑TurboQuant论文的创新性,认为其核心方法并非原创,并批评作者在学术沟通上不够坦诚。
作者: /u/Disastrous_Room_927 | 发布于: 2026-03-31 20:11
2. [D] 为何Muon仅用于Transformer模型?
用户质疑Muon优化技术为何仅用于Transformer训练,而在卷积网络等其他领域未见讨论,尽管其宣称能提升训练速度。
作者: /u/lukeiy | 发布于: 2026-03-31 02:37
3. ICML 2026审稿政策争议:百份反馈显示政策B或得分更高,但政策A信心度更高
一项关于ICML 2026审稿政策的社区调查显示,Policy B的论文平均分(3.43)略高于Policy A(3.26),但Policy A的审稿人自信度更高。多数人认为评分比预期更严格,且Policy B的审稿报告更显精炼。
作者: /u/Available_Net_6429 | 发布于: 2026-03-31 16:06
4. [P] 我创建了一份个人研究快报,专门筛选arXiv论文
一位博士生为过滤arXiv海量预印本噪声,创建了个人研究周报工具。用户提交兴趣后,它会用新闻或特定文风总结相关论文,目前免费运行。
作者: /u/tryptamineBuddha | 发布于: 2026-03-31 12:17
5. [讨论] 机器学习在中高级阶段有“圣经”级别的参考教材吗?
一名人工智能硕士生寻求适合其手写识别、文档分析等论文方向的权威参考书籍,并列举了教授推荐的四本模式识别教材,询问推荐意见。
作者: /u/Fit_Program1891 | 发布于: 2026-03-31 16:17
6. 扩散模型研究面试经验分享?
用户寻求关于扩散模型相关研究科学家或工程师职位的面试经验,包括如何准备、常见问题类型及技术重点。
作者: /u/total_expectation | 发布于: 2026-03-31 04:40
7. [项目] 我为一种低资源语言从头训练了一个语言模型,并成功在安卓设备上实现全本地运行(无需GPU,附演示)
作者发布了为低资源语言卢干达语从头训练的小型语言模型BULaMU,并开发了可在手机离线运行的安卓应用,旨在提升AI对低资源语言和低成本设备的可及性。
作者: /u/AgencyInside407 | 发布于: 2026-03-31 01:31
8. [讨论] ICPR决议探讨
作者对即将公布的ICPR会议结果感到不安,因今年没有反驳环节,希望与投稿者交流。
作者: /u/Striking-Warning9533 | 发布于: 2026-03-31 07:05
9. [R] 2026年谷歌博士奖学金项目
申请者询问谷歌博士奖学金项目,担心自己第一年无顶级论文能否入选,并咨询选拔标准和项目摘要要求。
作者: /u/Alternative_Art2984 | 发布于: 2026-03-31 00:14
10. [R] Gram Newton-Schulz:一种面向μ子计算的快速硬件感知牛顿-舒尔茨算法
作者: /u/Benlus | 发布于: 2026-03-31 19:33
11. [R] 微调服务报告
作者对多家微调服务进行了成本、速度和用户体验的基准测试,指出最佳选择取决于具体需求,并特别提及Nebius在函数调用方面的优势。
作者: /u/ynckdrt | 发布于: 2026-03-31 17:36
12. [D] 本月招聘与求职信息汇总
该帖子提供了招聘和求职的标准化模板,要求用户按格式发布信息,面向有经验的专业人士。
作者: /u/AutoModerator | 发布于: 2026-03-31 02:30
13. [R] 视觉语言模型在长视频理解中的表现
用户发现视频大模型在无选项的开放式推理任务中表现不佳,但提供选项后准确率可达100%,质疑其行为原因。
作者: /u/Alternative_Art2984 | 发布于: 2026-03-31 09:53
14. [D] AI记忆系统基准测试的困境:评估方法各异导致分数失去意义
AI内存系统评估标准不一,使用不同指标导致分数无法直接比较,缺乏标准化方法。
作者: /u/Efficient_Joke3384 | 发布于: 2026-03-31 14:20
15. [研究] 关于人工智能机器学习微任务工作的学术研究
巴西硕士研究招募在线微任务工作者参与匿名访谈,以了解其日常工作体验。
作者: /u/strangerinthealpes | 发布于: 2026-03-31 19:36