reddit_machinelearning_2026-03-28

Reddit ML - 2026-03-28

1. [D] 关于学术会议与论文页数限制的思考

作者认为会议论文的附录越来越长,甚至成为核心部分,这违背了附录作为补充材料的初衷,并质疑页数限制的意义。

作者: /u/kostaspap90 | 发布于: 2026-03-27 09:09


2. [D] 我们对LoCoMo进行审核:6.4%的答案有误,裁判竟接受高达63%的故意错误答案

审计发现LoCoMo基准测试存在6.4%答案错误,且其AI评分器会接受63%的错误答案。另一基准LongMemEval-S因测试数据能完全放入模型上下文窗口,实为上下文测试而非记忆测试。

作者: /u/PenfieldLabs | 发布于: 2026-03-27 13:38


3. [D] 反驳阶段增加实验常让我的论文质量下降

作者指出,当前学术评审中,审稿人倾向于要求大量额外实验以证明其尽责,即使论文已达标。这些补充实验常非必要且耗时,作者呼吁评审应聚焦于验证核心主张。

作者: /u/AffectionateLife5693 | 发布于: 2026-03-27 22:46


4. [P] Deezer揭示CNN音频检测在压缩音频上失效,现推出双引擎方案可应对MP3压缩

作者发现基于梅尔频谱的CNN模型难以检测压缩后的AI生成音乐,转而采用结合音源分离的混合方法,通过分析原始与重建音频的差异来提升检测准确率。

作者: /u/Leather_Lobster_2558 | 发布于: 2026-03-27 11:21


5. [R] 我该选择ACL SRW、ICML研讨会还是AACL?

作者在学术会议审稿中获中等评分,因担心研究过时且不愿反复修改,现纠结于等待正式会议AACL或选择近期但级别较低的研讨会。

作者: /u/Soggy_Ad6925 | 发布于: 2026-03-27 05:51


6. [R] 对照实验:在自动超参数搜索中为LLM智能体提供计算机科学论文访问权限,可使结果提升3.2%

实验表明,为LLM智能体提供计算机科学论文访问权限,可使其在自动超参数搜索中发现新方法,最终将模型性能提升3.2%。

作者: /u/kalpitdixit | 发布于: 2026-03-27 23:05


7. 重训练、微调还是迁移学习?[D]

用户询问在电商点击流项目中,每日新增数据时,应从头训练模型还是基于旧模型微调,并提及了采样策略以保持数据时效性。

作者: /u/Bluem00n1o1 | 发布于: 2026-03-27 05:07


8. 实时学生注意力检测:ResNet与面部关键点,哪种方法更适合资源受限场景?

讨论检测学生课堂注意力,对比基于面部关键点(68点简化为24点)和深度学习(ResNet/CNN)两种技术方案。

作者: /u/Savings_Load2308 | 发布于: 2026-03-27 15:01


9. 【讨论】为无POS集成的多门店零售构建需求预测系统,求架构建议

基于手动数据构建轻量需求预测系统,初期用统计模型,后期引入机器学习,并探讨了数据量少时模型选择、异常值处理和生成可信置信区间三个核心问题。

作者: /u/Automation_storm | 发布于: 2026-03-27 13:19


10. [讨论] 寻求开放世界式学习问题的定义

用户使用度量学习方法处理开放世界分类,通过嵌入空间和相似度阈值聚类未见过的类别,效果良好。

作者: /u/ralfcat | 发布于: 2026-03-27 10:17


11. [项目] 从TikTok视频创建数据集

Tikkocampus工具可将TikTok创作者视频时间线转为带时间戳、可搜索的片段,用于RAG项目或创建数据集。

作者: /u/Ilyastrou | 发布于: 2026-03-27 20:50


12. [R] ACL ARR审稿台拒稿

作者因重复提交论文被拒稿,通过邮件沟通成功撤销了拒稿决定。

作者: /u/Lonely-Highlight-447 | 发布于: 2026-03-27 14:03