Reddit ML - 2026-03-28
1. [D] 关于学术会议与论文页数限制的思考
作者认为会议论文的附录越来越长,甚至成为核心部分,这违背了附录作为补充材料的初衷,并质疑页数限制的意义。
作者: /u/kostaspap90 | 发布于: 2026-03-27 09:09
2. [D] 我们对LoCoMo进行审核:6.4%的答案有误,裁判竟接受高达63%的故意错误答案
审计发现LoCoMo基准测试存在6.4%答案错误,且其AI评分器会接受63%的错误答案。另一基准LongMemEval-S因测试数据能完全放入模型上下文窗口,实为上下文测试而非记忆测试。
作者: /u/PenfieldLabs | 发布于: 2026-03-27 13:38
3. [D] 反驳阶段增加实验常让我的论文质量下降
作者指出,当前学术评审中,审稿人倾向于要求大量额外实验以证明其尽责,即使论文已达标。这些补充实验常非必要且耗时,作者呼吁评审应聚焦于验证核心主张。
作者: /u/AffectionateLife5693 | 发布于: 2026-03-27 22:46
4. [P] Deezer揭示CNN音频检测在压缩音频上失效,现推出双引擎方案可应对MP3压缩
作者发现基于梅尔频谱的CNN模型难以检测压缩后的AI生成音乐,转而采用结合音源分离的混合方法,通过分析原始与重建音频的差异来提升检测准确率。
作者: /u/Leather_Lobster_2558 | 发布于: 2026-03-27 11:21
5. [R] 我该选择ACL SRW、ICML研讨会还是AACL?
作者在学术会议审稿中获中等评分,因担心研究过时且不愿反复修改,现纠结于等待正式会议AACL或选择近期但级别较低的研讨会。
作者: /u/Soggy_Ad6925 | 发布于: 2026-03-27 05:51
6. [R] 对照实验:在自动超参数搜索中为LLM智能体提供计算机科学论文访问权限,可使结果提升3.2%
实验表明,为LLM智能体提供计算机科学论文访问权限,可使其在自动超参数搜索中发现新方法,最终将模型性能提升3.2%。
作者: /u/kalpitdixit | 发布于: 2026-03-27 23:05
7. 重训练、微调还是迁移学习?[D]
用户询问在电商点击流项目中,每日新增数据时,应从头训练模型还是基于旧模型微调,并提及了采样策略以保持数据时效性。
作者: /u/Bluem00n1o1 | 发布于: 2026-03-27 05:07
8. 实时学生注意力检测:ResNet与面部关键点,哪种方法更适合资源受限场景?
讨论检测学生课堂注意力,对比基于面部关键点(68点简化为24点)和深度学习(ResNet/CNN)两种技术方案。
作者: /u/Savings_Load2308 | 发布于: 2026-03-27 15:01
9. 【讨论】为无POS集成的多门店零售构建需求预测系统,求架构建议
基于手动数据构建轻量需求预测系统,初期用统计模型,后期引入机器学习,并探讨了数据量少时模型选择、异常值处理和生成可信置信区间三个核心问题。
作者: /u/Automation_storm | 发布于: 2026-03-27 13:19
10. [讨论] 寻求开放世界式学习问题的定义
用户使用度量学习方法处理开放世界分类,通过嵌入空间和相似度阈值聚类未见过的类别,效果良好。
作者: /u/ralfcat | 发布于: 2026-03-27 10:17
11. [项目] 从TikTok视频创建数据集
Tikkocampus工具可将TikTok创作者视频时间线转为带时间戳、可搜索的片段,用于RAG项目或创建数据集。
作者: /u/Ilyastrou | 发布于: 2026-03-27 20:50
12. [R] ACL ARR审稿台拒稿
作者因重复提交论文被拒稿,通过邮件沟通成功撤销了拒稿决定。
作者: /u/Lonely-Highlight-447 | 发布于: 2026-03-27 14:03