reddit_machinelearning_2026-03-28

Reddit ML - 2026-03-28

作者认为会议论文的附录越来越长，甚至成为核心部分，这违背了附录作为补充材料的初衷，并质疑页数限制的意义。

_{作者: /u/kostaspap90 | 发布于: 2026-03-27 09:09}

审计发现LoCoMo基准测试存在6.4%答案错误，且其AI评分器会接受63%的错误答案。另一基准LongMemEval-S因测试数据能完全放入模型上下文窗口，实为上下文测试而非记忆测试。

_{作者: /u/PenfieldLabs | 发布于: 2026-03-27 13:38}

作者指出，当前学术评审中，审稿人倾向于要求大量额外实验以证明其尽责，即使论文已达标。这些补充实验常非必要且耗时，作者呼吁评审应聚焦于验证核心主张。

_{作者: /u/AffectionateLife5693 | 发布于: 2026-03-27 22:46}

作者发现基于梅尔频谱的CNN模型难以检测压缩后的AI生成音乐，转而采用结合音源分离的混合方法，通过分析原始与重建音频的差异来提升检测准确率。

_{作者: /u/Leather_Lobster_2558 | 发布于: 2026-03-27 11:21}

作者在学术会议审稿中获中等评分，因担心研究过时且不愿反复修改，现纠结于等待正式会议AACL或选择近期但级别较低的研讨会。

_{作者: /u/Soggy_Ad6925 | 发布于: 2026-03-27 05:51}

实验表明，为LLM智能体提供计算机科学论文访问权限，可使其在自动超参数搜索中发现新方法，最终将模型性能提升3.2%。

_{作者: /u/kalpitdixit | 发布于: 2026-03-27 23:05}

用户询问在电商点击流项目中，每日新增数据时，应从头训练模型还是基于旧模型微调，并提及了采样策略以保持数据时效性。

_{作者: /u/Bluem00n1o1 | 发布于: 2026-03-27 05:07}

讨论检测学生课堂注意力，对比基于面部关键点（68点简化为24点）和深度学习（ResNet/CNN）两种技术方案。

_{作者: /u/Savings_Load2308 | 发布于: 2026-03-27 15:01}

基于手动数据构建轻量需求预测系统，初期用统计模型，后期引入机器学习，并探讨了数据量少时模型选择、异常值处理和生成可信置信区间三个核心问题。

_{作者: /u/Automation_storm | 发布于: 2026-03-27 13:19}

用户使用度量学习方法处理开放世界分类，通过嵌入空间和相似度阈值聚类未见过的类别，效果良好。

_{作者: /u/ralfcat | 发布于: 2026-03-27 10:17}

Tikkocampus工具可将TikTok创作者视频时间线转为带时间戳、可搜索的片段，用于RAG项目或创建数据集。

_{作者: /u/Ilyastrou | 发布于: 2026-03-27 20:50}

作者因重复提交论文被拒稿，通过邮件沟通成功撤销了拒稿决定。

_{作者: /u/Lonely-Highlight-447 | 发布于: 2026-03-27 14:03}