Reddit ML - 2026-03-26
1. 勒昆的10亿美元种子轮融资,是否意味着自回归大模型在形式推理上已遇瓶颈?
讨论Yann LeCun新AI公司获10亿美元种子轮融资,其技术路线试图用基于能量的模型生成可数学验证的代码,以替代Transformer。作者质疑该方法在训练和推理上的可行性,并思考这是否代表远离LLM的范式转变。
作者: /u/Fun-Information78 | 发布于: 2026-03-25 18:32
2. [D] 其他博士生是否也感到准备不足,且毕业门槛过低?
机器学习博士生反思理论准备不足,认为这是该领域普遍现象,并质疑为何多数人无法理解常用定理的证明。
作者: /u/Scrungo__Beepis | 发布于: 2026-03-25 13:13
3. [D] ICML 2026:策略A与策略B对评分影响的讨论
作者发现ICML 2026会议中,采用严格禁止LLM审稿的政策A的论文,其平均得分似乎低于允许有限LLM辅助的政策B。初步投票结果也显示政策B的平均分更高。作者呼吁社区分享相关数据以进一步验证。
作者: /u/Available_Net_6429 | 发布于: 2026-03-25 11:36
4. [R] 三元神经网络:通往高效AI之路——(+1, 0, -1)权重量化正成为研究热点?
用户探讨三元权重量化在神经网络中的应用,并询问关于原生三元训练结合进化优化方法的研究现状与创新性。
作者: /u/srodland01 | 发布于: 2026-03-25 09:43
5. [R] 对抗性机器学习
数学背景的研究者寻求对抗性机器学习领域的开放挑战、数学工具应用及研究资源建议。
作者: /u/RelationshipOk5930 | 发布于: 2026-03-25 09:52
6. [N] LiteLLM供应链攻击威胁AI管道及API密钥泄露风险
LiteLLM遭供应链攻击,恶意版本通过窃取的CI凭证窃取API密钥和云凭证等敏感信息,凸显了AI工作流中依赖信任的风险。
作者: /u/raptorhunter22 | 发布于: 2026-03-25 21:51
7. [项目] 搭建交互式网页,用物理信息神经网络求解二维热方程
作者开发了一个基于物理信息神经网络(PINN)的2D热仿真交互式网页应用,用于模拟电路板芯片温度分布,并邀请用户测试反馈。
作者: /u/wyzard135 | 发布于: 2026-03-25 12:02
8. [求助] 无训练数据时,如何从嘈杂视频计数中在线预测人群密度?
用户使用P2PNet获取人群视频帧计数,需实时预测未来5-10帧密度并估算达到临界阈值的时间。当前方法误差较大,寻求在线CPU运行的改进方案,如卡尔曼滤波或二次指数平滑。
作者: /u/WitnessWonderful8270 | 发布于: 2026-03-25 05:52
9. 如何申请NeurIPS ‘26的审稿人职位?
用户询问如何申请成为NeurIPS审稿人,因其认识的博士生无相关发表记录却获邀。
作者: /u/confirm-jannati | 发布于: 2026-03-25 22:12
10. [P] 做了个数据集却不知如何利用
用户收集了空难最终报告数据集,但不确定其具体用途,考虑构建RAG系统并寻求应用建议。
作者: /u/AbdullahKhanSherwani | 发布于: 2026-03-25 12:23
11. [R] 人类与人形生物的区别是什么?
人类行为可预测,而人形机器人行为难以预测,这给长视频理解和视觉语言模型生成准确问答带来了挑战。
作者: /u/Alternative_Art2984 | 发布于: 2026-03-25 07:35