Reddit ML - 2026-03-30
1. [项目] 开源工具:一键定位任意街景照片拍摄位置
作者为开源街景定位工具Netryx Astra V2推出了免费网页演示版,覆盖纽约10公里范围,方便非技术用户试用,并欢迎反馈。
作者: /u/Open_Budget6556 | 发布于: 2026-03-29 13:12
2. 我创建了一个能发现大语言模型违反物理定律的基准测试
作者创建了一个用符号数学评估LLM物理能力的对抗性基准测试,涵盖28个物理定律并设置陷阱。结果显示各模型表现差异大,伯努利方程最难。
作者: /u/pacman-s-install | 发布于: 2026-03-29 03:25
3. 首个BDH架构的赫布式快速权重回写开源实现
作者开源实现了BDH论文中的赫布可塑性机制,让模型在推理时更新自身权重。选择性权重回写能有效保留信号,在合成任务上效果显著,但尚未在自然语言上验证。
作者: /u/fleebrun83 | 发布于: 2026-03-29 06:41
4. [项目] 在Python中实现了TurboQuant
TurboQuant是一种无需训练数据的在线向量量化方法。通过随机旋转将向量高斯化,再对每维进行最优一维量化,适用于KV缓存和向量数据库的实时压缩。
作者: /u/chhed_wala_kaccha | 发布于: 2026-03-29 19:03
5. 为什么机器学习开源资料总感觉不完整?这远远不够……
用户批评机器学习开源材料常缺乏完整代码、关键细节和深度解释,导致难以复现和理解。他质疑这源于竞争保护、时间不足或社区文化,并寻求资深人士的看法。
作者: /u/Kalli_animation | 发布于: 2026-03-29 14:38
6. [D] 是否有前人研究利用像素偏移提升变分自编码器精度?
用户训练VAE时遇到重建保真度问题,尝试通过像素偏移方法提升精度,并寻求相关前人研究。
作者: /u/lostinspaz | 发布于: 2026-03-29 21:53
7. [D] 数据筛选与定向替换:一种用于预训练对齐与可控性的方法
用户探讨在训练前剔除或替换数据集中的不良内容(如暴力、欺骗)对模型能力的影响,并分享了自己的初步实验方法。
作者: /u/Real_Beach6493 | 发布于: 2026-03-29 18:53
8. [项目] 我用行为克隆+LSTM训练了一个AI玩《生化危机4重制版》
使用行为克隆和LSTM训练AI玩《生化危机4重制版》。AI能较好应对单个敌人,但在面对多个敌人时难以做出战斗或逃跑的决策。
作者: /u/AgeOfEmpires4AOE4 | 发布于: 2026-03-29 14:23
9. [项目] 我开发了一个自主运行的机器学习代理,可对表格数据无限期进行实验——灵感来自Karpathy的AutoResearch
作者构建了一个基于Claude Code的自主机器学习研究系统,用于表格数据分类任务。该系统通过分析数据、提出假设、运行实验的循环来自动优化模型,并采用时间窗口评估防止数据泄露。
作者: /u/Pancake502 | 发布于: 2026-03-29 18:50
10. [D] 独立研究者的投稿历程:奇特而有趣的体验,给同行的一些建议。
独立研究者分享向arXiv提交预印本的完整流程,强调基于数据、反复验证、利用AI辅助及获得同行反馈后再投稿的重要性。
作者: /u/JordanLeDoux | 发布于: 2026-03-29 23:29
11. [R] 我用长度20的XOR序列训练了一个3k参数模型,它能完美泛化到长度1,000,000。以下是其架构重要性的分析。
提出几何流网络作为注意力机制的替代,通过几何流形处理序列,实现恒定内存和结构不变性学习。小模型在长序列任务上表现优异,代码已开源。
作者: /u/janxhg27 | 发布于: 2026-03-29 22:33
12. [P] 我用帖子测试了Meta的脑反应模型,它对马斯克相关帖子的预测几乎完全准确。
作者测试了Meta的脑响应预测模型,发现它能仅根据文本内容准确预测帖子的病毒式传播潜力,无需任何互动数据,体现了该技术在内容优化上的强大潜力与潜在风险。
作者: /u/Adam_Jesion | 发布于: 2026-03-29 15:47