Reddit ML - 2026-04-02
1. [P] 我用基于距离的RBF注意力机制替代了点积注意力(这样你就不用自己动手了…)
作者尝试用RBF距离度量替换自注意力中的点积,以解决向量大小对注意力分数的干扰。实验发现需重写核心算法、调整注意力机制和位置编码,最终在小模型上取得略快收敛。
作者: /u/4rtemi5 | 发布于: 2026-04-01 06:14
2. 机器学习工程师如何看待“氛围编程”?
作者询问机器学习工程师对在工作中使用AI工具的看法,以了解其实际体验和观点。
作者: /u/EfficientSpend2543 | 发布于: 2026-04-01 10:36
3. [D] 为何我在关键安全场景的植物/真菌识别中弃用YOLO:封闭集分类的隐性失效模式
作者为野外可食用植物识别设备开发了安全关键型AI系统,因YOLO模型无法处理未知类别而改用分层检测方案,确保设备在有限算力下可靠运行。
作者: /u/Adebrantes | 发布于: 2026-04-01 11:54
4. [D] 我们完全用Python重写了Claude Code——开源版,支持本地模型运行
发布了Claw Code Agent,这是用纯Python重新实现的Claude Code智能体架构,便于开发者理解和扩展,支持本地开源模型运行。
作者: /u/Practical_Pomelo_636 | 发布于: 2026-04-01 22:58
5. [P] EVōC:面向嵌入向量的聚类方法
EVōC是一个专门为高维嵌入向量聚类设计的库,性能优于UMAP+HDBSCAN,速度媲美MiniBatchKMeans。
作者: /u/lmcinnes | 发布于: 2026-04-01 12:57
6. [讨论] 简单问题讨论帖
这是一个机器学习社区的集中提问帖,鼓励用户在此提问而非单独发帖,并会持续开放至下一帖发布。
作者: /u/AutoModerator | 发布于: 2026-04-01 15:01
7. [D] 看到作者身份会影响你的评分吗?
首次审稿者发现,自己评审的两篇论文恰好是arXiv上唯一可查的,担心作者身份信息影响了评审公正性。
作者: /u/d_edge_sword | 发布于: 2026-04-01 11:50
8. [P] Clip to Grok 更新:权重范数裁剪现达39–249倍 | 6项任务(模运算、混合运算、S5排列) | 每项任务单独测量最大范数
权重范数裁剪技术将模型在六项代数任务上的收敛速度提升了39至249倍,其中非阿贝尔S5置换任务加速效果最显著。
作者: /u/niftylius | 发布于: 2026-04-01 21:33
9. 【研究】关于优化“点赞/点踩”形式用户反馈的文献有哪些?
用户询问如何利用仅有“点赞/点踩”标签的数据集来评估和微调模型,并寻求相关文献。
作者: /u/pastor_pilao | 发布于: 2026-04-01 17:44
10. [P] 联邦对抗学习
一名计算机科学/机器学习工程专业的大四学生,对“联邦对抗学习”课题感到困惑,寻求具体实施思路。
作者: /u/Substantial-Major-72 | 发布于: 2026-04-01 15:18
11. [项目] 我为研究人员/学生开发了一个简单的单节点GPU感知任务调度器
一位研究工程师为个人实验管理开发了轻量级GPU调度工具,支持Web界面提交、批量排队和实时监控。
作者: /u/Zerokidcraft | 发布于: 2026-04-01 11:00
12. [项目] 为本地/开源模型提供5次免费微调测试,期待您的反馈
提供5个免费小模型微调试点项目,包括数据处理、训练和评估,适合特定任务优化。
作者: /u/CircuitBreaker88 | 发布于: 2026-04-01 23:13
13. [R] SPORE聚类算法
介绍SPORE聚类算法,一种适用于任意几何和高维数据的通用密度方差方法,包含扩展和边界点重分配两阶段,能处理非凸数据并抵抗合并或分裂问题。
作者: /u/Significant-Agent854 | 发布于: 2026-04-01 13:11