LongCat 上线 AI 生图!精准高效,AI 创作不设限
2025-12-09
美团LongCat-Image模型通过MM-DiT+Single-DiT混合主干架构与VLM条件编码器,实现了文生图与图像编辑能力的深度协同。其核心创新在于:1)一体化工作流支持15类细分编辑任务,多轮编辑保持风格一致;2)专项优化中文文字生成,覆盖全量规范汉字与生僻字,智能排版;3)轻量化设计实现快速生成摄影棚级质感图像。该方案在公开评测中达到第一梯队,以高效推理和精准的中文场景适配,降低了专业级AI创作门槛。
美团发布 LongCat-Image 图像生成模型,编辑能力登顶开源 SOTA
2025-12-09
美团LongCat-Image模型以6B紧凑参数,通过文生图与图像编辑同源架构及渐进式学习策略,在开源模型中实现了性能突破。其核心创新在于:采用多任务联合学习与精细化数据工程,在图像编辑可控性上达到开源SOTA;通过课程学习与字符级编码,显著提升中文文字生成的覆盖度与精准度。该模型为开发者提供了高性能、可定制、全开放的商用级AI图像生成解决方案。