“参与过Kimi K2的亲自答接生,自己的在知乎上孩子怎么看都顺眼”。7月11日晚,多位国内大模型独角兽月之暗面正式发布并开源了其最新一代MoE架构基础模型Kimi K2,研发亿参总参数量达到1万亿(1T),工程故事这一消息迅速引发了AI领域的师万数广泛关注,Kimi内部则将K2研发群戏称为“接生群”。开源多位参与“接生”的幕后Kimi研发人员随后在知乎展开“亲自答”,从多个角度深入讲述了其背后研发历程。亲自答
作为月之暗面 Infra侧推理方面研发人员,在知乎上知乎答主刘少伟谈及了K2模型结构的多位设计宗旨。他称K2模型是研发亿参在DeepSeek V3结构的框架之下,如何选择合适的工程故事参数,使得模型在训练、师万数推理成本与v3相当的开源前提下,获得明显更低的loss。“综合以上四个相比v3的改动,我们能够得到一个在相同EP数量下,虽然总参数增大到1.5倍,但除去通信部分,理论的prefill和decode耗时都更小的推理方案”。
月之暗面研究员、知乎答主Flood Sung则表示,Kimi K2最值得关注的信息,除了MuonClip带来的漂亮得起飞的loss曲线,还有就是Agent能力。他透露,为了实现更好的通用Agent能力,构建了一个大规模的agent合成数据pipeline:简单的说是一个完全自动化的agent数据生产工厂,通过全流程的模拟来过滤出好的Agent轨迹数据。Flood Sung称,“这个生产线非常符合老子的思想:‘一生二,二生三,三生万物’。”
另一位月之暗面研发人员、知乎答主Justin Wong谈到Kimi K2为何会选择开源时称,开源意味着能够借助社区力量完善技术生态,“在我们开源不到24小时就看到有社区做出K2的MLX实现、4bit量化等等,这些凭我们这点人力真的做不出来”。月之暗面研究员、知乎答主Dylan则表示,K2实际上就是一个刚出生的baby,虽然略显“灵性”,但和很多已久的frontier model(前沿模型)相比,还是有很多、很明显的缺点,“作为post-train(后训练)相关的同学,还是略感惭愧,希望后面的版本迭代里面能够持续释放K2 base model的潜力”。
开发者在AI成果发布的同时,越来越多选择来知乎发布背后的详尽思考。6月,月之暗面也曾发布一款Agent产品,Kimi-researcher两位主要研发人员也在知乎亲自答,解读产品背后的技术思考和亮点。更早之前,月之暗面开源MoBA框架研发人员鹿恩哲、苏剑林分别在知乎上讲述了研发思路,引发了业界对“稀疏注意力”框架的讨论。
2025年以来,伴随AI技术新浪潮的蔓延,知乎引领了一系列全网重要的AI趋势发布。3月,DeepSeek在知乎开设官方账号,并独家发布《DeepSeek-V3/R1 推理系统概览》技术文章;智元机器人联合创始人彭志辉(稚晖君)在知乎以视频形式发布了人形机器人灵犀X2;10年“老答主”王兴兴在知乎与网友大量互动,分享宇树机器人最新研发动态……
在顶流创业者们的一次次分享中,知乎见证了中国创新科技势力的一次次突破,也凸显了知乎作为AI领域核心交流阵地的独特价值——以其浓厚的技术讨论氛围,搭建起开发者与行业、创新成果与大众认知之间的桥梁,让前沿技术不再是晦涩难懂的孤岛,持续推动着AI行业在“思维链开源”交流下向前发展跃迁。
雷峰网雷峰网(公众号:雷峰网)雷峰网
评论列表
学员报到合影洞头网讯(记者 洪建栋 见习记者 邵康妍)为贯彻落实省委书记车俊考察洞头时的重要指示精神,进一步继承和弘扬“爱岛尚武、励志奉献”的海霞精神,7月16日上午,为期两天的全区科级女干部专题培训
2025-08-04 18:27寒风又起,严冬将至,在气温骤降、室内外温差逐渐拉大的冬天,全家人的沐浴健康尤其不容忽视。为此,银田推出了全新产品——16E91零感恒温热水器,通过塑造健康的沐浴方式,打造出满足
2025-08-04 18:09枞阳在线消息 “羹脍路非常适合锻炼健身,但是早晨路灯五点半左右就关闭了,夏秋季天亮的早还行,但冬季早晨要到六点半天才亮,晨练看不见路,建议冬季早晨路灯关闭迟点。”近日,家住枞阳县老庄居委会一居民通过小
2025-08-04 18:05铭凡Minisforu宣布推出M1 Pro迷你主机,该款迷你主机搭载了英特尔酷睿Ultra处理器,采用了更小的体积设计,无论是专业创作还是休闲娱乐都能够满足需求。铭凡Minisforu宣布推出M1 P
2025-08-04 17:32