搜索
当前所在位置:首页 >> 综合

月之暗面发布首款数学模型 k0

发布时间:2025-07-12 21:03:45 作者:rbhzq 点击:217 【 字体:

今天,暗面在京东科技大厦,发布月之暗面创始人杨植麟宣布 Kimi 数学模型 k0-math 正式发布,首款数学其数学能力对标OpenAI o1系列,模型还公布了截止2024年10月 Kimi  月活超过 3600万。暗面

杨植麟称未来会更关注基于强化学习的发布深圳学院内幕评价方法去scale,不仅仅是首款数学简单地预测下一个token是什么,因为这是模型基于静态信息集,使得大模型不能完成更难的暗面任务。在这个过程中,发布很关键的首款数学是让AI具备思考的能力。

用Next—Token prediction是模型做不到的,而用强化学习的暗面方法一定程度上可以学习到这种思考的方式。例如解一道数学题,发布想要知道它的首款数学西安医科大学偷拍地址解题思路是怎样的,最后的结果是怎么一步步推导出来的,这就是一个深度思考的过程。

伽利略曾说,数学是宇宙的语言,所以数学场景是一个很广泛的应用场景,是培养 AI 具备思考能力的最佳场景。OpenAI的 o1 模型最初也是从数学场景出发,好处是不用跟外界进行交互,可以自成一体。

k0—math正是从数学场景出发,再推理泛化到更多的任务上。

例如,问它一个很难的竞赛题,k0—math 通过大量的尝试,可能尝试了八九中不同的做法,最后发现还没能得到最终的答案,那么它可以把前面几种不同的解法综合一下,就能得到一个正确的答案。

月之暗面发布首款数学模型 k0-math,对标o1

根据上图,在多项基准能力测试中,k0-math 的数学能力可对标全球领先的 OpenAI o1 系列可公开使用的两个模型:o1-mini和o1-preview。在中考、高考、考研以及包含入门竞赛题的MATH等 4 个数学基准测试中,k0-math 初代模型成绩超过o1-mini和o1-preview模型。在两个难度更大的竞赛级别的数学题库 OMNI-MATH 和 AIME 基准测试中,k0-math 初代模型的表现分别达到了 o1-mini 最高成绩的 90% 和 83%。

未来的一到两周时间内,k0-math 强化模型将会放到 Kimi 探索版中,包含了意图增强、信源分析、链式思考三个特点。

月之暗面发布首款数学模型 k0-math,对标o1

其中,模型在深度思考的过程中,生成的学习信息是否都有用以及是否正确,这是强化学习中的一个核心问题,以前做Next—Token  prediction,处理的是静态信息,可以做静态过滤、打分筛选,而在强化学习中则对奖励模型的效果提出挑战,核心是是怎么更好的训练奖励模型,设置奖励的机制,以此来让模型尽可能地减少学习错误的信息。

k0-math在思考的过程中会出现「过度思考」,例如问它1+1等于多少,正常人是不需要思考的,而k0-math 就会给出一整套它的思考推理过程,最后才得出1+1等于2。

对于这个问题,杨植麟称是因为奖励上没有对它的长度做任何的限制,让它自由地思考,也可以通过改变奖励模型的结构,一定程度能抑制过度思考。

同时,杨植麟称,该包含了k0-math 强化模型的 Kimi 探索版大概率会让客户自己选择使用,早期通过这种方式可以更好地分配、满足客户的预期,这里面包含了一个工艺问题,一是能够动态地分配最优的算力,如果模型足够聪明就应该知道什么样的问题不需要想很久,就跟人一样1+1等于几不用想;第二个点是成本不断下降的过程。

未来,k0-math 还将从数学问题上的推理泛化到更多任务上,例如物理学、化学、生物医学等等。

去年今天,是Kimi Chat 面向全社会开放支持的日子,今年10月推出AI搜索功能,再到今天推出数学模型 k0-math,三个动作月之暗面整整走了一年。

可以看到,在一众大模型公司中,月之暗面的产物策略更克制。

杨植麟称,是他们主动做了业务的减法,聚焦去做离 AGI 上限最高的事情,然后做好;始终保持卡和人的比例最高。去年整个大模型行业经历了大扩张,而到目前为止,月之暗面人数是所有大模型公司中最少的,不超过200人。

「我们不希望把团队扩那么大,扩太大对创新会有致命性的伤害。如果你想把团队保持在一定的规模,那最好的方式是在业务上做一些减法。」杨植麟称,一开始月之暗面也尝试过几个产物一起做,这在一定时期内有可能有效,到后来发现还是要聚焦,把一个产物做到极致是最关键的,如果几个业务一起做,把自己活生生变成大厂,创业公司的优势就丢掉了。

杨植麟认为Kimi目前最核心的任务是提升留存。

对于当下愈演愈烈、有关于Scaling Laws「撞墙」的争辩,杨植麟认为「预训练还有空间」,这个空间会在明年释放出来,明年领先的模型会把预训练做到极致。

他判断,接下来最关键的是强化学习带来的工艺范式上改变,但它依然还是scale。至于Scaling Laws是否到上限,核心在于原来用的是静态信息集,这属于简单粗暴的使用方式,现在用强化学习的方式——很多情况下有人参与标注信息的过程,比如人标注 100条信息,就能产生非常大的作用,剩下的让AI自己思考。AI 加上人的杠杆,上限是很高的。「雷峰网(公众号:雷峰网)」


雷峰网原创文章,未经授权禁止转载。详情见转载须知。

月之暗面发布首款数学模型 k0-math,对标o1

阅读全文
相关推荐

神舟十九号航天员乘组太空归来后首次公开亮相

神舟十九号航天员乘组太空归来后首次公开亮相
2025年7月9日下午,中国航天员科研训练中心在北京航天城举行神舟十九号乘组与记者见面会。这是航天员蔡旭哲、宋令东、王浩泽返回60余天后,首次面向媒体与公众正式公开亮相,并分享了183天太空驻留的经历 ...

受台风“丹娜丝”作用,福建江西部分旅客列车停运

受台风“丹娜丝”作用,福建江西部分旅客列车停运
受台风“丹娜丝”作用 ,预计今天8日)至10日,福建全省、江西南部有大到暴雨,福建局地有特大暴雨。为确保铁路运输保障,国铁南昌局于今天8日)18时,在合福、昌福、南龙、赣瑞龙等高铁,以及兴泉、建化、清 ...

万字实录:VLA 范式,具身智能的曙光与迷雾丨GAIR Live

万字实录:VLA 范式,具身智能的曙光与迷雾丨GAIR Live
整理丨赖文昕编辑丨陈彩娴VLA视觉-语言-动作模型)作为具身智能领域的关键新范式,能有效整合视觉信息、语言指令与行动决策,显著提升机器人对复杂环境的理解和适应能力,对推动机器人从单一任务执行向多样化场 ...

推特热帖:k1.5 很牛,因为借鉴了 UCLA 与 CMU 合作团队的这项技术

推特热帖:k1.5 很牛,因为借鉴了 UCLA 与 CMU 合作团队的这项技术
2025 年 1 月 20 日 Kimi k1.5 正式发布,伴随着技术报告的公布,有网友表示:“这应该是全球范围内,除 OpenAI 之外的公司首次实现 o1 正式版的多模态推理性能了吧!”一时间, ...

“丹娜丝”进一步减弱 中央气象台对其停止编号

“丹娜丝”进一步减弱 中央气象台对其停止编号
来源:财联社财联社7月10日电,今年第4号台风“丹娜丝”减弱后的热带低压已于9日晚在福建境内进一步减弱,目前已很难确定其环流中心,中央气象台于9日23时对其停止编号。 ...

李一桐、刘宇宁担任爱奇艺VIP内容推荐官 邀会员追剧赢好礼

李一桐、刘宇宁担任爱奇艺VIP内容推荐官 邀会员追剧赢好礼
来源标题:李一桐、刘宇宁担任爱奇艺VIP内容推荐官追《书卷一梦》,爱奇艺VIP会员花式赢福利。爱奇艺VIP内容推荐官李一桐、刘宇宁携手为VIP会员送上主角签名照、官方周边、电子语音卡牌、宋一梦/南珩实 ...

全国首个官方Cosplay大赛——上海市民文化节妆造大赛启动

全国首个官方Cosplay大赛——上海市民文化节妆造大赛启动
来源标题:全国首个官方Cosplay大赛——上海市民文化节妆造大赛启动在首个国际动漫月期间,全国首个官方Cosplay大赛——上海市民文化节妆造大赛在第二十届中国国际动漫游戏博 ...

香港首个商业AI展「AI+ Power 2025」盛大开幕,本地及海外行业精英齐聚共探AI发展

香港首个商业AI展「AI+ Power 2025」盛大开幕,本地及海外行业精英齐聚共探AI发展
香港,2025年6月5日)——由BUSINESS GOVirtualBGOV)主办的「AI+ Power 2025」今日在香港会议展览中心举行。作为香港首个聚焦商业AI应用的行业盛会,展会汇聚本地及海 ...

商务部:已部署开展打击战略矿产走私出口专项行动

商务部:已部署开展打击战略矿产走私出口专项行动
7月10日,商务部召开例行新闻发布会。有记者提问,有报道称,锑和镓等关键矿产正在通过转运方式运往美国。中国政府是否已采取任何措施打击关键矿产的转运和走私行为?商务部新闻发言人何咏前表示,锑和镓等战略矿 ...

上交大冷静文:模型发展需要和芯片、系统厂商协同

上交大冷静文:模型发展需要和芯片、系统厂商协同
作者丨朱可轩编辑丨陈彩娴近期,上海交通大学与 AI Infra 创企魔形智能联合研究团队在由 IEEE 计算机协会主办的 HPCA 2025International Symposium on Hig ...

乌称俄一化工厂遭袭 系俄军火供应关键环节

乌称俄一化工厂遭袭 系俄军火供应关键环节
当地时间7月7日,乌克兰国家保障与国防事务委员会新闻中心负责人安德烈·科瓦连科表示,俄罗斯莫斯科州克拉斯诺扎沃茨克化工厂遭到袭击。科瓦连科表示,该工厂专门生产炸药、火药、弹药部件及导弹武器装备,是俄军 ...

电视剧《守诚者》今日开播!陈小春李治廷任达华热血集结,以忠诚勇毅护万家灯火

电视剧《守诚者》今日开播!陈小春李治廷任达华热血集结,以忠诚勇毅护万家灯火
来源标题:电视剧《守诚者》今日开播!陈小春李治廷任达华热血集结,以忠诚勇毅护万家灯火热血冲锋警匪剧《守诚者》由紫荆文化集团有限公司、北京爱奇艺科技有限公司、北京春秋鸿文化传播股份有限公司出品,北京广播 ...
返回顶部