Kimi视觉思考模型k1发布:数理化超越OpenAI o1、GPT
12月16日消息,视觉思考今日,模型月之暗面国产大模型Kimi发布视觉思考模型k1,布数k1基于强化学习技术打造,理化原生支持端到端图像理解和思维链技术,视觉思考并将能力扩展到数学之外的模型更多基础科学领域。
k1已陆续上线最新版Kimi智能助手的布数Android和iPhone APP以及网页版kimi.com。
在最新版手机APP或网页版Kimi+页面找到Kimi视觉思考版,理化即可拍照或传图体验。视觉思考
据了解,模型在数学、布数物理、理化化学等基础科学学科的视觉思考基准能力测试中,初代k1模型的模型表现超过了全球标杆模型OpenAI o1、GPT-4o以及Claude 3.5 Sonnet。布数
官方表示,K1模型真正意义上实现了端到端的图像理解和思考能力,模型可以直接处理用户输入的图像信息并进行思考得出答案,不需要借助外部的OCR或额外视觉模型进行信息处理。
从模型训练的角度看,k1的训练分为两个阶段,先通过预训练得到基础模型,再在基础模型上进行强化学习后训练。
k1的基础模型重点优化了字符识别能力,在OCRBench上得到903分的当前最好(state-of-the-art)结果,在MathVista-testmini、MMMU-val 和DocVQA基准测试集上分数分别为69.1、66.7和96.9,处于全球第一梯队水平。
据介绍,k1的强化学习后训练在数据质量和学习效率方面做了进一步优化,在强化学习的规模化(scaling)上取得了新的突破,这是k1视觉推理模型在基准测试中取得行业领先成绩的最关键原因。
月之暗面坦言,在内部测试中也发现了一些k1视觉思考模型存在的局限性,例如在分布外(out-of-distribution)的泛化、在更复杂问题上的成功率、在更多噪声场景的准确率、多轮问答效果等方面,有很大提升空间。
在一些场景和泛化能力上,k1模型与OpenAI的o1系列模型相比仍有差距。
相关文章
- 天猫【泸溪河旗舰店】泸溪河当家花旦桃酥原味 240g*2 + 核桃味 240*1 售价 42.9 元,下单领取 16 元优惠券,到手价为 26.9 元。经典工艺与传统配方调配,拌料 / 成型 / 烘焙2024-12-27
19场20球16助攻+常规赛冠军!官方:梅西当选MLS赛季最有价值球员
12月06日讯 官方消息,迈阿密国际球员梅西当选2024美职联赛季最有价值球员MVP)。据美职联官网统计,本赛季梅西在美职联出战19场比赛,贡献20球16助,帮助球队夺得队史首个常规赛冠军。在季后赛中2024-12-27- 08月31日讯 意甲第三轮,国米对阵亚特兰大。开场3分钟,图拉姆射门造乌龙,国米1-0领先亚特兰大。2024-12-27
点球命中率排行:哈弗茨92.9%第一,C罗84.5%第10梅西78.7%第14
12月06日讯 德转对主罚点球超过20次的球员进行统计,点球命中率最高的是哈弗茨,主罚28次命中率接近93%,最低的是劳塔罗,主罚28次命中率刚刚超过64%。点球命中率排行球员,主罚次数,命中率)1-2024-12-27- [流言板]明日主场对阵马刺,恩比德乔治均可出战,戈登缺席由篮球资讯发表在篮球资讯 50212月23日讯 明日,76人将在主场对阵马刺。据球队公布的伤病报告,恩比德和乔治均可以出战。老将埃里克-戈登因伤2024-12-27
- 12月8日晚,支付宝、蚂蚁集团迎来20岁生日之际,已经很久没有公开露面的马云,突然出现在蚂蚁园区,与来自全球的蚂蚁员工一起加油鼓劲。有趣的时刻,就在当天马云现身之前,蚂蚁集团董事长兼CEO井贤栋通过全2024-12-27
最新评论