实测一下Kimi版“o1”推理模型k0-math

2025-02-19

KIMI推出的数学推理模型k0-math，末于上线了，可以间接去到官网体验

正在 Kimi 网页版中，选择侧边栏的“眼镜”图标，便可运用基于 k0-math 模型的 Kimi 数学版，官方称后续会推脱手机版。

官方默示，数学公式引荐运用 LaTeX 格局，可以截图或拍照给 Kimi 常规版，让 Kimi 把图片转为 LaTeX 格局，而后复制题目问题给 Kimi 数学版便可。

正在两个难度更大的比赛级其它数学题库 OMNI-MATH 和 AIME 基准测试中，k0-math 初代模型的暗示划分抵达了 o1-mini 最高效果的 90% 和 83%。

这么它的才华到底怎么呢？那里给了几多个问题测试一下它~

真测模型才华

测试一下难倒宽广中国网友的调休怎样调的问题。之前对于调休就上过热搜

由于之前国庆节和中秋是连着来，所以网友策画着怎样调休才算最劣解，那里的“上6休3上3休2上5休1上2休7再上5休1”其真便是指从中秋初步休假的缩写。

说人话便是，从中秋初步，先上6天班，再休假3天，再上3天班，再休假2天，而后上5天班，接着休1天，再上2天班，最后国庆休7天，再上5天班，最后只休1天。说真话，就算我原人打字也感觉那个假期太复纯了，几多乎像是念咒语一样

这时候中国网友就为了那个调休到底最后休了几多多天而计较起来

既然那么难，刚好可以丢给大模型停行问答，看看具备了数学推理才华的k0-math怎样计较那道数学难题。

一初步，KIMI舛错的计较出了须要算整个9月的假期。但是咱们题目问题是从9月9日初步的，所以其真只要10个周终是咱们副原休息的。

从头纠正后，讲述它只要10个周终，它末于答对了那道题目问题，答案是只多休了4天假期。

再来给他测试一下2024年的高考题看看成效怎样样：

编号为1，2，3，4，5，6的六个小球，不放回的抽三次，m默示前两次号码的均匀值，n默示前三次号码的均匀值，则m和n的差值不赶过0.5的概率是几多多

一初步的解答历程根柢没有什么问题：它先界说了a，b，c三个做为前三次抽到的号码，而后可以获得 𝑚=(𝑎+𝑏)/2 和 𝑛=（𝑎+𝑏+𝑐）/3 ，而后由于题目问题要求m和n两个数的差值不赶过0.5，因而可以获得｜（𝑎+𝑏）/2−(𝑎+𝑏+𝑐)/3｜<=0.5 ，接下来化简就可以获得｜𝑎+𝑏−2𝑐｜<=3