Qorle 常务委员 管理成员 中央委员 政治局委员 优秀干部 注册 2024/07/26 消息 626 2024/11/30 #1 https://kpu.maisa.ai 80 推理题个人暂测表现弱于O1 强于其余(其余模型几乎是全错) 个人常测的区分O1与非推理模型的问题,答对了许多,包括过程,和O1 P 完全一模一样 我以为O1是套壳,但是经过提醒和进一步检测, 凉被子翻车了, 并且,我又测试了一个问题,也错了,可以确定不是O1或者同等水平 可能是选择性调用O1 P?
https://kpu.maisa.ai 80 推理题个人暂测表现弱于O1 强于其余(其余模型几乎是全错) 个人常测的区分O1与非推理模型的问题,答对了许多,包括过程,和O1 P 完全一模一样 我以为O1是套壳,但是经过提醒和进一步检测, 凉被子翻车了, 并且,我又测试了一个问题,也错了,可以确定不是O1或者同等水平 可能是选择性调用O1 P?