ARC-AGI (共1篇)

OpenAI o1模型基准测试创纪录：ARC-AGI达87.5%，AI推理能力迎来跃升

OpenAI近日发布o1-preview和o1-mini模型，在数学、编码及科学推理基准上大幅超越GPT-4o，ARC-AGI得分高达87.5%。其‘思考链’机制模拟人类推理过程，引发X平台热议，互动超10万次，用户测试分享刷屏，标志AI迈入‘推理时代’。