网站首页 > 博客文章 正文
IT之家 12 月 14 日消息,“360 智脑”官方公众号昨日(12 月 13 日)发布博文,宣布推出 360 自研 AI 大模型 360gpt2-o1,推理能力显著提升,在数学和逻辑推理任务上表现出色。
该模型通过合成数据优化、模型后训练和“慢思考”范式实现了技术突破,并在多项权威评测中取得了优异成绩。
在多项基础数学评测(如 MATH、高考数学)以及权威数学竞赛(包括 AIME24、AMC23)中,360gpt2-o1 均取得了显著的成绩,不仅超越了前代模型 360gpt2-pro,也优于 GPT-4o 模型。
在数学竞赛评测中,360gpt2-o1 超过了阿里巴巴最新开源的 o1 系列模型 QWQ-32B-preview。IT之家附上该模型整体架构如下:
优化合成数据
该模型通过指令合成、质量 / 多样性筛选等方法,解决了高质量数学与逻辑推理数据稀缺的问题,有效扩充了训练数据集。
模型后训练
该模型采用两阶段训练策略,先用小模型生成多样化的推理路径,再用大模型进行 RFT 训练和强化学习训练,提升模型推理能力和反思纠错能力。
“慢思考”范式
利用蒙特卡洛树搜索探索多样化解决方案,并引入 LLM 进行错误验证和纠错,模拟人类逐步推理和反思的过程,最终形成包含反思、验证、纠错和回溯的长思维链。
猜你喜欢
- 2025-01-13 73页,开源后训练全流程!AI2发布Tülu 3系列模型,拉平闭源差距
- 2025-01-13 拒绝付费!内置本地离线专属 ChatGPT,免费开源 AI 生产力工具箱
- 2025-01-13 关于 GPT-4 Vision 的开源替代品需要了解什么
- 2025-01-13 Meta开源大语言模型Llama 2,结盟微软、高通对抗GPT-4?
- 2025-01-13 TableGPT2开源,复杂表格理解不存在了!
- 2025-01-13 免费可商用开源GPT模型问世,50G权重直接下载,性能不输GPT-3
- 2025-01-13 Meta开源Llama 2免费大语言模型,媲美ChatGPT,可在线试玩
- 2025-01-13 爆火全网的ChatGPT,这些问题您可能想知道
- 2025-01-13 开源版SearchGPT来了,两张3090就可复现,超越Perplexity付费版
- 2025-01-13 Qwen2.5登全球开源王座!72B击败LIama3 405B,轻松胜GPT-4o-mini
你 发表评论:
欢迎- 366℃用AI Agent治理微服务的复杂性问题|QCon
- 358℃初次使用IntelliJ IDEA新建Maven项目
- 354℃手把手教程「JavaWeb」优雅的SpringMvc+Mybatis整合之路
- 351℃Maven技术方案最全手册(mavena)
- 348℃安利Touch Bar 专属应用,让闲置的Touch Bar活跃起来!
- 346℃InfoQ 2024 年趋势报告:架构篇(infoq+2024+年趋势报告:架构篇分析)
- 344℃IntelliJ IDEA 2018版本和2022版本创建 Maven 项目对比
- 342℃从头搭建 IntelliJ IDEA 环境(intellij idea建包)
- 最近发表
- 标签列表
-
- powershellfor (55)
- messagesource (56)
- aspose.pdf破解版 (56)
- promise.race (63)
- 2019cad序列号和密钥激活码 (62)
- window.performance (66)
- qt删除文件夹 (72)
- mysqlcaching_sha2_password (64)
- ubuntu升级gcc (58)
- nacos启动失败 (64)
- ssh-add (70)
- jwt漏洞 (58)
- macos14下载 (58)
- yarnnode (62)
- abstractqueuedsynchronizer (64)
- source~/.bashrc没有那个文件或目录 (65)
- springboot整合activiti工作流 (70)
- jmeter插件下载 (61)
- 抓包分析 (60)
- idea创建mavenweb项目 (65)
- vue回到顶部 (57)
- qcombobox样式表 (68)
- vue数组concat (56)
- tomcatundertow (58)
- pastemac (61)
本文暂时没有评论,来添加一个吧(●'◡'●)