阿里巴巴推出 OpenAI 的 o1 推理模型

发布:2024-11-28 14:45 阅读:55 点赞:0

阿里巴巴的 Qwen 团队推出了一种新的推理 AI 模型 QwQ-32B-Preview,该模型有望与 OpenAI 的产品竞争。该模型具有 325 亿个参数,现在可以在宽松许可下下载,使其成为同类产品中为数不多的可以公开访问的模型之一。

QwQ-32B-Preview 模型旨在处理多达约 32,000 个单词的提示,与 OpenAI 的 o1-preview 和 o1-mini 模型相比,在各种基准测试中表现出卓越的性能。根据阿里巴巴的测试,QwQ-32B-Preview 在 AIME 和 MATH 测试中都优于 OpenAI 的模型。AIME 利用其他 AI 模型来评估性能,而 MATH 则专注于解决单词问题。

这个新模型展示了令人印象深刻的推理能力,使其能够解决逻辑难题和具有挑战性的数学问题。然而,它并非没有限制;阿里巴巴指出,该模型可能偶尔会意外切换语言,陷入循环,或者难以完成需要常识推理的任务。

QwQ-32B-Preview 的一个显着特点是它能够自我核查事实,这有助于减少其他 AI 模型中出现的一些常见错误。但是,此自检过程可能会导致响应时间更长。与 OpenAI 的 o1 模型类似,QwQ-32B-Preview 采用推理方法,涉及计划和执行一系列操作来得出答案。

QwQ-32B-Preview 可用于 AI 开发平台 Hugging Face,与最近发布的 DeepSeek 推理模型相似。由于阿里巴巴等中国公司面临监管审查,这两种模式都谨慎地处理敏感的政治话题。例如,当被问及台湾的地位时,QwQ-32B-Preview 确认它是中国的一部分——这一观点与中国政府的立场一致,但与国际共识背道而驰。此外,有关

天安门广场的调查结果是没有回应。

该模型在 Apache 2.0 许可下发布,允许商业应用;但是,只有 SELECT 组件已公开。这种有限的披露限制了复制 QwQ-32B-Preview 或完全理解其内部机制的能力。

对推理模型的日益关注是在对传统“缩放定律”持怀疑态度的情况下发生的,传统的“缩放定律”表明,增加数据和计算能力将不断提高模型性能。最近的报告表明,包括 OpenAI、Google 和 Anthropic 在内的主要 AI 实验室并没有看到他们曾经预期的显着改进。

作为回应,人们开始探索 AI 开发中的新方法和架构。其中一种方法是测试时计算,它在推理期间为模型提供额外的处理时间,以便更有效地完成任务。这种技术是 o1 和 QwQ-32B-Preview 模型的基础。

随着竞争的加剧,其他科技巨头也在大力投资推理能力。报告显示,谷歌已经显著扩大了其专注于推理模型的内部团队,这反映了增强人工智能解决问题能力的更广泛行业趋势。

随着 QwQ-32B-Preview 的推出,阿里巴巴旨在通过为开发人员和研究人员提供先进的工具,在 AI 领域产生重大影响。随着组织不断寻求 AI 推理的创新解决方案,这种新模型将自己定位为该领域值得注意的竞争者。