每周跟踪AI热点新闻动向和震撼发展 想要探索生成式人工智能的前沿进展吗?订阅我们的简报,深入解析最新的技术突破、实际应用案例和未来的趋势。与全球数同行一同,从行业内部的深度分析和实用指南中受益。不要错过这个机会,成为AI领域的领跑者。点击订阅,与未来同行! 订阅:https://rengongzhineng.io/
据报道,中国科技巨头阿里巴巴推出了一款名为QwQ-32B-Preview(简称QWQ)https://huggingface.co/Qwen/QwQ-32B-Preview 的全新AI模型,凭借其强大的推理能力引发广泛关注。这款模型能够通过逻辑、数学以及编程等复杂多步骤问题的“推理”,表现出了前所未有的技术水平。这一发布无疑将QWQ推向了OpenAI最新AI模型o1-preview的正面竞争舞台。
从基准测试结果来看,QWQ在多个测试中超越了OpenAI的o1(及其轻量版o1-mini)。在数学推理相关的基准测试中,QWQ的准确率达到90.6%,远高于o1的85.5%。更引人注目的是,在AIME测试(通过其他AI模型评估性能)中,QWQ的得分为50%,而o1的成绩仅为44.6%(作为对比,OpenAI的GPT-4在同测试中的得分仅为9.3%)。
尽管如此,QWQ也有其局限性。首先,它的最大输入限制为32,000词,而o1可以接受长达96,000词的输入。此外,由于受到政策要求,QWQ会拒绝回答某些政治敏感问题,并以“核心社会主义价值观”为模型设计的指导原则。同时,该模型在某些情况下会突然切换语言、陷入循环无法正常运作,甚至在“常识推理”任务中表现不佳。
值得注意的是,QWQ作为一个开源模型,已在开发者平台Hugging Face上开放下载,并允许商业用途。然而,阿里巴巴只部分开放了模型内容,因此用户无法完全复制模型或查看其具体内部结构。
总体而言,这款新模型的发布不仅为AI领域带来了新挑战,也让阿里巴巴在全球AI竞赛中占据了一席之地。