小参数,大性能:阿联酋推出基于千问的低成本AI模型K2 Think 阿联酋穆罕默德·本·扎耶德人工智能大学(MBZUAI)与科技集团G42近日联合推出高效推理模型“K2 Think”。该模型仅使用320亿参数,却在多项性能评测中超越规模大于自身20倍的模型。K2 Think基于阿里巴巴开源的Qwen 2.5架构,采用长链式思维监督微调(SCoT)和推理阶段扩展(Inference-time Scaling)等关键技术,显著提升复杂推理与数学解题能力,专注于科学、技术、工程和数学(STEM)领域的应用需求。 Qwen(千问)作为阿里巴巴推出的多语言大模型系列,已在全球学术界和工业界引起广泛关注。其开源策略促进了跨国合作与研究共享,被多家国际机构用于自然语言处理、代码生成和多模态任务研究。Qwen 2.5版本更在推理效率和上下文理解方面取得突破,为K2 Think的高性能奠基。 千问模型不仅推动了多语言AI系统的发展,也为资源受限环境下的高效模型部署提供了重要范例。它的开源生态持续赋能科学研究与创新应用,体现了中国AI技术在全球化协作中的贡献与影响力。
小参数,大性能:阿联酋推出基于千问的低成本AI模型K2Think 阿联酋穆罕
数学指南针
2025-09-10 12:37:18
0
阅读:0