找回密码
 立即注册
查看: 307|回复: 0

阿里云Qwen2.5发布!再登开源大模型王座,Qwen-Max性能逼近GPT-4o

[复制链接]

签到天数: 18 天

[LV.4]偶尔看看III

607

主题

726

回帖

4万

积分

武林盟主

积分
48220

宣传达人灌水之王突出贡献荣誉管理论坛元老

QQ
发表于 2024-9-19 23:25:01 | 显示全部楼层 |阅读模式


9月19日,云栖大会上,阿里云CTO周靖人发布通义千问新一代开源模型Qwen2.5,其涵盖多个尺寸的大语言模型、多模态模型、数学模型和代码模型,每个尺寸都有基础版本、指令跟随版本、量化版本,总计上架100多个模型,刷新业界纪录。

从数据上看,Qwen2.5全系列模型都在18T tokens数据上进行预训练,相比Qwen2,整体性能提升18%以上,拥有更多的知识、更强的编程和数学能力,支持128K的上下文长度,可生成最多8K内容。模型能够响应多样化的系统提示,实现角色扮演和聊天机器人等任务。在指令跟随、理解结构化数据(如表格)、生成结构化输出等方面Qwen2.5都进步明显。


专项模型方面,用于编程的Qwen2.5-Coder和用于数学的Qwen2.5-Math都比前代有了实质性进步。Qwen2.5-Coder在多达5.5T tokens的编程相关数据上作了训练;Qwen2.5-Math支持使用思维链和工具集成推理(TIR)解决中英双语的数学题。


多模态模型方面,视觉语言模型Qwen2-VL-72B正式开源,Qwen2-VL能识别不同分辨率和长宽比的图片,理解20分钟以上长视频,具备自主操作手机和机器人的视觉智能体能力。


生态上,通义与海内外的开源社区、生态伙伴、开发者共建生态网络,截至2024年9月中旬,通义千问开源模型下载量突破4000万,Qwen系列衍生模型总数超过5万个,成为仅次于Llama的世界级模型群。


本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有账号?立即注册

×
DEEPFACE论坛免责声明
本论坛发布的所有内容,包括图片、软件、模型等部分来自网络,版权归原作者所有。
本论坛提供的内容仅用于个人学习和研究,请勿滥用,否则由此引发的责任需自行承担。
请合理合法使用AI技术,并遵守当地法律法规,不要用于违法用途!
如本站发布内容侵犯了你的合法权益,请联系我们删除。

各种参数DFL换脸模型/实时换脸模型底丹、实时换脸模型训练教学/实时换脸模型定制、AI软件个性化定制
论坛所有一键包报错请在帖子下方跟帖,看到会回复,不支持一对一解答,请确认再下载!
全站默认解压密码: https://deepface.cc/ (密码就是这个网址,不要点开去找。复制完整网址即可,不要有空格)
您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

Archiver|手机版|小黑屋|AIGC资源站

GMT+8, 2025-4-20 03:53 , Processed in 0.077278 second(s), 4 queries , Redis On.

Powered by Discuz! X3.5

©2001-2023 Discuz! Team

快速回复 返回顶部 返回列表