阿里云发布通义千问2.0 模型参数达千亿级
科技日报记者 崔爽 都芃 10月31日,阿里阿里云正式发布千亿级参数大模型通义千问2.0。云发义千在MMLU、布通C-Eval、问模GSM8K、型参HumanEval、数达MATH等10个主流Benchmark测评集上,千亿通义千问2.0的阿里得分整体超越Meta的Llama-2-70B,相比OpenAI的云发义千GPT-3.5是九胜一负,相比GPT-4则是布通四胜六负,与GPT-4的问模差距进一步缩小。当天,型参通义千问APP也在各大手机应用市场正式上线,数达用户可通过APP直接体验最新模型能力。千亿 过去6个月,阿里通义千问2.0在性能上取得显著飞跃,相比4月发布的1.0版本,通义千问2.0在复杂指令理解、文学创作、通用数学、知识记忆、幻觉抵御等能力上均有显著提升。 中英文理解能力是大语言模型的基本功。英语任务方面,通义千问2.0在MMLU基准的得分是82.5,仅次于GPT-4,通过大幅增加参数量,通义千问2.0能更好地理解和处理复杂的语言结构和概念;中文任务方面,通义千问2.0以明显优势在C-Eval基准获得最高得分,这是由于模型在训练中学习了更多中文语料,进一步强化了中文理解和表达能力。 在数学推理、代码理解等领域,通义千问2.0进步明显。在推理基准测试GSM8K中,通义千问排名第二,展示了强大的计算和逻辑推理能力;在HumanEval测试中,通义千问得分紧跟GPT-4和GPT-3.5,该测试主要衡量大模型理解和执行代码片段的能力,这一能力是大模型应用于编程辅助、自动代码修复等场景的基础。 通义千问2.0发布。 此外,通义千问2.0还在指令遵循、工具使用、精细化创作等方面作了技术优化,能够更好地被下游应用场景集成。通义大模型官网上线了多模态和插件功能,支持图片输入、文档解析等细分任务。 与此同时,基于通义大模型训练的8大行业模型组团上线,分别是通义灵码—智能编码助手、通义智文—AI阅读助手、通义听悟—工作学习AI助手、通义星尘—个性化角色创作平台、通义点金—智能投研助手、通义晓蜜—智能客服、通义仁心—个人专属健康助手、通义法睿—AI法律顾问。8大行业模型面向当下最受欢迎的多个垂直场景,使用领域数据进行专门训练。用户可以在官网直接体验模型功能,开发者可以通过网页嵌入、API/SDK调用等方式,将模型能力集成到自己的大模型应用和服务中。 截至10月,阿里云已与60多个行业头部伙伴进行深度合作,推动通义千问在办公、文旅、电力、政务、医保、交通、制造、金融、软件开发等领域的落地。 据悉,阿里云计划近期开源通义千问72B版本,此前,阿里云已先后开源7B和14B版本模型,模型累计下载量超过100万。阿里云将持续支持千行百业的开发者基于通义千问开源模型进行模型和应用创新。
-
上一篇
-
下一篇
- 最近发表
- 随机阅读
-
- 新春走基层 身边暖镜头丨安置点里过新年
- 辽宁凌海发现了汉代密集的墓葬群
- 2023年,海南省万名大学生基层科普活动启动
- 全球超高海拔单机容量最大的风电机组成功吊装
- 新春走基层 活力中国行丨西安城头华灯绽放夜空
- 首个电信网络远程量子中继器节点构建
- 河南漯河:链式发展激活液压产业“聚变效应”
- 青海75%以上的野生植物得到有效保护
- 总编辑圈点
- 突破性方法将“顽固”金属转化为薄膜
- 青岛自贸人才企业综合服务平台揭牌成立
- 上海证券交易所:科技创新板已支持47家央企和国有企业上市融资
- 培育新时代建筑产业工人经验清单“出炉”
- 新型钙金属电池原型成功开发
- 杰迷一定要看!人类最早的接吻记录证实了“西元前的爱”
- 辽宁凌海发现了汉代密集的墓葬群
- 中东部将遭遇剧烈降温 明起雨雪天气进入鼎盛阶段
- 国家能源局:中国风电光伏发电总装机超过8亿千瓦
- 2022年,十大优秀农业种质资源选择发布
- 新疗法有助于免疫系统根除脑肿瘤
- 搜索
-