阿里云发布通义千问2.0 模型参数达千亿级
科技日报记者 崔爽 都芃 10月31日,阿里阿里云正式发布千亿级参数大模型通义千问2.0。云发义千在MMLU、布通C-Eval、问模GSM8K、型参HumanEval、数达MATH等10个主流Benchmark测评集上,千亿通义千问2.0的阿里得分整体超越Meta的Llama-2-70B,相比OpenAI的云发义千GPT-3.5是九胜一负,相比GPT-4则是布通四胜六负,与GPT-4的问模差距进一步缩小。当天,型参通义千问APP也在各大手机应用市场正式上线,数达用户可通过APP直接体验最新模型能力。千亿 过去6个月,阿里通义千问2.0在性能上取得显著飞跃,相比4月发布的1.0版本,通义千问2.0在复杂指令理解、文学创作、通用数学、知识记忆、幻觉抵御等能力上均有显著提升。 中英文理解能力是大语言模型的基本功。英语任务方面,通义千问2.0在MMLU基准的得分是82.5,仅次于GPT-4,通过大幅增加参数量,通义千问2.0能更好地理解和处理复杂的语言结构和概念;中文任务方面,通义千问2.0以明显优势在C-Eval基准获得最高得分,这是由于模型在训练中学习了更多中文语料,进一步强化了中文理解和表达能力。 在数学推理、代码理解等领域,通义千问2.0进步明显。在推理基准测试GSM8K中,通义千问排名第二,展示了强大的计算和逻辑推理能力;在HumanEval测试中,通义千问得分紧跟GPT-4和GPT-3.5,该测试主要衡量大模型理解和执行代码片段的能力,这一能力是大模型应用于编程辅助、自动代码修复等场景的基础。 通义千问2.0发布。 此外,通义千问2.0还在指令遵循、工具使用、精细化创作等方面作了技术优化,能够更好地被下游应用场景集成。通义大模型官网上线了多模态和插件功能,支持图片输入、文档解析等细分任务。 与此同时,基于通义大模型训练的8大行业模型组团上线,分别是通义灵码—智能编码助手、通义智文—AI阅读助手、通义听悟—工作学习AI助手、通义星尘—个性化角色创作平台、通义点金—智能投研助手、通义晓蜜—智能客服、通义仁心—个人专属健康助手、通义法睿—AI法律顾问。8大行业模型面向当下最受欢迎的多个垂直场景,使用领域数据进行专门训练。用户可以在官网直接体验模型功能,开发者可以通过网页嵌入、API/SDK调用等方式,将模型能力集成到自己的大模型应用和服务中。 截至10月,阿里云已与60多个行业头部伙伴进行深度合作,推动通义千问在办公、文旅、电力、政务、医保、交通、制造、金融、软件开发等领域的落地。 据悉,阿里云计划近期开源通义千问72B版本,此前,阿里云已先后开源7B和14B版本模型,模型累计下载量超过100万。阿里云将持续支持千行百业的开发者基于通义千问开源模型进行模型和应用创新。
- 最近发表
- 随机阅读
-
- 青岛自贸片区:16个重点项目集中开工
- 《湖南省北斗产业发展规划》发布
- 时隔163年五兽首重聚圆明园 动画演示喷水过程→
- 遇到特种车辆如何不做“憨憨”?正确做法一文看懂→
- “2024全国网上年货节”实现网络消费“开门红”
- 1.3亿多年前的恐龙皮肤化石“重见天日”
- 攻克核心技术!我国首台国产海上平台燃气轮机正式投用
- 极越01上市售价24.99万元起:首发高通8295芯片 文心一言大模型上车
- 小麦进入返青期 各地为麦苗“把脉问诊”确保粮食安全
- 这些APP被工信部通报
- 到底是什么样的机器人才能改变世界? 听听亚马逊高管们怎么说……
- 突发!拜登下令,美军空袭叙利亚
- 研究:月震或影响未来人类探月
- 超2400万次路线规划 首个全国性无障碍导航上线30城
- 今年前9个月我国人民币跨境收付38.9万亿元
- 大脑芯片能同时测量多种神经递质
- 成都金堂:多形式游玩 感受历史底蕴
- 强调精准摄入,儿童营养进入分龄时代
- 三季度全国规模以上工业企业利润同比增长7.7%
- 山西出台省域发电企业技术监督方案
- 搜索
-