谷歌发布最新人工智能模型Gemini 智力测试优于“专家级”人类
科技日报记者 张梦然 据《新科学家》杂志网站报道,专家级谷歌公司6日宣布推出一种名为Gemini的谷歌新人工智能模型,声称该模型在一系列智力测试中的发布表现优于OpenAI的GPT-4模型和“专家级”人类。 Gemini已针对不同的最新智能智力应用创建了3个版本,分别是人工人类Nano、Pro和Ultra,模型它们的测试大小和功能均有所增加。谷歌拒绝回答有关Pro和Ultra的优于规模、它们包含的专家级参数数量或训练数据的规模或来源等问题。 其最小版本Nano旨在在智能手机上本地运行,谷歌实际上有两种模型:一种用于速度较慢的发布手机,拥有18亿个参数,最新智能智力另一种用于功能更强大的人工人类设备,拥有32.5亿个参数。模型据传GPT-4包含多达1.7万亿个参数,测试而Meta的LLAMA-2则包含700亿个参数。 谷歌声称,Gemini的中档Pro版本击败了其他一些模型,例如OpenAI的GPT3.5,但更强大的Ultra超过了所有现有AI模型的能力。它在行业标准MMLU基准上的得分为90%,而“专家级”的人类预计能达到89.8%。 这是人工智能首次在测试中击败人类,也是现有模型中得分最高的。该测试涉及一系列棘手的问题,主题包括逻辑谬误、日常场景中的道德问题、医疗问题、经济和地理。 在同一测试中,GPT-4的得分为87%,LLAMA-2的得分为68%,Anthropic Claude 2的得分为78.5%。Gemini在其他9项常见基准测试中的8项中击败了所有这些模型。 Pro模型将集成到谷歌今年3月推出的在线聊天机器人Bard中。该公司表示,名为Bard Advanced的新版本将于明年初推出,并配备更大的Gemini Ultra模型。 谷歌“深度思维”的艾力·柯林斯表示,Gemini是该公司最大、能力最强的模型,但也是最通用的模型,这意味着它可适应各种任务。与当前许多专注于文本的模型不同,Gemini接受过文本、图像和声音方面的训练,据称能接受所有这些格式的输入并提供输出。 柯林斯称,Gemini“几乎在每个领域都是最先进的”,并且仍在测试中,以确定它在不同媒体、语言和应用程序中的工作能力。 在发布会上,Gemini没有提高可供测试的版本,但谷歌展示了人工智能解决家庭作业问题和处理实时视频输入的演示。据称,它比以前的模型更擅长开发软件。去年,“深度思维”发布了一款名为AlphaCode的人工智能代码生成器,它可击败50%的人类开发人员,新发布的Gemini声称可击败85%的人类编程师。 Gemini可处理文本、音频和视频。图片来源:谷歌公司
- 最近发表
- 随机阅读
-
- 别跑空!哈尔滨这几个热门景点今天暂停、闭园
- 世界上最大的海上液化天然气接收站试运行
- 上海:应急消防科普 增强防灾减灾意识
- 育秧插秧正当时
- 北京市医学科技创新院士、北京学者“领航”系列讲座第二期举办
- 这就是信心|权威数据!不断优化我国外贸结构
- 火箭“工位”准备中 海南商业航天发射场项目最新进展
- 火星上有22个中国地名,有你的家乡吗?
- 南北方气温再冲高多地暖意堪比常年4月 较强冷空气将至
- 海拔4800米,出发!青海可可西里藏羚羊年度迁徙开始
- 科普一下|“量子电话”是什么?怎么打?
- 民营经济,体现上海创新能力的骨干力量,高质量发展研究行
- 警方提醒假期外出 免费WiFi别乱“蹭”
- 自旋结构首次在二维材料中检测到
- 总编辑圈点
- 世界正畸日,牙齿矫正前 你必须知道这些事情
- 铁路等部门守护春运平安顺畅出行路
- 水利部:首次掌握全国水旱灾害风险基数
- 给大地“脉” 为人民“放哨”-走近一线地震观察员
- 夏日黄河
- 搜索
-