订阅

首页

可怕的GPT-4来了,能在SAT考试中击败90%的人类

阿尔法工场 2023-03-15 19:37:01

来源 | 网络
导语:OpenAI称,GPT-4在模拟律师资格考试中排名第90,在SAT阅读考试中排名第93,在SAT数学考试中排名第89。

据CNBC,3月14日OpenAI公布了其主要大型语言模型GPT的最新版本GPT-4,并表示模型在许多专业测试中表现出“与人类水平相当的表现”。

ChatGPT-4比以前的版本“更大”,这意味着它已经在更多的数据上进行了训练,并且更侧重于模型文件,这使得它的运行成本更高。

目前,此领域的许多研究人员认为,人工智能领域的许多最新进展,都来自于在数千台超级计算机上运行越来越大的模型,这些模型的训练过程可能耗资数千万美元。


(相关资料图)

GPT-4是“扩大规模”以获得更好结果的训练方法的一个例子。

OpenAI表示,它使用的是微软Azure训练模型,微软已经向这家初创公司投资了数十亿美元。OpenAI没有公布具体模型大小的细节,也没有公布用来训练模型的硬件,理由是“竞争情况”。

OpenAI的GPT大型语言模型为许多人工智能演示提供了支持,包括必应的AI聊天和ChatGPT,这些演示在过去六个月里让科技行业的人们惊叹不已。

最新版本是新技术的预览,可能会在未来几周内开始整合到聊天机器人等消费产品中。微软周二表示,必应的人工智能聊天机器人将使用GPT-4。

OpenAI表示,新模型将产生更少的错误答案,更少地偏离话题,更少地谈论禁忌话题,甚至在许多标准化测试中比人类表现得更好。

OpenAI称,GPT-4在模拟律师资格考试中排名第90,在SAT阅读考试中排名第93,在SAT数学考试中排名第89。

然而,OpenAI警告说,新软件还不完美,在许多情况下,它的能力不如人类。公司表示,它仍然存在“幻觉”或自己编造的主要问题,而且在事实问题上并不可靠。它仍然倾向于在错误的时候坚持自己是正确的。

公司在一篇博客文章中表示:“GPT-4仍有许多已知的局限性,我们正在努力解决,比如社会偏见、幻觉和对抗性提示。”

“在日常谈话中,GPT-3.5和GPT-4之间的区别可能很微妙。当任务的复杂性达到足够的阈值时,差异就显现出来了——GPT-4比GPT-3.5更可靠、更有创造力,能够处理更细致的指令。”

新模式将向付费ChatGPT订阅者开放,也将作为API的一部分提供,允许程序员将AI集成到他们的应用程序中。OpenAI将对750字左右的指令信息收费3美分,对750字左右的响应信息收费6美分。


相关稿件

最近更新

安全出行指南|雪天路滑,出行注意事项请查收!_焦点资讯

贵州省能源局关于贵州能发高山矿业有限公司黔西县协和镇高山煤矿等4处煤矿产能置换的公示

新消息丨“超级钢管”连江下线

焦点关注:顺丰不接抖音退货了

【ETF动向】12月22日汇添富深证300ETF基金涨1.44%,份额减少250万份

国际油价22日上涨

三季度光学膜概念股毛利率排名靠前的20家公司

观热点:苏文电能:公司将于2026年1月9日召开2026年第一次临时股东会

今日热门!富士莱:截至2025年12月19日股东总户数为9810户

看热讯:卓然股份:子公司签订40.33亿元年产120万吨PBAT生物降解聚酯项目工程总承包合同

动态焦点:[快讯]沪电股份:关于高级管理人员股份减持计划实施完成

生意社:2025年12月22日中铝铝锭(AL99.70)现货价格上涨

耐心资本观察 | 出手频率“一日两投”以上!2025年资本上演“机器人总动员”

国家药监局批准盐酸匹米替尼胶囊上市|最新

PriceSeek重点提醒:沥青现货价格下调库存增|每日热讯

上市智慧能源管理企业名单(2025/12/22)

现货黄金首次站上4400美元/盎司

微动态丨日本10年期国债收益率上升7个基点至2.09%

机构扎堆调研的大消费+内需升级潜力股出炉,融资客重点埋伏

建始联通定制化技能培训助力企业高效发展 每日快讯

斯良建材(广州)有限公司成立 注册资本10万人民币 滚动

教育部深夜发文,商业试卷彻底告别校园,家长们却炸锅了 热文

乙腈板块股票营收榜来了,2025第三季度中国化学455.78亿 每日热闻

【快播报】福晶科技:公司目前暂未生产镀钼超光滑反射镜

速读:买黄金怕买到假货怎么办?

美容上市公司十强(12月19日股票成交额的排名)-每日热门

秀我中国丨冬至:冬至一阳生 数九盼春归_精彩看点

冬至|一口“团子粑” 团圆好味道 微资讯

“蹲点”抢票、“连刷”多场……剧场何以“圈粉”年轻人|视讯

重庆发布国内首块L3级自动驾驶专用正式号牌 滚动