GPT-4：颤抖吧人类！请接受生产力又一里程碑式的飞跃！

发布时间：2023-03-22 18:31:52 浏览次数：432

美国当地时间3月14日，让数亿ChatGPT用户燥候已久的GPT-4终于生出来了！

它对比现有的大型语言模型，包括下一代（SOTA，State Of The Arts）模型而言，可以用“完胜”两个字来形容。用OpenAI官方自己的话来说，“GPT-4是我们迄今为止最强大、对齐最好的模型”。

这次的宣发，OpenAI官方在GPT-4的介绍性网页中，直接给用户投送了“说明书大礼包”：

网页地址：https://openai.com/waitlist/gpt-4-api

GPT-4技术报告

https://cdn.openai.com/papers/gpt-4.pdf

System card

https://cdn.openai.com/papers/gpt-4-system-card.pdf

ChatGPT Plus 体验

https://chat.openai.com/chat

GPT-4的API waitlist

https://openai.com/waitlist/gpt-4-api

GPT-4 demo视频

https://www.youtube.com/watch?v=outcGtbnMuQ

GPT-4背后的开源评估框架Evals

https://github.com/openai/evals

总之，其内容之全是生怕你看不懂，更怕你看懂了不用。

01 GPT-4和GPT-3.5的区别在哪里？

从官网给出的三项不同的能力直观对比来看

推理能力：GPT-4＞Default=Legacy
速度：Default＞GPT-4=Legacy
语言精炼：GPT-4＞Default＞Legacy

Logo的变化

为了更加清晰的展示GPT-4对比GPT-3.5的“进化”，OpenAI官方做了一系列的基础测试，让模型们考试，甚至直接考人类的试。

语言能力

作为一款语言模型，为了考验其除了英语以外的其他语种的表现，OpenAI官方安排了一场考试，使用Azure Translate将MMLU基准测试（一套涵盖57个主题的14000个多项选择题）翻译成各种语言。

结果显示，GPT-4在测试的26种语言中，有24种的都优于对比的其他语言模型（Chinchilla，PaLM），不仅仅限于英语，甚至是拉脱维亚语、威尔士语和斯瓦希里语等低资源语言GPT-4也成功拿下。

高级推理能力

而为了更好的展现GPT-4在推理能力上质的飞跃，OpenAI扒出了最新公开的奥林匹克竞赛题、AP自由答题等试题，甚至于加上了2022-2023年版的模拟考试题，以增进对这两种模型的理解。

测试的结果也显而易见，GPT-4赢麻了。在律师模拟考试中，GPT-3排列末位10%左右，而GPT-4挤进了前10%左右。可以说对比GPT-4这个过于耀眼的优等生，连曾经的“顶流”GPT-3.5都显得有些黯然失色了。

功能增加

而对于月活九位数的ChatGPT用户们而言，最关心的当然还是新功能的增加。

最大的改变就是不再只接受文本了！GPT-4具备处理文本和图像的能力，用户可指定各种视觉或语言任务。

它可根据由文本和图像交替组成的输入，生成自然语言、代码等文本输出。在生成带文本和图片的文档、图表或截图方面，GPT-4与纯文本输入一样出色，甚至还可利用测试时技术（如少量标注数据和思维链提示）提高性能。目前，就官网上给予的7个视觉输入的例子展示来看，图像输入仍在研究预览阶段，未来可能会有更大的提升。

此外，GPT-4不仅可以处理更长的字符长度，其长度限制已提升至32K tokens，即能处理超过25000个单词的文本，还能够支持长格式内容的创建、扩展对话、文档搜索和分析等应用。

安全性提升

在安全性方面，为了确保GPT-4回答的准确性和安全性，OpenAI公司与医学、地缘政治等敏感领域的50余位专家合作，并改进了监控框架。

与GPT-3.5相比，GPT-4的安全特性得到了显著的改善，其缓解措施使模型响应禁止内容请求的可能性降低了82%。此外，根据OpenAI的政策，GPT-4对敏感请求（如医疗建议和自我伤害）的响应频率提高了29%。

多项任务并行优势突出

如果只是简单的对话，GPT-3.5和GPT-4之间的差别可能不太明显，但当任务的复杂性达到一定阈值时，就能看出它们之间的区别。与GPT-3.5相比，GPT-4更可靠、更具创造力，并且可以处理更多微妙的指令差异。

02 如何使用GPT-4？

第一种方式：ChatGPT Plus用户付费使用

在用户端，目前只开放给了ChatGPT Plus用户，顾名思义不支持免费使用，如果想要一睹为快，请先支付给官方每月20美元获取高级访问权限。即便付费后，提问也受到了一定的限制，每4小时内不能发送超过100条信息。

第二种方式：开发者加入waitlist

开发者可以可以申请GPT-4 API获取访问权，待候补名单通过后，可以把 AI 集成到自己的应用程序中，同时 OpenAI 将对约 750 个单词的提示收取约 3 美分，对约 750 个单词的回复收取 6 美分。

第三种方式：参与OpenAI Evals

在OpenAI开源的用于自动评估AI模型性能的框架OpenAI Evals中，提供了高质量贡献，官方会给予你GPT-4的访问权。

关于BFT白芙堂机器人

BFT（白芙堂）机器人是智能机器人一站式服务平台，能为客户提供机器人选型、培训、解决方案、在线采购、本地化定制等高性价比的一站式服务。平台产品涵盖协作机器人、工业机器人、移动机器人、SCARA机器人、服务机器人、机器人夹爪、三维机器视觉设备、3D工业相机等十余种品类，实现机器人产业链产品全覆盖，并广泛应用于工业制造、实验室自动化、智慧零售、教育科研等行业。平台已与国内外知名机器人企业达成战略合作，并拥有专业的工程师团队，能为客户提供算法及系统定制、职校教学、科研实验室平台搭建、机器人展厅定制等服务，支持一对一技术支持和二次开发。

上一篇：越疆机器人｜Nova2在咖啡零售行业的应用 2023-03-22 10:47:27

下一篇：越疆机器人丨DOBOT-CR7在视觉检测行业中的应用 2023-03-23 11:29:25

BFT白芙堂机器人平台版权和免责声明

1. 经本网站注明“来源：BFT白芙堂平台”的所有文章、视频、图片、音频等相关稿件，版权均归属于BFT白芙堂平台（www.bft-robot.com）独家所有。如媒体、网站等需对文章进行转载请联系17788781937，同时转载需注明“来源：BFT白芙堂平台”，未经擅自转载者本网站将对其追究法律责任。
2. 本网站的部分稿件来源于互联网，版权归属于原版权人。如该类稿件需转载，请保留原版权人信息，对于一切违反原版权人禁止的行为均由转载者自行负责。
3. 本网站的一切稿件均符合中国法律、国际公约的规定，遵守网络服务协议、规定、程序，符合公序良俗，任何他人不得将本网站用作非法途径或非正当用途。
4. 以上声明内容的最终解释权归本网站所有。