BFT机器人|一站式机器人采购平台 机器人代理、采购

商品分类
    商品分类
  1. 首页
  2. 返回

GPT-4:颤抖吧人类!请接受生产力又一里程碑式的飞跃!


1679480821491495.png

美国当地时间3月14日,让数亿ChatGPT用户燥候已久的GPT-4终于生出来了!


它对比现有的大型语言模型,包括下一代(SOTA,State Of The Arts)模型而言,可以用“完胜”两个字来形容。用OpenAI官方自己的话来说,“GPT-4是我们迄今为止最强大、对齐最好的模型”。


这次的宣发,OpenAI官方在GPT-4的介绍性网页中,直接给用户投送了“说明书大礼包”:


1679480838526690.png

网页地址:https://openai.com/waitlist/gpt-4-api


GPT-4技术报告

https://cdn.openai.com/papers/gpt-4.pdf


System card

https://cdn.openai.com/papers/gpt-4-system-card.pdf


ChatGPT Plus 体验

https://chat.openai.com/chat


GPT-4的API waitlist

https://openai.com/waitlist/gpt-4-api


GPT-4 demo视频

https://www.youtube.com/watch?v=outcGtbnMuQ


GPT-4背后的开源评估框架Evals

https://github.com/openai/evals


总之,其内容之全是生怕你看不懂,更怕你看懂了不用。


01 GPT-4和GPT-3.5的区别在哪里?


1679480920810676.png

1679480927440158.png

1679480935268503.png


从官网给出的三项不同的能力直观对比来看


  • 推理能力:GPT-4>Default=Legacy

  • 速度:Default>GPT-4=Legacy

  • 语言精炼:GPT-4>Default>Legacy


Logo的变化

1679480976750338.png


1679480984988346.jpg


为了更加清晰的展示GPT-4对比GPT-3.5的“进化”,OpenAI官方做了一系列的基础测试,让模型们考试,甚至直接考人类的试。


语言能力


作为一款语言模型,为了考验其除了英语以外的其他语种的表现,OpenAI官方安排了一场考试,使用Azure Translate将MMLU基准测试(一套涵盖57个主题的14000个多项选择题)翻译成各种语言。


1679481005313601.png


结果显示,GPT-4在测试的26种语言中,有24种的都优于对比的其他语言模型(Chinchilla,PaLM),不仅仅限于英语,甚至是拉脱维亚语、威尔士语和斯瓦希里语等低资源语言GPT-4也成功拿下。


1679481018219845.png


高级推理能力


而为了更好的展现GPT-4在推理能力上质的飞跃,OpenAI扒出了最新公开的奥林匹克竞赛题、AP自由答题等试题,甚至于加上了2022-2023年版的模拟考试题,以增进对这两种模型的理解。


1679481037643874.png


1679481044562825.png


测试的结果也显而易见,GPT-4赢麻了。在律师模拟考试中,GPT-3排列末位10%左右,而GPT-4挤进了前10%左右。可以说对比GPT-4这个过于耀眼的优等生,连曾经的“顶流”GPT-3.5都显得有些黯然失色了。


功能增加


而对于月活九位数的ChatGPT用户们而言,最关心的当然还是新功能的增加。


最大的改变就是不再只接受文本了!GPT-4具备处理文本和图像的能力,用户可指定各种视觉或语言任务。


它可根据由文本和图像交替组成的输入,生成自然语言、代码等文本输出。在生成带文本和图片的文档、图表或截图方面,GPT-4与纯文本输入一样出色,甚至还可利用测试时技术(如少量标注数据和思维链提示)提高性能。目前,就官网上给予的7个视觉输入的例子展示来看,图像输入仍在研究预览阶段,未来可能会有更大的提升。


此外,GPT-4不仅可以处理更长的字符长度,其长度限制已提升至32K tokens,即能处理超过25000个单词的文本,还能够支持长格式内容的创建、扩展对话、文档搜索和分析等应用。


安全性提升


在安全性方面,为了确保GPT-4回答的准确性和安全性,OpenAI公司与医学、地缘政治等敏感领域的50余位专家合作,并改进了监控框架。


与GPT-3.5相比,GPT-4的安全特性得到了显著的改善,其缓解措施使模型响应禁止内容请求的可能性降低了82%。此外,根据OpenAI的政策,GPT-4对敏感请求(如医疗建议和自我伤害)的响应频率提高了29%。


1679481073530378.png


1679481080896255.png


多项任务并行优势突出


如果只是简单的对话,GPT-3.5和GPT-4之间的差别可能不太明显,但当任务的复杂性达到一定阈值时,就能看出它们之间的区别。与GPT-3.5相比,GPT-4更可靠、更具创造力,并且可以处理更多微妙的指令差异。


02 如何使用GPT-4?


第一种方式:ChatGPT Plus用户付费使用


在用户端,目前只开放给了ChatGPT Plus用户,顾名思义不支持免费使用,如果想要一睹为快,请先支付给官方每月20美元获取高级访问权限。即便付费后,提问也受到了一定的限制,每4小时内不能发送超过100条信息。


第二种方式:开发者加入waitlist


开发者可以可以申请GPT-4 API获取访问权,待候补名单通过后,可以把 AI 集成到自己的应用程序中,同时 OpenAI 将对约 750 个单词的提示收取约 3 美分,对约 750 个单词的回复收取 6 美分。


第三种方式:参与OpenAI Evals


在OpenAI开源的用于自动评估AI模型性能的框架OpenAI Evals中,提供了高质量贡献,官方会给予你GPT-4的访问权。


关于BFT白芙堂机器人

BFT(白芙堂)机器人是智能机器人一站式服务平台,能为客户提供机器人选型、培训、解决方案、在线采购、本地化定制等高性价比的一站式服务。平台产品涵盖协作机器人、工业机器人、移动机器人、SCARA机器人、服务机器人、机器人夹爪、三维机器视觉设备、3D工业相机等十余种品类,实现机器人产业链产品全覆盖,并广泛应用于工业制造、实验室自动化、智慧零售、教育科研等行业。平台已与国内外知名机器人企业达成战略合作,并拥有专业的工程师团队,能为客户提供算法及系统定制、职校教学、科研实验室平台搭建、机器人展厅定制等服务,支持一对一技术支持和二次开发。

推荐产品

对比
0

对比栏为空

微信客服
  • 微信客服

    微信客服
留言咨询
在线咨询
顶部

采购咨询

×
产品参数 解决方案 产品报价 货期
小芙会根据您的留言咨询给您以电话或邮件的方式回访,请注意查收
  • 一站式机器人采购平台
  • 客服
  • BFT机器人|一站式机器人采购平台 机器人代理、采购
  • 公众号
  •  
  • 电话: 17788781937

    邮箱:alice@bft-robot.com

    工作时间: 9:00 -18:30