【OpenAI 2023 DevDay】一文了解ChatGPT&GPT-4重点更新!

作为AI龙头,开发ChatGPT的OpenAI刚刚举行了首次开发者大会DevDay。自上年11月ChatGPT横空出世后,全球达到了由生成式AI主导的全新科技浪潮。想知道ChatGPT还有什么最新发展,GPT-4的威力又会否再度升级?前言为大家紧贴AI最新发展,让你一文看尽DevDay重点资讯。无论你是AI开发者还是休闲用家,今次发布会都会有适合你的重磅更新,万勿错过!

GPT Builder:不用编程,开发你的专属AI聊天机器人

功能

迄今为止ChatGPT对于用家的主要功能都只是限定在特定界面上的AI Chatbot,而OpenAI在2023年DevDay正式宣布开放GPT的自定功能「GPT Builder」。用家及开发者可以在ChatGPT上使用GPT Builder功能建立属于自己的AI聊天机器人——GPTs 把其功能定制在特定范围及日常生活的各种应用中。由于在开发的过程中用家可以使用GPT Builder中加入特定的指令、在资料库以外的专业及知识输出指令等,各个GPT的预期可以在其特定范围内提供比ChatGPT中增加专业性的指定建议及更有效地引导用家输入更多的触发指令。用家亦无需任何编程知识,只需如使用 ChatGPT 一般输入文字对话指令便可以查看 GPT。

例子

在 DevDay 的使用示例中,GPT 被自定成为一个供编程教学导师使用的 AI 聊天机器人,导师可以根据其在教学中遇到的问题输入 GPT 中寻求建议,GPT 则根据教学对象的年龄和身份提供最佳建议适合的例子及教学方法。由于GPTs在Chatbot中会根据家庭的需求及应用层面引导用家输入更多的跟进问题,GPTs在未来可以提供比原来的ChatGPT更多个人化的数据收集及建议,并代替现时各种职业代理上的角色解答专业问题,甚至更进一步改变一般人使用搜索器的。


OpenAI DevDay,开幕主题演讲(在Youtube上观看)

使用方法

GPT Builder现已开放予ChatGPT Plus用户,用家需要有外国信用卡才可订阅ChatGPT Plus加入或用户登入ChatGPT Plus后,在界面的左上方单击“探索”并选择“创建GPT”,则可以在选择“创建”的功能后创建GPT。

GPT Store:AI版苹果应用商店

功能

随着 GPT Builder 的出现,OpenAI 亦逐渐成为 GPT 目前整个生态系统。在不久的将来我们可以看到各种 GPT 的出现,OpenAI 为此将推出 GPT Store 以供国内搜寻可用的 GPT。情况就AI版的Apple App Store,用家可以在应用程序中链接并使用至各开发者上传以供公开使用的GPT。

例子

在 DevDay 的发布会中,OpenAI 提及 GPT Store 将具备排行榜及热门等功能,各款最受欢迎的 GPT 可以根据使用家使用量获得相对应的利润分红,以鼓励更多开发者参与近期GPT 的整个生态系统。

使用方法

GPT Store将于2023年11月内推出。

Assistant API:将AI整合到不同平台

功能

而对于 AI 开发者而言,Assistant API应该就是这次上市的一大重点。OpenAI 表示,Assistant API 的推出将只是他们协助 AI 开发者将 AI 更简单地模拟应用程序的第一步。我们可以预见在不久的将来人工智能将因此而更广泛地被集成到不同的平台,甚至人工智能助手将成为日常生活的必需品。助手现在的主要功能为:

  • 线程程序 负责处理家庭及应用中的对话,开发人员将计算器在编程中使用过多的时间处理家庭输入和人工智能输出的问题。例如助手会存储用户中的对话历史,并可以在上下文内容冗长当将其分段或截断时,从而使GPT可以更好地处理对话及响应。

  • 函数调用 助手整合了数款OpenAI工具,开发人员在助手中可以通过「函数调用」使用其他工具如「代码解释器」及「知识检索」及各种自定义函数

例子

在发布会上,Assistant API 被整合在一个旅游网站中,开发人员只需要在「Assistant Playground」这个 Web UI 中选择所需的工具及设置,AI 助手很快就会被整合至页面,并为网站的用家提供旅游建议。在发布片段中,AI 助手通过这些工具使 GPT 和应用程序更顺畅地进行交互,并可以识别用家上传的 PDF 从而提出更多的建议。

使用方法

OpenAI现已推出Assistant API Beta,开发者可以通过「Create Assistant」开始目前模型。

GPT4-Turbo:强化版GPT-4

功能

而最后一个重磅消息是GPT-4令人兴奋的最新升级——GPT4-Turbo。其中主要功能除了上述提及的功能外还包括:

  • 中断用家输入比现时指令多4倍的上限: 上下窗口上限达到128k,实际上单个对话可以承载超过300页的指令,使GPT对于冗长指令的分析能力更高;将资料文本库的知识更新至2023年4月

  • 改进遵循指示的能力和 JSON 模式: GPT-4 Turbo 改进了在需要仔细遵循指示的任务上表现,例如将严格遵从开发人员指定格式的输出,并支持 JSON 模式,确保模型以有效的 JSON 格式响应。

  • 在家以图片形式输入指令: GPT-4 Turbo 现在支持图像输入,并可以根据图像的内容生成标题、详细分析现实世界中的图像以及阅读带有图形的文件。

  • 支持最新推出的 DALL-E 3: 开发人员可以通过指定 dall-e-3 模型将 DALL·E 3 集成到其应用程序中,并通过 Images API 进行操作。

  • 文字转语音(TTS): 开发人员可以使用TTS API从文本生成具有人类质量的语音,并提供六种预设语音。

  • 版权保护: 引入了内置的版权保护功能,OpenAI 致力于为 ChatGPT Enterprise 和开发者平台提供版权保护。

  • Whisper v3 和 Consistency Decoder: Whisper large-v3 是 OpenAI 开源的自动语音识别模型的最新版本,并计划在不久的将来在 API 中支持 Whisper v3。Consistency Decoder 是目前稳定 Diffusion VAE 解码器的替代产品。

例子

掀上掀应用程序 BeMyEyes 通过使用 GPT4-Turbo 的图像分析功能来为有视力障碍的人物识别生活中的各种项目。除此之外,OpenAI 亦会加强与外界其他企业的合作,为各专业界别提供自定义的GPT模型,核心企业用家使用其专业范围内的知识来训练模型。

使用方法

GPT4-Turbo 目前暂时只开放予已付费的开发人员。预计 ChatGPT Plus 的用户可以在不久的将来在 ChatGPT 的界面上使用 GPT4-Turbo。开发人员现在可以在 API 中使用 gpt-4-vision-preview使用此功能。

本文链接地址:https://www.wwsww.cn/rgzn/22906.html
郑重声明:本文版权归原作者所有,转载文章仅为传播更多信息之目的,如作者信息标记有误,请第一时间联系我们修改或删除,多谢。