OpenAI 首次開發者日(rì):新模型發布,支持 128K 上下文,價格直降,GPT 商店(diàn)要來(lái)了
距離(lí) ChatGPT 在去(qù)年(nián) 11 月 30 日(rì)低調上線,已經接近一周年(nián)。這期間 OpenAI 處在絕對領導地位,推動着全球進入了「大(dà)模型時代」,并開啓了新一輪的創新創業熱(rè)潮。
OpenAI 的首次 DevDay 開發者日(rì)活動,于今日(rì)北京時間 11 月 7 日(rì)淩晨 02:00 開始,Keynote 主論壇環節由 Sam Altman 主講并在油管現場直播,配合現場的演示,展示了多款新産品的發布,整整 45 分(fēn)鍾,内容緊湊而真誠。
Keynote 亮點摘要:
OpenAI 開發者數據:全球超過 200 萬開發者在使用 OpenAI 旗下的開發者服務,其中 90% 來(lái)自(zì)世界 500 強企業,目前 OpenAI 每周活躍用戶超過一億;
GPT-4 Turbo:最新發布 GPT-4 Turbo 支持 128K 上下文窗(chuāng)口,Token 的費用相(xiàng)較 GPT-4,低至原定價的 1/3 和 1/2;知識庫更新至 2023 年(nián) 4 月;API 現在支持圖片和文本輸入;新版本中的 JSON 模式可(kě)以強制 GPT 以純 JSON 格式響應;集成 DALL-E 3、語音合成等新能力。
版權保護功能:承諾爲 API 用戶與企業客戶提供版權保護服務及侵權賠償服務。
定制化 GPT & GPTs 應用商店(diàn):每個人(rén)都(dōu)可(kě)以構建自(zì)己的 GPT,GPTs 應用商店(diàn)即将于本月晚些時候正式發布,開發者可(kě)上傳自(zì)己的 GPT 并獲得(de)收入。
Assistants API :開發者可(kě)以通過 Assistants API 提供的各類工(gōng)具(檢索、代碼解釋器、Python)、提供沙箱環境構建,高效創建 AI Agents。
多模态能力提升:GPT-4 Turbo with Vision、DALL-E 3 和 TextToSpeech 工(gōng)具現已上線,發布語音合成模型 tts-1、tts-1-hd 和語音轉文字模型 Whisper 3。
今日(rì)發布的 GPT-4 Turbo,最大(dà)的改動在于知識庫的更新截至 2023 年(nián) 4 月,相(xiàng)較于過往版本隻收錄了 2021 年(nián) 9 月前的世界知識,GPT-4 Turbo 擁有了更新的知識庫。
另外就(jiù)是 GPT-4 Turbo 支持 128k 上下文窗(chuāng)口,相(xiàng)當于 300 多頁文本的内容。Altman 還(hái)強調本次優化模型性能後,與 GPT-4 相(xiàng)比還(hái)能夠極大(dà)地壓縮 Token 的使用成本。
此前網絡中一直傳言将在本次開發者日(rì)上正式發布 GPT-5,最終隻見(jiàn)證了 GPT-4 Turbo 的到來(lái)。雖然不能消除開發者們對 GPT-5 不能及時發布的遺憾,但(dàn)是也能感受到 OpenAI 在重大(dà)版本發布上的謹慎與克制。
GPT 商店(diàn)即将上線:OpenAI 的生(shēng)态野心
科(kē)技圈常常将 ChatGPT 出現,類比于蘋果發布 iPhone 這類跨時代重大(dà)事(shì)件(jiàn)。在這次發布會的 GPTs 這部分(fēn),就(jiù)能夠感受到 OpenAI 想通過模型技術(shù)建立更大(dà)生(shēng)态的雄心壯志。
根據 Sam Altman 的解釋,GPTs 是針對特定目的進行自(zì)定義的 ChatGPT 版本,無需任何寫代碼的經驗,完全靠自(zì)然語言的輸入,就(jiù)可(kě)以創造出屬于自(zì)己的 GPTs。現場 OpenAI 提供了自(zì)定義 GPT 示例:Canva 和 ZapierAI ,通過非常簡單的交互,就(jiù)可(kě)以實現自(zì)定義 GPT 的生(shēng)成。
目前部分(fēn)自(zì)定義 GPT 已經支持 ChatGPT Plus 和企業用戶試用。
除了在主論壇環節詳細介紹 GPTs 生(shēng)态之外,OpenAI 已經在官網上發布了博客文章(zhāng),詳細介紹 GPTs 的特性與設計(jì)理(lǐ)念。在官方發布的一段視頻,展示了如(rú)何使用一個寵物醫生(shēng) GPT 來(lái)解決狗狗日(rì)常護理(lǐ)的問(wèn)題。
目前已經有 Amgen、Bain、and Square 等幾家公司,已經開始使用 GPT 提供的 自(zì)定義 GPT 進入業務,預計(jì)将在近期向 API 用戶和企業客戶端用戶全面開放(fàng)。
同時,在本月晚些時候,OpenAI 将會推出 GPT 商店(diàn)功能,主要用于分(fēn)享用戶構建的自(zì)定義 GPT 助手。
Assistants API:Agent 第一步
Assistants API 是幫助開發者在自(zì)己的程序中構建 Agent 的第一步,是一種專門(mén)構建的人(rén)工(gōng)智能産品,具有特定的指令,利用額外的知識,并且可(kě)以調用模型和工(gōng)具來(lái)執行任務。新的 Assistants API 提供了代碼解釋器和檢索以及函數調用等新功能,可(kě)以處理(lǐ)你(nǐ)以前必須自(zì)己完成的大(dà)量繁重工(gōng)作(zuò),并使你(nǐ)能夠構建高質量的 AI 應用程序。
代碼解釋器:在沙盒執行環境中編寫和運行 Python 代碼,可(kě)以生(shēng)成圖形和圖表,并處理(lǐ)具有不同數據和格式的文件(jiàn)。它允許開發者叠代運行代碼來(lái)解決複雜的代碼和數學問(wèn)題等等。
檢索:利用模型之外的知識來(lái)增強助手,例如(rú)專有領域數據、産品信息或用戶提供的文檔。這意味着開發者不需要計(jì)算和存儲文檔的嵌入,或實現分(fēn)塊和搜索算法。Assistants API 根據在 ChatGPT 中構建知識檢索的經驗,優化了要使用的檢索技術(shù)。
函數調用:使助手能夠調用你(nǐ)定義的函數并将函數響應合并到其消息中。
目前可(kě)以前往 Assistants Playground 來(lái)嘗試 Assistants API Beta 版。
多模态能力,持續推進、全面開花
多模态作(zuò)爲當前模型團隊重點關注和發展的技術(shù),開發者可(kě)以通過文本轉語音 API 從(cóng)文本生(shēng)成人(rén)類質量的語音。
開發者可(kě)以通過圖像 API 将 DALL·E 3直接集成到他(tā)們的應用程序和産品中,并将 DALL·E-3 指定爲模型。目前 Snap、可(kě)口可(kě)樂和 Shutterstock 等公司已使用 DALL·E 3 爲其客戶和活動生(shēng)成圖像和設計(jì)的服務。
與之前版本的 DALL·E 類似,該 API 包含内置審核功能,可(kě)幫助開發人(rén)員(yuán)保護其應用程序免遭濫用。目前提供不同的格式和質量選項,每生(shēng)成一張圖像的起價爲 0.04 美元,可(kě)以查看(kàn) API 中的 DALL·E 3 入門(mén)指南(nán)。
GPT-4 Turbo with vision,開發者可(kě)以通過 API 中的 gpt-4-vision-preview 來(lái)訪問(wèn)。OpenAI 計(jì)劃爲主要的 GPT-4 Turbo 模型提供視覺支持,價格取決于輸入圖像的大(dà)小,例如(rú)像素 1080×1080 的圖像需要的成本爲 0.00765 美元。
另外,其中 OpenAI 本次發布的 TTS 模型(文本轉語音)提供可(kě)六種預設聲音可(kě)供選擇以及兩種模型變體(tǐ),tts-1 和 tts-1-hd. tts 都(dōu)針對實時用例進行了優化,并 tts-1-hd 針對質量進行了優化。
這次 DevDay 中,Sam Altman 在緊湊的四十五分(fēn)鍾内,介紹了近期的多項重要更新和産品的未來(lái)願景,本身(shēn)就(jiù)像是一個精煉了知識的大(dà)模型,不斷輸出高密度信息。
這場開發者日(rì)的新品發布,是否也讓你(nǐ)們感到驚喜呢(ne)?
内容參考:
發布會回放(fàng):https://www.youtube.com/watch?v=U9mJuUkhUzk
DevDay:https://openai.com/blog/new-models-and-developer-products-announced-at-devday
GPTs:https://openai.com/blog/introducing-gpts
特邀現場觀察團:Keven Liu
500px: https://500px.com/rongxinliu
Github: https://github.com/rongxin-liu
————————————————
原文鏈接:https://blog.csdn.net/csdnnews/article/details/134259228
Keynote 亮點摘要:
OpenAI 開發者數據:全球超過 200 萬開發者在使用 OpenAI 旗下的開發者服務,其中 90% 來(lái)自(zì)世界 500 強企業,目前 OpenAI 每周活躍用戶超過一億;
GPT-4 Turbo:最新發布 GPT-4 Turbo 支持 128K 上下文窗(chuāng)口,Token 的費用相(xiàng)較 GPT-4,低至原定價的 1/3 和 1/2;知識庫更新至 2023 年(nián) 4 月;API 現在支持圖片和文本輸入;新版本中的 JSON 模式可(kě)以強制 GPT 以純 JSON 格式響應;集成 DALL-E 3、語音合成等新能力。
版權保護功能:承諾爲 API 用戶與企業客戶提供版權保護服務及侵權賠償服務。
定制化 GPT & GPTs 應用商店(diàn):每個人(rén)都(dōu)可(kě)以構建自(zì)己的 GPT,GPTs 應用商店(diàn)即将于本月晚些時候正式發布,開發者可(kě)上傳自(zì)己的 GPT 并獲得(de)收入。
Assistants API :開發者可(kě)以通過 Assistants API 提供的各類工(gōng)具(檢索、代碼解釋器、Python)、提供沙箱環境構建,高效創建 AI Agents。
多模态能力提升:GPT-4 Turbo with Vision、DALL-E 3 和 TextToSpeech 工(gōng)具現已上線,發布語音合成模型 tts-1、tts-1-hd 和語音轉文字模型 Whisper 3。
OpenAI DevDay 交流區
GPT-4 Turbo 正式發布,支持 128k 上下文窗(chuāng)口今日(rì)發布的 GPT-4 Turbo,最大(dà)的改動在于知識庫的更新截至 2023 年(nián) 4 月,相(xiàng)較于過往版本隻收錄了 2021 年(nián) 9 月前的世界知識,GPT-4 Turbo 擁有了更新的知識庫。
另外就(jiù)是 GPT-4 Turbo 支持 128k 上下文窗(chuāng)口,相(xiàng)當于 300 多頁文本的内容。Altman 還(hái)強調本次優化模型性能後,與 GPT-4 相(xiàng)比還(hái)能夠極大(dà)地壓縮 Token 的使用成本。
圖片版本價格對比
GPT-4 Turbo 還(hái)加入了 JSON 模式,這确保模型将使用有效的 JSON 進行響應。新的 API 參數 response_format 使模型能夠限制其輸出,以生(shēng)成語法正确的 JSON 對象。JSON 模式對于開發者在函數調用之外,在對話(huà)窗(chuāng)口就(jiù)能完成 API 中生(shēng)成 JSON。此前網絡中一直傳言将在本次開發者日(rì)上正式發布 GPT-5,最終隻見(jiàn)證了 GPT-4 Turbo 的到來(lái)。雖然不能消除開發者們對 GPT-5 不能及時發布的遺憾,但(dàn)是也能感受到 OpenAI 在重大(dà)版本發布上的謹慎與克制。
GPT 商店(diàn)即将上線:OpenAI 的生(shēng)态野心
科(kē)技圈常常将 ChatGPT 出現,類比于蘋果發布 iPhone 這類跨時代重大(dà)事(shì)件(jiàn)。在這次發布會的 GPTs 這部分(fēn),就(jiù)能夠感受到 OpenAI 想通過模型技術(shù)建立更大(dà)生(shēng)态的雄心壯志。
根據 Sam Altman 的解釋,GPTs 是針對特定目的進行自(zì)定義的 ChatGPT 版本,無需任何寫代碼的經驗,完全靠自(zì)然語言的輸入,就(jiù)可(kě)以創造出屬于自(zì)己的 GPTs。現場 OpenAI 提供了自(zì)定義 GPT 示例:Canva 和 ZapierAI ,通過非常簡單的交互,就(jiù)可(kě)以實現自(zì)定義 GPT 的生(shēng)成。
目前部分(fēn)自(zì)定義 GPT 已經支持 ChatGPT Plus 和企業用戶試用。
除了在主論壇環節詳細介紹 GPTs 生(shēng)态之外,OpenAI 已經在官網上發布了博客文章(zhāng),詳細介紹 GPTs 的特性與設計(jì)理(lǐ)念。在官方發布的一段視頻,展示了如(rú)何使用一個寵物醫生(shēng) GPT 來(lái)解決狗狗日(rì)常護理(lǐ)的問(wèn)題。
目前已經有 Amgen、Bain、and Square 等幾家公司,已經開始使用 GPT 提供的 自(zì)定義 GPT 進入業務,預計(jì)将在近期向 API 用戶和企業客戶端用戶全面開放(fàng)。
同時,在本月晚些時候,OpenAI 将會推出 GPT 商店(diàn)功能,主要用于分(fēn)享用戶構建的自(zì)定義 GPT 助手。
Assistants API:Agent 第一步
Assistants API 是幫助開發者在自(zì)己的程序中構建 Agent 的第一步,是一種專門(mén)構建的人(rén)工(gōng)智能産品,具有特定的指令,利用額外的知識,并且可(kě)以調用模型和工(gōng)具來(lái)執行任務。新的 Assistants API 提供了代碼解釋器和檢索以及函數調用等新功能,可(kě)以處理(lǐ)你(nǐ)以前必須自(zì)己完成的大(dà)量繁重工(gōng)作(zuò),并使你(nǐ)能夠構建高質量的 AI 應用程序。
代碼解釋器:在沙盒執行環境中編寫和運行 Python 代碼,可(kě)以生(shēng)成圖形和圖表,并處理(lǐ)具有不同數據和格式的文件(jiàn)。它允許開發者叠代運行代碼來(lái)解決複雜的代碼和數學問(wèn)題等等。
檢索:利用模型之外的知識來(lái)增強助手,例如(rú)專有領域數據、産品信息或用戶提供的文檔。這意味着開發者不需要計(jì)算和存儲文檔的嵌入,或實現分(fēn)塊和搜索算法。Assistants API 根據在 ChatGPT 中構建知識檢索的經驗,優化了要使用的檢索技術(shù)。
函數調用:使助手能夠調用你(nǐ)定義的函數并将函數響應合并到其消息中。
目前可(kě)以前往 Assistants Playground 來(lái)嘗試 Assistants API Beta 版。
多模态能力,持續推進、全面開花
多模态作(zuò)爲當前模型團隊重點關注和發展的技術(shù),開發者可(kě)以通過文本轉語音 API 從(cóng)文本生(shēng)成人(rén)類質量的語音。
開發者可(kě)以通過圖像 API 将 DALL·E 3直接集成到他(tā)們的應用程序和産品中,并将 DALL·E-3 指定爲模型。目前 Snap、可(kě)口可(kě)樂和 Shutterstock 等公司已使用 DALL·E 3 爲其客戶和活動生(shēng)成圖像和設計(jì)的服務。
與之前版本的 DALL·E 類似,該 API 包含内置審核功能,可(kě)幫助開發人(rén)員(yuán)保護其應用程序免遭濫用。目前提供不同的格式和質量選項,每生(shēng)成一張圖像的起價爲 0.04 美元,可(kě)以查看(kàn) API 中的 DALL·E 3 入門(mén)指南(nán)。
GPT-4 Turbo with vision,開發者可(kě)以通過 API 中的 gpt-4-vision-preview 來(lái)訪問(wèn)。OpenAI 計(jì)劃爲主要的 GPT-4 Turbo 模型提供視覺支持,價格取決于輸入圖像的大(dà)小,例如(rú)像素 1080×1080 的圖像需要的成本爲 0.00765 美元。
另外,其中 OpenAI 本次發布的 TTS 模型(文本轉語音)提供可(kě)六種預設聲音可(kě)供選擇以及兩種模型變體(tǐ),tts-1 和 tts-1-hd. tts 都(dōu)針對實時用例進行了優化,并 tts-1-hd 針對質量進行了優化。
這次 DevDay 中,Sam Altman 在緊湊的四十五分(fēn)鍾内,介紹了近期的多項重要更新和産品的未來(lái)願景,本身(shēn)就(jiù)像是一個精煉了知識的大(dà)模型,不斷輸出高密度信息。
這場開發者日(rì)的新品發布,是否也讓你(nǐ)們感到驚喜呢(ne)?
内容參考:
發布會回放(fàng):https://www.youtube.com/watch?v=U9mJuUkhUzk
DevDay:https://openai.com/blog/new-models-and-developer-products-announced-at-devday
GPTs:https://openai.com/blog/introducing-gpts
特邀現場觀察團:Keven Liu
500px: https://500px.com/rongxinliu
Github: https://github.com/rongxin-liu
————————————————
原文鏈接:https://blog.csdn.net/csdnnews/article/details/134259228
上一新聞:沒有了