亚洲av无码成h人动漫无遮挡,特级欧美aaaaaaa免费观看,丝袜制服av熟女♀,亚洲avav天堂av在线网阿v,少妇人妻真实偷人精品视频

電影中的人工智能來了!OpenAI發(fā)布全能大模型:文圖音任意組合輸出,可實現(xiàn)人類級別響應

AIGC行業(yè)資訊11個月前發(fā)布 jzawxc
19 0

北京時間5月14日凌晨,OpenAI發(fā)布最新多模態(tài)大模型 GPT-4o(o代表omini,全能),支持文本、音頻和圖像的任意組合輸入,并生成文本、音頻和圖像的任意組合輸出。文本、推理和編碼智能方面性能達到了GPT-4 Turbo水平,同時在多語言、音頻和視覺能力方面也達到新高。據介紹,GPT-4o的速度比GPT-4 Turbo快2倍,速率限制提高5倍,最高可達每分鐘1000萬token,而價格則便宜了一半。

OpenAI首席技術官米拉·穆拉蒂(Muri Murati)在發(fā)布會上表示:“通過語音、文本和視覺進行推理非常重要,因為我們正在研究與機器交互的未來?!?/p>

官網顯示,GPT-4o的文本和圖像功能將在ChatGPT更新后提供給所有用戶,Plus用戶的消息數(shù)量使用上限是免費版的5倍(使用上限后會切換回GPT-3.5版本)。而新版語音模式將在未來幾周向Plus用戶推出,同時也將會在API(應用接口)中向小范圍推出對GPT-4o的新音頻和視頻功能的支持。

電影中的人工智能來了!OpenAI發(fā)布全能大模型:文圖音任意組合輸出,可實現(xiàn)人類級別響應

穆拉蒂在OpenAI春季更新發(fā)布會上介紹GPT-4o

在發(fā)布會現(xiàn)場演示中,GPT-4o可以像人工智能助手一樣,實現(xiàn)用戶與ChatGPT的實時交互,不再是一問一答,也不需要其他按鍵操作。

比如,用戶可以說“Hi,ChatGPT”并提出問題,也可以在ChatGPT回答時打斷它,它還可以識別用戶聲音中展現(xiàn)的情感,甚至實時根據用戶的需求來使用不同情感風格的聲音。

據介紹,GPT-4o的音頻輸入平均反應時間為0.32秒,與人類對話中的反應時間相似。

OpenAI表示,在GPT-4o之前,使用語音模式與ChatGPT對話的平均延遲時間為2.8秒(GPT-3.5)和5.4秒(GPT-4)。此前的語音模式由三個獨立模型組成:一個簡單模型將音頻轉為文本,GPT-4接收文本并輸出文本,第三個簡單模型將文本轉回音頻。這個過程也讓主要的智能源GPT-4丟失了很多信息,比如不能直接觀察音調、多人講話或背景噪音,也不能輸出笑聲、歌聲或表達情感。而GPT-4o通過在文本、視覺和音頻方面訓練了一個端到端新模型,所有輸入和輸出都由同一個神經網絡處理。

不過,OpenAI也坦言,由于GPT-4o是公司首個結合了所有前述模式的模型,因此在探索模型功能及其局限性方面仍處于起步階段,GPT-4o也開始擴大紅隊(測試)的訪問權限。

此外,GPT-4o還提高了ChatGPT的視覺能力。在現(xiàn)場演示中,通過手機實時拍攝的視頻或電腦桌面屏幕上的截圖,ChatGPT可以快速回答相關問題,幫助解決計算、編程等問題。

演示中還出現(xiàn)了一段小插曲。因為“幻覺”問題,ChatGPT在還沒打開攝像頭看到畫面時就表示理解了,在演示者提示后,她說“哎呀,我太興奮了”,隨后實時指導完成了一道數(shù)學題。

同時,OpenAI還在X(推特)上實時集到網友的反饋,進行了ChatGPT的情緒分析演示。通過演示者的實時攝像頭畫面,對表情中的開心、興奮等情緒做出了分析。

GPT-4o的英語和代碼文本性能與GPT-4 Turbo相當,在非英語語言文本方面也有顯著提高,能支持50種語言。發(fā)布會上,穆拉蒂演示了讓全新ChatGPT充當只會意大利語與只會英語的兩人的翻譯,實現(xiàn)了跨語種交流的無縫銜接。

電影中的人工智能來了!OpenAI發(fā)布全能大模型:文圖音任意組合輸出,可實現(xiàn)人類級別響應

GPT-4o速度比GPT-4 Turbo快2倍,價格則便宜了一半

發(fā)布會上,ChatGPT還發(fā)布了電腦桌面版和新UI界面。根據官方公告,目前僅適用于macOS,Windows版將在今年晚些時候推出。

“我們知道這些模型越來越復雜,但我們希望交互體驗變得更加自然、輕松,并且讓你根本不關注用戶界面,而是專注于與GPT(交互)?!蹦吕俦硎尽?/p>

OpenAI CEO山姆·奧特曼(Sam Altman)也表示:“對我來說,與電腦交談從來沒有真正自然過,而現(xiàn)在卻很自然……我真的看到了一個令人興奮的未來,我們可以用電腦做比以往更多的事情?!?/p>

“AI達到人類級別的響應時間和表現(xiàn)力是一個很大的改變,給人的感覺就像電影中的人工智能,而它的真實性仍然讓我感到有些驚訝?!彼硎?,“最初的ChatGPT展示了語言界面的雛形,而這款新模型給人的感覺卻截然不同,它快速、智能、有趣、自然而且樂于助人?!?/p>

奧特曼還發(fā)文“her”,或許也表達了他對GPT-4o的評價以及對未來的暢想(在電影《Her》中,人工智能助手Samantha主動給男主人公打了電話,告知他一些事情)。

電影中的人工智能來了!OpenAI發(fā)布全能大模型:文圖音任意組合輸出,可實現(xiàn)人類級別響應

山姆·奧特曼的推文

奧特曼表示,OpenAI的一項重要使命就是免費(或以優(yōu)惠價格)向人們提供功能強大的人工智能工具,“我感到非常自豪的是,我們在ChatGPT中免費提供了世界上最好的模型,并且沒有廣告或類似的東西”。

他表示:“我們是一家企業(yè),會找到很多可以收費的東西,這將幫助我們?yōu)閿?shù)十億人提供免費、出色的人工智能服務(希望如此)。”

此前,據外媒報道,蘋果公司已接近與OpenAI達成協(xié)議,今年將后者的部分技術引入iPhone,提供由ChatGPT支持的“聊天機器人”作為iOS 18中人工智能功能的一部分。

不過,蘋果同時還與谷歌就授權Gemini聊天機器人進行了談判。而谷歌將在OpenAI此次春季更新發(fā)布會之后一天舉行I/O開發(fā)者大會,谷歌在大會的官方博文中曾提到“Gemini 時代”,預計將會發(fā)布Gemini大模型最新動態(tài)。

? 版權聲明

相關文章