亚洲av无码成h人动漫无遮挡,特级欧美aaaaaaa免费观看,丝袜制服av熟女♀,亚洲avav天堂av在线网阿v,少妇人妻真实偷人精品视频

全面叫板OpenAI!谷歌發(fā)布多模態(tài)大模型全家桶:從AI助手到文生視頻模型

AIGC行業(yè)資訊1年前 (2024)更新 jzawxc
15 0

OpenAI搶先一天后,科技巨頭谷歌不甘示弱,推出了自己的最新多模態(tài)AI人工智能)產(chǎn)品。

當(dāng)?shù)貢r(shí)間5月14日,在谷歌I/O開(kāi)發(fā)者大會(huì)上的主題演講中,谷歌展示了由升級(jí)后Gemini模型驅(qū)動(dòng)的AI助手項(xiàng)目Project Astra、對(duì)標(biāo)Sora的文生視頻模型Veo,以及在硬件方面發(fā)布的第六代Tensor處理器單元(TPU)Trillium芯片。根據(jù)發(fā)布會(huì)最后的官方統(tǒng)計(jì),完全聚焦于AI的這場(chǎng)主題演講總共提到了121次AI。

全面叫板OpenAI!谷歌發(fā)布多模態(tài)大模型全家桶:從AI助手到文生視頻模型

完全聚焦于AI的這場(chǎng)主題演講總共提到了121次AI。

谷歌CEO桑達(dá)爾·皮查伊(Sundar Pichai)表示,谷歌的所有工作都在圍繞生成式AI模型Gemini展開(kāi),“我們希望每個(gè)人都能從Gemini所做的事情中受益”。

14日當(dāng)天,谷歌(Nasdaq:GOOGL)股價(jià)收于每股171.93美元,漲0.6%,總市值2.12萬(wàn)億美元。

AI搜索支持視頻輸入,Gemini、Gemma上新

作為搜索引擎巨頭,AI搜索正是谷歌所做工作中的一部分。

據(jù)介紹,在最新Gemini的加持下,谷歌搜索將具備多步驟推理能力,可以一次性處理帶有多個(gè)限制條件的長(zhǎng)問(wèn)題、幫助用戶進(jìn)行頭腦風(fēng)暴,并支持視頻搜索,讓用戶通過(guò)拍攝視頻來(lái)搜索解決方案。這些功能將先在美國(guó)推出,谷歌預(yù)計(jì)會(huì)在今年年底前將其帶給超過(guò)10億人。

全面叫板OpenAI!谷歌發(fā)布多模態(tài)大模型全家桶:從AI助手到文生視頻模型

谷歌AI搜索將具備多步驟推理能力。來(lái)源:谷歌

谷歌的Gemini以超長(zhǎng)的上下文窗口而出名。在大會(huì)上,谷歌重點(diǎn)強(qiáng)調(diào)了大模型Gemini 1.5 Pro的多模態(tài)和長(zhǎng)文本能力,為其推出一系列更新。谷歌將向全球150多個(gè)國(guó)家地區(qū)的Gemini Advanced訂閱者提供最新模型、擁有100萬(wàn)個(gè)token的Gemini 1.5 Pro,支持超過(guò)35種語(yǔ)言,定價(jià)為每100萬(wàn)token 3.5美元。

據(jù)皮查伊介紹,Gemini 1.5會(huì)提供“迄今為止所有基礎(chǔ)模型中最長(zhǎng)的上下文窗口”。Gemini 1.5 Pro將在今年晚些時(shí)候?qū)?huì)把窗口進(jìn)一步擴(kuò)大至200萬(wàn)token,拓展同步處理多模態(tài)信息的邊界。

從今年夏天開(kāi)始,Gemini將支持語(yǔ)音實(shí)時(shí)交互,并在今年晚些時(shí)候上線實(shí)時(shí)視頻交互。未來(lái)幾個(gè)月內(nèi),谷歌也將推出類似于GPTs的自定義AI助手功能,名為Gems,可以與整套“谷歌全家桶”聯(lián)動(dòng)。

另外,對(duì)于一些需要快速響應(yīng)的場(chǎng)景,谷歌推出了Gemini 1.5 Flash模型。Flash將是API中速度最快的Gemini模型,針對(duì)大規(guī)模、大批量的高配任務(wù)進(jìn)行了優(yōu)化,也具有100萬(wàn)token的長(zhǎng)上下文窗口。

谷歌也在發(fā)布會(huì)上帶來(lái)了旗下開(kāi)源大模型Gemma的最新版本Gemma 2。據(jù)介紹,Gemma 2采用全新架構(gòu),參數(shù)上達(dá)到27B,擁有突破性的性能和效率。

AI助手Project Astra叫板GPT-4o

OpenAI推出能夠?qū)崿F(xiàn)人類級(jí)別響應(yīng)的智能助手GPT-4o后,谷歌的AI智能體項(xiàng)目Project Astra也重磅登場(chǎng)。

在演示視頻中,Astra能夠通過(guò)手機(jī)攝像頭或智能眼鏡看到的內(nèi)容來(lái)分析響應(yīng)語(yǔ)音命令。它成功地識(shí)別出代碼序列、為電路圖提出改進(jìn)建議、能夠通過(guò)鏡頭“看到”倫敦國(guó)王十字區(qū),并提醒用戶智能眼鏡的放置位置。

全面叫板OpenAI!谷歌發(fā)布多模態(tài)大模型全家桶:從AI助手到文生視頻模型
Project Astra是谷歌對(duì)于未來(lái)AI助手的展望。來(lái)源:谷歌
全面叫板OpenAI!谷歌發(fā)布多模態(tài)大模型全家桶:從AI助手到文生視頻模型

谷歌AI助手將能夠通過(guò)智能眼鏡和用戶一起觀察世界。來(lái)源:谷歌

據(jù)介紹,谷歌在Gemini的基礎(chǔ)上開(kāi)發(fā)了Astra的原型,可以通過(guò)連續(xù)編碼視頻幀、將視頻和語(yǔ)音輸入組合到事件時(shí)間線中以實(shí)現(xiàn)更快地處理信息。通過(guò)語(yǔ)音模型,谷歌也強(qiáng)化了智能助手的說(shuō)話能力,讓其能夠給出更快速的回應(yīng)。

不過(guò),在演示視頻中,谷歌AI助手的回應(yīng)速度似乎還是會(huì)比GPT-4o稍慢一些,語(yǔ)音所表現(xiàn)出的感情色彩也平淡一些。

皮查伊表示,谷歌計(jì)劃從今年開(kāi)始將Astra的功能添加到其Gemini應(yīng)用程序及其產(chǎn)品中。不過(guò),他也強(qiáng)調(diào),雖然最終目標(biāo)是“讓Astra在公司的軟件中實(shí)現(xiàn)無(wú)縫連接”,但該產(chǎn)品將被謹(jǐn)慎推出,并且“商業(yè)化之路將由質(zhì)量驅(qū)動(dòng)”。

除了在AI助手領(lǐng)域的競(jìng)爭(zhēng)外,谷歌還通過(guò)文生視頻模型Veo來(lái)反擊OpenAI的Sora。Veo能夠根據(jù)文字、圖片和視頻的提示來(lái)生成高質(zhì)量的1080p視頻,創(chuàng)作“一致且連貫”的鏡頭,用戶可以對(duì)光照、鏡頭語(yǔ)言、視頻顏色風(fēng)格等進(jìn)行自定義設(shè)置。不過(guò),谷歌沒(méi)有宣布Veo的具體推出時(shí)間。

全面叫板OpenAI!谷歌發(fā)布多模態(tài)大模型全家桶:從AI助手到文生視頻模型
來(lái)源:谷歌I/O主題演講

此外,谷歌還宣布了一系列與圖像、音樂(lè)有關(guān)的生成式AI工具,包括能夠表現(xiàn)更高細(xì)節(jié)水平的文生圖工具Imagen 3,還有與Youtube以及音樂(lè)家合作的AI音樂(lè)工具“AI音樂(lè)沙盒”。

在硬件方面,谷歌將于今年晚些時(shí)候推出交付第六代數(shù)據(jù)中心AI芯片TPU Trillium。皮查伊表示,每塊芯片的計(jì)算性能將比第五代提升4.7倍,谷歌通過(guò)擴(kuò)大芯片的矩陣乘法單元(MXU)和提高整體時(shí)鐘速度來(lái)實(shí)現(xiàn)這一目標(biāo)。此外,第六代將比第五代芯片節(jié)能67%,谷歌還將Trillium芯片的內(nèi)存帶寬提高了一倍。

發(fā)布會(huì)后,著名AI學(xué)者吳恩達(dá)(Andrew Ng)對(duì)谷歌表示祝賀,稱個(gè)人很期待“擁有200萬(wàn)個(gè)token的上下文窗口以及對(duì)設(shè)備上AI進(jìn)行更好支持的Gemini”,認(rèn)為其會(huì)為應(yīng)用程序構(gòu)建者帶來(lái)新的機(jī)會(huì)。

英偉達(dá)高級(jí)研究科學(xué)家范麟熙(Jim Fan)表示:“谷歌正在做的一件事是正確的:他們終于在認(rèn)真將AI整合到搜索中……谷歌最強(qiáng)大的護(hù)城河是分銷。Gemini不一定要成為最好的模型,而是可以成為世界上最常用的模型?!?/p>

此前,在5月9日播出的一檔節(jié)目中,谷歌CEO桑達(dá)爾·皮查伊接受采訪時(shí)談及公司與微軟和OpenAI的競(jìng)爭(zhēng)。他表示,盡管谷歌在聊天機(jī)器人領(lǐng)域的起步較晚,但他對(duì)公司的長(zhǎng)期競(jìng)爭(zhēng)力并不擔(dān)憂,AI浪潮尚處早期。

4月25日,谷歌母公司Alphabet發(fā)布了截至3月31日的2024年第一季度財(cái)報(bào)。財(cái)報(bào)顯示,Alphabet第一季度實(shí)現(xiàn)營(yíng)收805.39億美元,同比增長(zhǎng)15%,是自2022年初以來(lái)公司營(yíng)收增長(zhǎng)最快的一個(gè)季度。非美國(guó)通用會(huì)計(jì)準(zhǔn)則下(Non-GAAP)凈利潤(rùn)為236.62億美元,同比增長(zhǎng)57%;攤薄后每股收益為1.89美元,高于市場(chǎng)預(yù)期的1.51美元。

? 版權(quán)聲明

相關(guān)文章