亚洲av无码成h人动漫无遮挡,特级欧美aaaaaaa免费观看,丝袜制服av熟女♀,亚洲avav天堂av在线网阿v,少妇人妻真实偷人精品视频

AIGC周報|C羅在火星、馬斯克來北京,是真是假?

AIGC周報|C羅在火星、馬斯克來北京,是真是假?

?AIGCAI Generated Content)即人工智能生成內(nèi)容。近期爆火的 AI 聊天機器人 ChatGPT,以及 Dall·E 2、Stable Diffusion 等文生圖模型,都屬于 AIGC 的典型案例,它們通過借鑒現(xiàn)有的、人類創(chuàng)造的內(nèi)容來快速完成內(nèi)容創(chuàng)作。

“新晉流量”ChatGPT的背后,AIGC是“曇花一現(xiàn)”?還是將引領(lǐng)人工智能進入新的時代?「AIGC 周報」將從【技術(shù)前瞻】【企業(yè)動態(tài)】【政策法規(guī)】【專家觀點】帶你快速跟進 AIGC 世界。

01?技術(shù)前瞻

1.眼見“不為實”:AI虛假照片能被識別嗎?

照片是人類記錄他們在日常生活中所經(jīng)歷的事情的一種方式,通常被認為是值得信賴的信息來源。然而,人們越來越擔(dān)心 AI 技術(shù)的發(fā)展可能會產(chǎn)生假照片,這可能會造成混亂并降低對照片的信任。

AIGC周報|C羅在火星、馬斯克來北京,是真是假?

該研究旨在回答,目前最先進的基于 AI 技術(shù)的視覺內(nèi)容生成模型,是否能持續(xù)欺騙人類的眼睛并傳達虛假信息的問題。

通過對五十名參與者進行高質(zhì)量的定量研究,研究團隊發(fā)現(xiàn),人類在 38.7% 的情況下無法區(qū)分真實照片和 AI 生成的假照片。研究還發(fā)現(xiàn),一個人的背景,如他們的性別、年齡和對 AIGC 的了解程度,并不顯著影響他們區(qū)分 AI 生成的圖像和真實照片的能力。

然而,研究團隊也觀察到,AI 生成的圖像中往往存在某些缺陷,這些缺陷是人們區(qū)分真實和虛假照片的重要線索。他們希望,這一研究可以提高人們對 AI 生成的圖像的潛在風(fēng)險的認識,并鼓勵進一步的研究來防止虛假信息的傳播。

如果 AI 生成的圖像得到適當(dāng)?shù)氖褂煤捅O(jiān)管,它們有可能徹底改變各個行業(yè),為人類創(chuàng)造一個更美好的未來。

論文鏈接:

https://arxiv.org/abs/2304.13023

2.ChatVideo,請你描述下視頻中摩托車的外觀

大多數(shù)現(xiàn)有的深度視頻模型只能完成特定的任務(wù),且輸入輸出空間固定、泛化能力差,難以在真實場景中部署。該研究提出的一種原型系統(tǒng)——ChatVideo,結(jié)合 ChatGPT 和 ViFM(視頻基礎(chǔ)模型)的功能,該系統(tǒng)實現(xiàn)了多模態(tài)和多功能的視頻理解。

具體而言,ChatVideo?建立在以 Tracklet 為中心的范式上,其中 Tracklet 被視為分析視頻內(nèi)容的基本單元,代表一個個連貫的物體或運動模式,并使用各種 ViFM 為外觀、運動等屬性做標(biāo)注,從而實現(xiàn)有效的視頻理解。

上傳一個視頻后,ChatVideo 首先檢測其中的所有軌跡,并識別它們的類型、外觀、動作等;然后,將它們存儲在數(shù)據(jù)庫中,在用戶輸入諸如 “這個視頻中有多少人” 的問題后,數(shù)據(jù)庫管理器將其轉(zhuǎn)換為查詢語句,并從上述數(shù)據(jù)庫中檢索有用信息;最后,ChatGPT 對查詢結(jié)果進行總結(jié),并將其細化為自然語言描述。

該研究證明了這一系統(tǒng)在解決各種視頻相關(guān)問題和場景方面的有效性,以及在視頻內(nèi)容推薦和在線教育等現(xiàn)實應(yīng)用中的潛力。

AIGC周報|C羅在火星、馬斯克來北京,是真是假?

論文鏈接:

https://arxiv.org/abs/2304.14407

3.AudioGPT:玩轉(zhuǎn)語音、音樂和聲音

大型語言模型在各種領(lǐng)域和任務(wù)中表現(xiàn)出非凡的能力,挑戰(zhàn)了我們對學(xué)習(xí)和認知的理解。盡管最近取得了成功,但目前的LLMs沒有能力處理復(fù)雜的音頻信息或進行口語對話。

在這項工作中,研究團隊提出了一個名為 AudioGPT 的多模式人工智能系統(tǒng),該系統(tǒng)對大型語言模型進行了補充:(1)基礎(chǔ)模型來處理復(fù)雜的音頻信息并解決眾多的理解和生成任務(wù);(2)輸入/輸出接口(ASR、TTS)來支持口語對話。

隨著評估人類意圖理解和與基礎(chǔ)模型合作的多模態(tài)大型語言模型的需求不斷增加,研究團隊概述了原則和過程,并從一致性、能力和穩(wěn)健性方面測試了 AudioGPT。

AIGC周報|C羅在火星、馬斯克來北京,是真是假?

實驗結(jié)果證明,AudioGPT 在解決多輪對話中的語音、音樂、聲音理解與生成等人工智能任務(wù)方面的能力,使人類能夠以前所未有的輕松方式創(chuàng)造豐富多樣的音頻內(nèi)容。

論文鏈接:

https://arxiv.org/abs/2304.12995

4.RoboGPT:讓人類更信任機器

在人工智能時代,隨著機器人越來越多地參與到人類生活的各個方面,人類機器人協(xié)作變得越來越重要。然而,人類操作者對機器人的信任問題仍然是一個重要的問題,主要是由于人類和機器人之間缺乏足夠的語義理解和溝通。

ChatGPT等大型語言模型(LLMs)的出現(xiàn),為開發(fā)一種互動的、可交流的、強大的人類-機器人協(xié)作方法提供了機會。

該研究探討了ChatGPT對人機協(xié)作裝配任務(wù)中信任的影響。研究人員設(shè)計了一個名為RoboGPT的機器人控制系統(tǒng),使用ChatGPT來控制一個7自由度的機械臂,幫助人類操作者取、放工具,而人類操作者可以使用自然語言與機械臂交流,并控制它。

AIGC周報|C羅在火星、馬斯克來北京,是真是假?

實驗表明,在機器人中加入ChatGPT可以顯著提高人類與機器人合作的信任度,這可以歸因于機器人能夠更有效地與人類溝通。

此外,ChatGPT理解人類語言的細微差別并做出適當(dāng)反應(yīng)的能力,有助于建立更自然和直觀的人機互動。

論文鏈接:

https://arxiv.org/abs/2304.12529

5.將多個ChatGPT聯(lián)合起來:更多大腦更多智慧

基于對話的語言模型,具有與用戶交互的能力,能完成一系列由定制指令提示的具有挑戰(zhàn)性的任務(wù),被認為是?AI?領(lǐng)域的一個巨大里程碑。然而,即使像?ChatGPT?這樣出色的語言模型仍然有改進的空間。

如下圖,ChatGPT?對同一問題的回答不一致,無法像人類一樣進行思考。

AIGC周報|C羅在火星、馬斯克來北京,是真是假?

該研究提出了 ChatLLM 網(wǎng)絡(luò),允許多個基于對話的語言模型進行交互,提供反饋,并一起思考。

具體而言,盡管 ChatGPT 可能對同一問題具有不同的觀點,但通過?ChatGPT?整合這些不同的觀點,ChatLLM 網(wǎng)絡(luò)系統(tǒng)可以更客觀、更全面地進行決策。

此外,為更新網(wǎng)絡(luò)內(nèi)的 ChatGPT,研究人員還設(shè)計了一種基于語言的反饋機制(效果類似于反向傳播)。

基于兩個數(shù)據(jù)集的實驗表明,ChatLLM 網(wǎng)絡(luò)在解決上述問題方面表現(xiàn)得更好。

論文鏈接:

https://arxiv.org/abs/2304.12998

6.將人P入任意場景

給定一張標(biāo)有區(qū)域的場景圖像和一個人物圖像,AI模型可以將人物插入場景中,同時在給定場景上下文的情況下推斷出一組逼真的姿勢。

該研究采用了自監(jiān)督學(xué)習(xí)的方法,通過學(xué)習(xí)將人物重新定位到視頻片段中完成這一任務(wù)。研究人員在 240 萬個視頻片段的數(shù)據(jù)集上訓(xùn)練了一個大規(guī)模的擴散模型,該模型在遵守場景上下文的同時產(chǎn)生了各種可能的姿勢。

研究人員的方法不僅可以推斷逼真的人物外貌和更自然的人物-場景交互,而且還能在不需要預(yù)先給定條件的情況下生成逼真的人物和場景,并支持交互式編輯。

下圖展示了給定一個有蒙版的場景圖像(第一行)和一個參考人物(第一列),模型可以成功地將該人物插入場景圖像中,在給定場景上下文的情況下推斷出可能的姿勢,適當(dāng)?shù)胤胖萌宋?,并協(xié)調(diào)插入。當(dāng)沒有給定一個參考人物的圖像時,模型可以部分地完成一個人物(最后一列),也可以虛構(gòu)一個人物(最后一行)。

AIGC周報|C羅在火星、馬斯克來北京,是真是假?

量化評估表明,該方法比之前方法合成的人物外貌更逼真,人物-場景交互更自然。

論文鏈接:

https://arxiv.org/abs/2304.14406

02?企業(yè)動態(tài)

1.微軟AI設(shè)計工具推出公測版

據(jù)財聯(lián)社報道,4 月 27 日,微軟的 AI 設(shè)計工具 Microsoft Designer 推出了一版公開預(yù)覽版。Microsoft Designer 于去年 10 月發(fā)布,是一款類似 Canva 的在線平面設(shè)計工具,可以生成演示文稿、海報、數(shù)字明信片、邀請函、圖形等設(shè)計,并在社交媒體和其他渠道上分享。Microsoft Designer 搭載了 OpenAI 的 DALL-E 2,可以根據(jù)用戶輸入的任意文字指令,生成相關(guān)內(nèi)容。

在公測版本期間,這一工具將是免費的,并且用戶可以直接在微軟 Edge 瀏覽器的側(cè)邊欄中進入。若這款應(yīng)用程序全面推出,它將包含在 Microsoft 365 的個人和家庭訂閱中,并為非訂閱用戶提供“部分”免費功能。

2.OpenAI:很快將推出ChatGPT企業(yè)版訂閱服務(wù)

4 月 25 日,OpenAI 在官網(wǎng)發(fā)布公告,表示公司正在開發(fā)新的“ChatGPT Business”訂閱服務(wù),供那些希望掌控數(shù)據(jù)的專業(yè)人士以及尋求管理終端用戶的企業(yè)使用。至于企業(yè)最擔(dān)心的泄密風(fēng)險,OpenAI 的新功能做了針對性的處理。當(dāng)使用者“關(guān)閉聊天記錄”后,與機器人的對話將不再保存到歷史會話列表中,OpenAI 也不會使用其中的數(shù)據(jù)訓(xùn)練和改進 ChatGPT 的模型。

3.Hugging Face發(fā)布開源聊天機器人,對標(biāo)ChatGPT

據(jù)科創(chuàng)板日報報道,人工智能初創(chuàng)公司 Hugging Face 發(fā)布一款開源 AI 聊天機器人 HuggingChat,對標(biāo) ChatGPT。HuggingChat 可以完成與 ChatGPT 類似的任務(wù),反應(yīng)速度與 GPT-3.5-turbo 相當(dāng)。目前,用戶可以通過網(wǎng)絡(luò)界面測試 HuggingChat,也可以通過使用 Hugging Face 的 API 將這款 AI 聊天機器人集成到其他應(yīng)用程序和服務(wù)中。

4.阿里“千問”大模型:為機器人注入靈魂?

據(jù)科創(chuàng)板日報報道,4 月 27 日,在第六屆數(shù)字中國建設(shè)峰會上,阿里巴巴董事會主席兼 CEO 張勇透露,阿里云工程師正在試驗將千問大模型接入工業(yè)機器人,在釘釘對話框輸入人類語言,可遠程指揮機器人工作。

阿里云當(dāng)天發(fā)布的一個演示視頻,展現(xiàn)了這一實驗成果?!拔铱柿耍尹c東西喝吧?!惫こ處熗ㄟ^釘釘對話框向機器人發(fā)出指令后,千問大模型立即理解了指令內(nèi)容并回答,“好的,我找找有什么喝的。”隨后,千問大模型在后臺自動編寫了一組代碼發(fā)給機器人,機器人開始識別周邊環(huán)境,從附近的桌上找到一瓶水,并自動完成移動、抓取、配送等一系列動作,順利遞送給工程師。

張勇表示,“制造業(yè)是 AI 大模型的重要戰(zhàn)場,未來 10 年最大的機會就在于云、AI 與物理世界機器的融合,機器人取水只是第一步,未來能與人直接對話的智能機器人,將改變整個工廠的形態(tài)?!?/p>

5.普華永道:將向生成式AI投資10億美元

據(jù)華爾街日報,普華永道計劃在未來三年內(nèi)向旗下美國業(yè)務(wù)的生成式 AI 技術(shù)投資 10 億美元,與微軟和 OpenAI 合作,使其稅收、審計和咨詢服務(wù)的各個方面實現(xiàn)自動化。這家會計和咨詢巨頭表示,多年投資計劃包括為招聘更多的 AI 相關(guān)員工和培訓(xùn)現(xiàn)有員工的 AI 能力提供資金,同時瞄準 AI 軟件制造商進行潛在收購。

03?政策法規(guī)

1.歐盟為生成式AI提出新的版權(quán)規(guī)則

歐洲議會成員同意將人工智能法案推進到下一階段,即三方會議。根據(jù)提案,人工智能工具將根據(jù)其感知風(fēng)險級別進行分類:從最低到有限、高和不可接受。令人擔(dān)憂的領(lǐng)域可能包括生物識別監(jiān)控、傳播錯誤信息或歧視性語言。

雖然高風(fēng)險工具不會被禁止,但使用它們的人需要在操作中保持高度透明。部署生成式 AI 工具(例如 ChatGPT 或圖像生成器 Midjourney)的公司還必須披露用于開發(fā)其系統(tǒng)的任何受版權(quán)保護的材料。據(jù)熟悉討論的消息人士稱,該條款是在過去兩周內(nèi)擬定的。

2.可能改變生成式AI的安迪·沃霍爾版權(quán)案

科技媒體 WIRED 報道,今年春天,美國最高法院將對安迪·沃霍爾視覺藝術(shù)基金會訴戈德史密斯一案作出裁決,該案將決定沃霍爾基于戈德史密斯攝影作品創(chuàng)作的一系列圖像,在《版權(quán)法》的合理使用原則下,是否已經(jīng)足以被稱作“新作品”。

WIRED 表示,“合理使用”原則依賴于法官在評估作品是“變革性的”,還是僅僅是復(fù)制時考慮的四個標(biāo)準:作品的目的和特征、作品的性質(zhì)、從原始作品中獲取的數(shù)量以及新作品對潛在市場的影響。

目前,圖片生成式 AI 開發(fā)公司 Midjourney、Stability AI 等正在面臨藝術(shù)家的起訴,認為這些公司開發(fā)的工具在未經(jīng)許可的情況下竊取藝術(shù)家的作品來訓(xùn)練他們的模型。對于這些指控,這三家公司都提出了駁回動議,聲稱人工智能生成的圖像與他們訓(xùn)練過的作品幾乎沒有相似之處,藝術(shù)家也沒有具體說明哪些作品受到了侵權(quán)。

安迪·沃霍爾版權(quán)案的核心在于“合理使用”,即法院必須判定,沃霍爾的作品是對戈德史密斯作品的重大改造,并應(yīng)當(dāng)受到保護,還是侵犯了版權(quán)。這對于當(dāng)下版權(quán)法如何適用于生成式 AI 有著至關(guān)重要的參考意義。

04?專家觀點

1.亞馬遜云科技陳曉建:生成式AI浪潮才剛開始

據(jù)科創(chuàng)板日報報道,亞馬遜云科技大中華區(qū)產(chǎn)品部總經(jīng)理陳曉建表示,“云計算的價值在于推動生成式AI的普惠化……在通用模型的基礎(chǔ)上,發(fā)展適合自己場景的細分行業(yè)模型,這是大模型未來的發(fā)展格局。”

陳曉建認為,并不能單純從規(guī)模、參數(shù)來判斷模型的價值?!安簧傩∧P鸵簿邆淞讼喈?dāng)好的能力,以非常少的資源就可以進行單機部署。未來這一兩年內(nèi),會看到更多并非特別大的模型,但在某些能力上表現(xiàn)優(yōu)秀?!?/p>

2.周鴻祎談“萬模大戰(zhàn)”:目前沒有一家能夠遙遙領(lǐng)先、一統(tǒng)江湖

對于目前行業(yè)熱議的“萬模大戰(zhàn)”,周鴻祎認為,各家大模型能力相差無幾,目前沒有一家能夠遙遙領(lǐng)先、一統(tǒng)江湖,最后能夠勝出的決定性因素是“場景”,擁有場景的公司才能在未來的大模型產(chǎn)業(yè)競爭中占據(jù)領(lǐng)先地位。周鴻祎表示,發(fā)展大模型的關(guān)鍵是“六大”,即大數(shù)據(jù)、大標(biāo)注、大算力、大算法、大模型、大流量,其中最重要的是大流量,大模型只有在用戶不斷使用和反饋下,才能不斷改進。

3.思科:AI軟件讓網(wǎng)絡(luò)釣魚詐騙更難防

思科警告稱,OpenAI的ChatGPT等AI軟件將使網(wǎng)絡(luò)釣魚詐騙更難被發(fā)現(xiàn),并力促企業(yè)采用新的防御措施。大約80%的計算機系統(tǒng)非法訪問是通過網(wǎng)絡(luò)釣魚進行,黑客通過網(wǎng)絡(luò)釣魚向人們發(fā)送電子郵件或文本,誘使他們打開惡意鏈接。思科安全與協(xié)作部門負責(zé)人Jeetu Patel表示,人工智能工具可以快速定制這些信息,吸引更多人參與黑客的計劃,“攻擊將變得更加定制化”。

4.華泰證券:AI大模型落地有望推動座艙人機主動式交互時代到來

智能座艙配置性價比較高,已經(jīng)成為車企的核心競爭點之一,隨著座艙硬件規(guī)?;b車,蔚小理、嵐圖、極狐等新勢力開始注重座艙多模態(tài)交互,通過集成語音/手勢/觸控打造智能化差異體驗。華泰證券認為AI大模型的落地,將加速賦能座艙語音助手向“AI智能管家”升級,有望推動座艙人機主動式交互時代的到來。目前投資機會建議率先關(guān)注視聽觸硬件投資機會。

? 版權(quán)聲明

相關(guān)文章