AIGC周報｜C羅在火星、馬斯克來北京，是真是假？

AI應(yīng)用信息2年前 (2023)更新 10小時前

?AIGC（AI Generated Content）即人工智能生成內(nèi)容。近期爆火的 AI 聊天機器人 ChatGPT，以及 Dall·E 2、Stable Diffusion 等文生圖模型，都屬于 AIGC 的典型案例，它們通過借鑒現(xiàn)有的、人類創(chuàng)造的內(nèi)容來快速完成內(nèi)容創(chuàng)作。

“新晉流量”ChatGPT的背后，AIGC是“曇花一現(xiàn)”？還是將引領(lǐng)人工智能進入新的時代？「AIGC 周報」將從【技術(shù)前瞻】【企業(yè)動態(tài)】【政策法規(guī)】【專家觀點】帶你快速跟進 AIGC 世界。

01?技術(shù)前瞻

1.眼見“不為實”：AI虛假照片能被識別嗎？

照片是人類記錄他們在日常生活中所經(jīng)歷的事情的一種方式，通常被認為是值得信賴的信息來源。然而，人們越來越擔(dān)心 AI 技術(shù)的發(fā)展可能會產(chǎn)生假照片，這可能會造成混亂并降低對照片的信任。

該研究旨在回答，目前最先進的基于 AI 技術(shù)的視覺內(nèi)容生成模型，是否能持續(xù)欺騙人類的眼睛并傳達虛假信息的問題。

通過對五十名參與者進行高質(zhì)量的定量研究，研究團隊發(fā)現(xiàn)，人類在 38.7% 的情況下無法區(qū)分真實照片和 AI 生成的假照片。研究還發(fā)現(xiàn)，一個人的背景，如他們的性別、年齡和對 AIGC 的了解程度，并不顯著影響他們區(qū)分 AI 生成的圖像和真實照片的能力。

然而，研究團隊也觀察到，AI 生成的圖像中往往存在某些缺陷，這些缺陷是人們區(qū)分真實和虛假照片的重要線索。他們希望，這一研究可以提高人們對 AI 生成的圖像的潛在風(fēng)險的認識，并鼓勵進一步的研究來防止虛假信息的傳播。

如果 AI 生成的圖像得到適當(dāng)?shù)氖褂煤捅O(jiān)管，它們有可能徹底改變各個行業(yè)，為人類創(chuàng)造一個更美好的未來。

論文鏈接：

https://arxiv.org/abs/2304.13023

2.ChatVideo，請你描述下視頻中摩托車的外觀

大多數(shù)現(xiàn)有的深度視頻模型只能完成特定的任務(wù)，且輸入輸出空間固定、泛化能力差，難以在真實場景中部署。該研究提出的一種原型系統(tǒng)——ChatVideo，結(jié)合 ChatGPT 和 ViFM（視頻基礎(chǔ)模型）的功能，該系統(tǒng)實現(xiàn)了多模態(tài)和多功能的視頻理解。

具體而言，ChatVideo?建立在以 Tracklet 為中心的范式上，其中 Tracklet 被視為分析視頻內(nèi)容的基本單元，代表一個個連貫的物體或運動模式，并使用各種 ViFM 為外觀、運動等屬性做標(biāo)注，從而實現(xiàn)有效的視頻理解。

上傳一個視頻后，ChatVideo 首先檢測其中的所有軌跡，并識別它們的類型、外觀、動作等；然后，將它們存儲在數(shù)據(jù)庫中，在用戶輸入諸如 “這個視頻中有多少人” 的問題后，數(shù)據(jù)庫管理器將其轉(zhuǎn)換為查詢語句，并從上述數(shù)據(jù)庫中檢索有用信息；最后，ChatGPT 對查詢結(jié)果進行總結(jié)，并將其細化為自然語言描述。

該研究證明了這一系統(tǒng)在解決各種視頻相關(guān)問題和場景方面的有效性，以及在視頻內(nèi)容推薦和在線教育等現(xiàn)實應(yīng)用中的潛力。

論文鏈接：

https://arxiv.org/abs/2304.14407

3.AudioGPT：玩轉(zhuǎn)語音、音樂和聲音

大型語言模型在各種領(lǐng)域和任務(wù)中表現(xiàn)出非凡的能力，挑戰(zhàn)了我們對學(xué)習(xí)和認知的理解。盡管最近取得了成功，但目前的LLMs沒有能力處理復(fù)雜的音頻信息或進行口語對話。

在這項工作中，研究團隊提出了一個名為 AudioGPT 的多模式人工智能系統(tǒng)，該系統(tǒng)對大型語言模型進行了補充：（1）基礎(chǔ)模型來處理復(fù)雜的音頻信息并解決眾多的理解和生成任務(wù)；（2）輸入/輸出接口（ASR、TTS）來支持口語對話。

隨著評估人類意圖理解和與基礎(chǔ)模型合作的多模態(tài)大型語言模型的需求不斷增加，研究團隊概述了原則和過程，并從一致性、能力和穩(wěn)健性方面測試了 AudioGPT。

實驗結(jié)果證明，AudioGPT 在解決多輪對話中的語音、音樂、聲音理解與生成等人工智能任務(wù)方面的能力，使人類能夠以前所未有的輕松方式創(chuàng)造豐富多樣的音頻內(nèi)容。

論文鏈接：

https://arxiv.org/abs/2304.12995

4.RoboGPT：讓人類更信任機器

在人工智能時代，隨著機器人越來越多地參與到人類生活的各個方面，人類機器人協(xié)作變得越來越重要。然而，人類操作者對機器人的信任問題仍然是一個重要的問題，主要是由于人類和機器人之間缺乏足夠的語義理解和溝通。

ChatGPT等大型語言模型（LLMs）的出現(xiàn)，為開發(fā)一種互動的、可交流的、強大的人類-機器人協(xié)作方法提供了機會。

該研究探討了ChatGPT對人機協(xié)作裝配任務(wù)中信任的影響。研究人員設(shè)計了一個名為RoboGPT的機器人控制系統(tǒng)，使用ChatGPT來控制一個7自由度的機械臂，幫助人類操作者取、放工具，而人類操作者可以使用自然語言與機械臂交流，并控制它。

實驗表明，在機器人中加入ChatGPT可以顯著提高人類與機器人合作的信任度，這可以歸因于機器人能夠更有效地與人類溝通。

此外，ChatGPT理解人類語言的細微差別并做出適當(dāng)反應(yīng)的能力，有助于建立更自然和直觀的人機互動。

論文鏈接：

https://arxiv.org/abs/2304.12529

5.將多個ChatGPT聯(lián)合起來：更多大腦更多智慧

基于對話的語言模型，具有與用戶交互的能力，能完成一系列由定制指令提示的具有挑戰(zhàn)性的任務(wù)，被認為是?AI?領(lǐng)域的一個巨大里程碑。然而，即使像?ChatGPT?這樣出色的語言模型仍然有改進的空間。

如下圖，ChatGPT?對同一問題的回答不一致，無法像人類一樣進行思考。

該研究提出了 ChatLLM 網(wǎng)絡(luò)，允許多個基于對話的語言模型進行交互，提供反饋，并一起思考。

具體而言，盡管 ChatGPT 可能對同一問題具有不同的觀點，但通過?ChatGPT?整合這些不同的觀點，ChatLLM 網(wǎng)絡(luò)系統(tǒng)可以更客觀、更全面地進行決策。

此外，為更新網(wǎng)絡(luò)內(nèi)的 ChatGPT，研究人員還設(shè)計了一種基于語言的反饋機制（效果類似于反向傳播）。

基于兩個數(shù)據(jù)集的實驗表明，ChatLLM 網(wǎng)絡(luò)在解決上述問題方面表現(xiàn)得更好。

論文鏈接：

https://arxiv.org/abs/2304.12998

6.將人P入任意場景

給定一張標(biāo)有區(qū)域的場景圖像和一個人物圖像，AI模型可以將人物插入場景中，同時在給定場景上下文的情況下推斷出一組逼真的姿勢。

該研究采用了自監(jiān)督學(xué)習(xí)的方法，通過學(xué)習(xí)將人物重新定位到視頻片段中完成這一任務(wù)。研究人員在 240 萬個視頻片段的數(shù)據(jù)集上訓(xùn)練了一個大規(guī)模的擴散模型，該模型在遵守場景上下文的同時產(chǎn)生了各種可能的姿勢。

研究人員的方法不僅可以推斷逼真的人物外貌和更自然的人物-場景交互，而且還能在不需要預(yù)先給定條件的情況下生成逼真的人物和場景，并支持交互式編輯。

下圖展示了給定一個有蒙版的場景圖像（第一行）和一個參考人物（第一列），模型可以成功地將該人物插入場景圖像中，在給定場景上下文的情況下推斷出可能的姿勢，適當(dāng)?shù)胤胖萌宋?，并協(xié)調(diào)插入。當(dāng)沒有給定一個參考人物的圖像時，模型可以部分地完成一個人物（最后一列），也可以虛構(gòu)一個人物（最后一行）。

量化評估表明，該方法比之前方法合成的人物外貌更逼真，人物-場景交互更自然。

論文鏈接：

https://arxiv.org/abs/2304.14406

02?企業(yè)動態(tài)

1.微軟 AI設(shè)計工具推出公測版

據(jù)財聯(lián)社報道，4 月 27 日，微軟的 AI 設(shè)計工具 Microsoft Designer 推出了一版公開預(yù)覽版。Microsoft Designer 于去年 10 月發(fā)布，是一款類似 Canva 的在線平面設(shè)計工具，可以生成演示文稿、海報、數(shù)字明信片、邀請函、圖形等設(shè)計，并在社交媒體和其他渠道上分享。Microsoft Designer 搭載了 OpenAI 的 DALL-E 2，可以根據(jù)用戶輸入的任意文字指令，生成相關(guān)內(nèi)容。

在公測版本期間，這一工具將是免費的，并且用戶可以直接在微軟 Edge 瀏覽器的側(cè)邊欄中進入。若這款應(yīng)用程序全面推出，它將包含在 Microsoft 365 的個人和家庭訂閱中，并為非訂閱用戶提供“部分”免費功能。

2.OpenAI：很快將推出ChatGPT企業(yè)版訂閱服務(wù)

4 月 25 日，OpenAI 在官網(wǎng)發(fā)布公告，表示公司正在開發(fā)新的“ChatGPT Business”訂閱服務(wù)，供那些希望掌控數(shù)據(jù)的專業(yè)人士以及尋求管理終端用戶的企業(yè)使用。至于企業(yè)最擔(dān)心的泄密風(fēng)險，OpenAI 的新功能做了針對性的處理。當(dāng)使用者“關(guān)閉聊天記錄”后，與機器人的對話將不再保存到歷史會話列表中，OpenAI 也不會使用其中的數(shù)據(jù)訓(xùn)練和改進 ChatGPT 的模型。

3.Hugging Face發(fā)布開源聊天機器人，對標(biāo)ChatGPT

據(jù)科創(chuàng)板日報報道，人工智能初創(chuàng)公司 Hugging Face 發(fā)布一款開源 AI 聊天機器人 HuggingChat，對標(biāo) ChatGPT。HuggingChat 可以完成與 ChatGPT 類似的任務(wù)，反應(yīng)速度與 GPT-3.5-turbo 相當(dāng)。目前，用戶可以通過網(wǎng)絡(luò)界面測試 HuggingChat，也可以通過使用 Hugging Face 的 API 將這款 AI 聊天機器人集成到其他應(yīng)用程序和服務(wù)中。

4.阿里“千問”大模型：為機器人注入靈魂？

據(jù)科創(chuàng)板日報報道，4 月 27 日，在第六屆數(shù)字中國建設(shè)峰會上，阿里巴巴董事會主席兼 CEO 張勇透露，阿里云工程師正在試驗將千問大模型接入工業(yè)機器人，在釘釘對話框輸入人類語言，可遠程指揮機器人工作。

阿里云當(dāng)天發(fā)布的一個演示視頻，展現(xiàn)了這一實驗成果?！拔铱柿耍尹c東西喝吧?！惫こ處熗ㄟ^釘釘對話框向機器人發(fā)出指令后，千問大模型立即理解了指令內(nèi)容并回答，“好的，我找找有什么喝的。”隨后，千問大模型在后臺自動編寫了一組代碼發(fā)給機器人，機器人開始識別周邊環(huán)境，從附近的桌上找到一瓶水，并自動完成移動、抓取、配送等一系列動作，順利遞送給工程師。

張勇表示，“制造業(yè)是 AI 大模型的重要戰(zhàn)場，未來 10 年最大的機會就在于云、AI 與物理世界機器的融合，機器人取水只是第一步，未來能與人直接對話的智能機器人，將改變整個工廠的形態(tài)?！?/p>

5.普華永道：將向生成式AI投資10億美元

據(jù)華爾街日報，普華永道計劃在未來三年內(nèi)向旗下美國業(yè)務(wù)的生成式 AI 技術(shù)投資 10 億美元，與微軟和 OpenAI 合作，使其稅收、審計和咨詢服務(wù)的各個方面實現(xiàn)自動化。這家會計和咨詢巨頭表示，多年投資計劃包括為招聘更多的 AI 相關(guān)員工和培訓(xùn)現(xiàn)有員工的 AI 能力提供資金，同時瞄準 AI 軟件制造商進行潛在收購。

03?政策法規(guī)

1.歐盟為生成式AI提出新的版權(quán)規(guī)則

歐洲議會成員同意將人工智能法案推進到下一階段，即三方會議。根據(jù)提案，人工智能工具將根據(jù)其感知風(fēng)險級別進行分類：從最低到有限、高和不可接受。令人擔(dān)憂的領(lǐng)域可能包括生物識別監(jiān)控、傳播錯誤信息或歧視性語言。

雖然高風(fēng)險工具不會被禁止，但使用它們的人需要在操作中保持高度透明。部署生成式 AI 工具（例如 ChatGPT 或圖像生成器 Midjourney）的公司還必須披露用于開發(fā)其系統(tǒng)的任何受版權(quán)保護的材料。據(jù)熟悉討論的消息人士稱，該條款是在過去兩周內(nèi)擬定的。

2.可能改變生成式AI的安迪·沃霍爾版權(quán)案

科技媒體 WIRED 報道，今年春天，美國最高法院將對安迪·沃霍爾視覺藝術(shù)基金會訴戈德史密斯一案作出裁決，該案將決定沃霍爾基于戈德史密斯攝影作品創(chuàng)作的一系列圖像，在《版權(quán)法》的合理使用原則下，是否已經(jīng)足以被稱作“新作品”。

WIRED 表示，“合理使用”原則依賴于法官在評估作品是“變革性的”，還是僅僅是復(fù)制時考慮的四個標(biāo)準：作品的目的和特征、作品的性質(zhì)、從原始作品中獲取的數(shù)量以及新作品對潛在市場的影響。

目前，圖片生成式 AI 開發(fā)公司 Midjourney、Stability AI 等正在面臨藝術(shù)家的起訴，認為這些公司開發(fā)的工具在未經(jīng)許可的情況下竊取藝術(shù)家的作品來訓(xùn)練他們的模型。對于這些指控，這三家公司都提出了駁回動議，聲稱人工智能生成的圖像與他們訓(xùn)練過的作品幾乎沒有相似之處，藝術(shù)家也沒有具體說明哪些作品受到了侵權(quán)。

安迪·沃霍爾版權(quán)案的核心在于“合理使用”，即法院必須判定，沃霍爾的作品是對戈德史密斯作品的重大改造，并應(yīng)當(dāng)受到保護，還是侵犯了版權(quán)。這對于當(dāng)下版權(quán)法如何適用于生成式 AI 有著至關(guān)重要的參考意義。

04?專家觀點

1.亞馬遜云科技陳曉建：生成式AI浪潮才剛開始

據(jù)科創(chuàng)板日報報道，亞馬遜云科技大中華區(qū)產(chǎn)品部總經(jīng)理陳曉建表示，“云計算的價值在于推動生成式AI的普惠化……在通用模型的基礎(chǔ)上，發(fā)展適合自己場景的細分行業(yè)模型，這是大模型未來的發(fā)展格局。”

陳曉建認為，并不能單純從規(guī)模、參數(shù)來判斷模型的價值?！安簧傩∧Ｐ鸵簿邆淞讼喈?dāng)好的能力，以非常少的資源就可以進行單機部署。未來這一兩年內(nèi)，會看到更多并非特別大的模型，但在某些能力上表現(xiàn)優(yōu)秀?！?/p>

2.周鴻祎談“萬模大戰(zhàn)”：目前沒有一家能夠遙遙領(lǐng)先、一統(tǒng)江湖

對于目前行業(yè)熱議的“萬模大戰(zhàn)”，周鴻祎認為，各家大模型能力相差無幾，目前沒有一家能夠遙遙領(lǐng)先、一統(tǒng)江湖，最后能夠勝出的決定性因素是“場景”，擁有場景的公司才能在未來的大模型產(chǎn)業(yè)競爭中占據(jù)領(lǐng)先地位。周鴻祎表示，發(fā)展大模型的關(guān)鍵是“六大”，即大數(shù)據(jù)、大標(biāo)注、大算力、大算法、大模型、大流量，其中最重要的是大流量，大模型只有在用戶不斷使用和反饋下，才能不斷改進。

3.思科：AI軟件讓網(wǎng)絡(luò)釣魚詐騙更難防

思科警告稱，OpenAI的ChatGPT等AI軟件將使網(wǎng)絡(luò)釣魚詐騙更難被發(fā)現(xiàn)，并力促企業(yè)采用新的防御措施。大約80%的計算機系統(tǒng)非法訪問是通過網(wǎng)絡(luò)釣魚進行，黑客通過網(wǎng)絡(luò)釣魚向人們發(fā)送電子郵件或文本，誘使他們打開惡意鏈接。思科安全與協(xié)作部門負責(zé)人Jeetu Patel表示，人工智能工具可以快速定制這些信息，吸引更多人參與黑客的計劃，“攻擊將變得更加定制化”。

4.華泰證券：AI大模型落地有望推動座艙人機主動式交互時代到來

智能座艙配置性價比較高，已經(jīng)成為車企的核心競爭點之一，隨著座艙硬件規(guī)?；b車，蔚小理、嵐圖、極狐等新勢力開始注重座艙多模態(tài)交互，通過集成語音/手勢/觸控打造智能化差異體驗。華泰證券認為AI大模型的落地，將加速賦能座艙語音助手向“AI智能管家”升級，有望推動座艙人機主動式交互時代的到來。目前投資機會建議率先關(guān)注視聽觸硬件投資機會。

# AI應(yīng)用信息 # AI # AIGC # AI模型 # AI軟件 # ChatGPT # GPT # Midjourney # OpenAI # 云計算 # 亞馬遜 # 人工智能 # 人工智能法 # 周鴻祎 # 大數(shù)據(jù)# 微軟 # 文生圖 # 瀏覽器 # 生成式AI # 聊天機器人 # 阿里云

? 版權(quán)聲明

本文轉(zhuǎn)載自互聯(lián)網(wǎng)、僅供學(xué)習(xí)交流，內(nèi)容版權(quán)歸原作者所有，如涉作品、版權(quán)或其它疑問請聯(lián)系AIGC工具導(dǎo)航或點擊刪除。

亚洲av无码成h人动漫无遮挡,特级欧美aaaaaaa免费观看,丝袜制服av熟女♀,亚洲avav天堂av在线网阿v,少妇人妻真实偷人精品视频

AIGC周報｜C羅在火星、馬斯克來北京，是真是假？

科大訊飛推出“星火”認知大模型，將應(yīng)用于智能座艙

火星表面地形3d模型,火星3d模型

相關(guān)文章

領(lǐng)新人體驗大禮包

熱門文章

熱門網(wǎng)址

亚洲av无码成h人动漫无遮挡,特级欧美aaaaaaa免费观看,丝袜制服av熟女♀,亚洲avav天堂av在线网阿v,少妇人妻真实偷人精品视频

AIGC周報｜C羅在火星、馬斯克來北京，是真是假？

科大訊飛推出“星火”認知大模型，將應(yīng)用于智能座艙

火星表面地形3d模型,火星3d模型

相關(guān)文章

領(lǐng)新人體驗大禮包

熱門文章

熱門網(wǎng)址

AIGC周報｜C羅在火星、馬斯克來北京，是真是假？