HugingFace推出開(kāi)源聊天機(jī)器人HugingChat與 ChatGPT 類似
機(jī)器之心編輯部
Hugging Face 基于 300 億參數(shù)的開(kāi)源模型構(gòu)建了聊天機(jī)器人 HuggingChat。
ChatGPT 的問(wèn)世改變了聊天機(jī)器人領(lǐng)域的格局,它強(qiáng)大的功能令人驚嘆,但 OpenAI 幾乎不可能將其開(kāi)源。為了追趕 ChatGPT,開(kāi)源社區(qū)做了很多努力。包括 Meta 開(kāi)源的 LLaMA 系列模型及其二創(chuàng)等等。一些開(kāi)源模型在某些方面的性能已可與 ChatGPT 媲美。
現(xiàn)在,構(gòu)建了大型開(kāi)源社區(qū)的 AI 初創(chuàng)公司 Hugging Face 宣布推出開(kāi)源聊天機(jī)器人 HuggingChat。與 ChatGPT 類似,HuggingChat 可以完成一些復(fù)雜的生成任務(wù),包括編寫(xiě)代碼、起草電子郵件、創(chuàng)作歌詞等等。

HuggingChat 地址:https://huggingface.co/chat/
英偉達(dá) AI 科學(xué)家 Jim Fan 稱贊道:「HuggingChat 是 ChatGPT 的開(kāi)源替代品」,并表示「如果后續(xù)開(kāi)發(fā)成應(yīng)用程序,Hugging Face 比 OpenAI 更具優(yōu)勢(shì)」。

HuggingChat 本質(zhì)上是一個(gè)用戶界面,其背后由非營(yíng)利組織 LAION 開(kāi)發(fā)的對(duì)話模型
OpenAssistant/oasst-sft-6-llama-30b 作支撐,可以借助 Hugging Face 的 API 與現(xiàn)有應(yīng)用程序和服務(wù)集成。oasst-sft-6-llama-30b 是 Open Assistant 團(tuán)隊(duì)基于 Meta 的 LLaMA-30B 微調(diào)的語(yǔ)言模型,擁有 300 億參數(shù)。

OpenAssistant 項(xiàng)目地址:https://github.com/LAION-AI/Open-Assistant
OpenAssistant 項(xiàng)目最初是 2022 年 12 月創(chuàng)建的,其目標(biāo)不只是復(fù)制 ChatGPT,研究團(tuán)隊(duì)還希望 OpenAssistant 能發(fā)展成一個(gè)可在消費(fèi)級(jí)硬件上運(yùn)行的工作助手,小巧而高效。此外,該團(tuán)隊(duì)還構(gòu)建了一個(gè) OpenAssistant Conversation 語(yǔ)料庫(kù),支持 35 種語(yǔ)言。
我們來(lái)看一下基于 OpenAssistant 的 HuggingChat 有哪些具體功能。
HuggingChat功能測(cè)試
我們從基本問(wèn)答、數(shù)學(xué)計(jì)算、代碼生成等方面測(cè)試了 HuggingChat 的能力。
首先,我們?cè)儐?wèn) ChatGPT 對(duì)內(nèi)容生產(chǎn)有哪些影響,HuggingChat 從三個(gè)方面給出了回答:提高內(nèi)容生產(chǎn)效率;信息檢索與摘要;處理簡(jiǎn)單的工作。這個(gè)回答條理清晰,語(yǔ)言流暢。

然后我們?cè)儐?wèn)其模型有多少參數(shù),HuggingChat 非常謹(jǐn)慎,表示「不能透露技術(shù)細(xì)節(jié),但是可以提供 API」。

在數(shù)學(xué)計(jì)算方面,我們測(cè)試發(fā)現(xiàn) HuggingChat 不僅可以計(jì)算出正確結(jié)果,還能清楚地用自然語(yǔ)言描述計(jì)算過(guò)程,符合邏輯:

編程方面,我們用一個(gè)簡(jiǎn)單的例子 —— 判斷一個(gè)數(shù)是否為奇數(shù),測(cè)試了 HuggingChat 生成代碼的能力。結(jié)果表明,HuggingChat 不僅可以生成符合要求的代碼,還對(duì)代碼給出了詳盡正確的解釋。

總體來(lái)看,HuggingChat 具備與 ChatGPT 類似的能力,并且生成結(jié)果可以在一定程度上媲美 ChatGPT。
當(dāng)然,與所有文本生成模型一樣,HuggingChat 生成的回答是隨機(jī)的,可能會(huì)出現(xiàn)錯(cuò)誤或者虛假信息。例如,當(dāng)我們?cè)儐?wèn)推特的 CEO 是誰(shuí),它只答對(duì)了一半:伊隆?馬斯克的確是現(xiàn)任 CEO,但上一任 CEO 并不是 Jack Dorsey。

看來(lái),想讓模型生成的回答準(zhǔn)確、高質(zhì)量,HuggingChat 等聊天機(jī)器人還有很長(zhǎng)的路要走。
HuggingChat 現(xiàn)已開(kāi)啟線上測(cè)試,感興趣的讀者快去試試吧。



?津公網(wǎng)安備12011002023007號(hào)