OpenAI 官方提示工程指南中文版
這份指南分享了如何更有效地利用像如 GPT-4 這樣的大語言模型(有時(shí)候也叫 GPT 模型)來獲得更好的結(jié)果。介紹的方法可以相互結(jié)合,以發(fā)揮更大的作用。我們鼓勵(lì)你進(jìn)行實(shí)驗(yàn),尋找最適合你的技巧。
目前,這里演示的一些示例只適用于最先進(jìn)的模型?gpt-4
。一般來說,如果你嘗試的模型在某個(gè)任務(wù)上未能成功,并且有更高級(jí)的模型可供使用,不妨用更高級(jí)的模型再嘗試一次。
六大策略助你獲得更佳結(jié)果
撰寫清晰的指令
這些模型并不會(huì)讀心術(shù),無法猜到你的想法。如果模型的輸出內(nèi)容過長,你可以要求它簡短回答。如果模型輸出內(nèi)容過于簡單,你可以要求使用更專業(yè)的水平寫作。如果你對(duì)輸出格式不滿意,可以直接展示你期望的格式。最好就是讓模型不需要去猜你想要什么,這樣你最有可能獲得想要的結(jié)果。
技巧:
- 在查詢中添加詳細(xì)信息,以獲得更準(zhǔn)確的答案
- 請(qǐng)求模型扮演特定角色
- 使用分隔符來清晰區(qū)分輸入的不同部分
- 明確指出完成任務(wù)需要的步驟
- 提供實(shí)例作為參考
- 明確指定希望輸出的長度
提供參考文本
語言模型可能會(huì)自信地編造出虛假答案,特別是當(dāng)回應(yīng)一些深?yuàn)W主題或被要求提供引文和 URLs 時(shí)。就像學(xué)生在考試中借助筆記能夠幫助其取得更好的成績一樣,為這類模型提供參考文本也可減少其制造虛假信息的情況。
技巧:
- 引導(dǎo)模型根據(jù)參考文本回答問題
- 引導(dǎo)模型根據(jù)參考文本中的引用信息回答問題
把復(fù)雜的任務(wù)拆分成簡單的子任務(wù)
就像在軟件工程中,我們會(huì)習(xí)慣于把復(fù)雜的系統(tǒng)分解成一套模塊化的組件,對(duì)于提交給語言模型的任務(wù)也是同樣的道理。相較于簡單的任務(wù),復(fù)雜任務(wù)的錯(cuò)誤率往往會(huì)更高。而更進(jìn)一步,我們常??梢园堰@些復(fù)雜任務(wù)重新設(shè)定為一系列的工作流程,每一個(gè)流程就是一個(gè)更簡單的任務(wù),而且這些任務(wù)之間是相互聯(lián)系的,前一個(gè)任務(wù)的輸出會(huì)作為后一個(gè)任務(wù)的輸入。
技巧:
- 利用意圖分類識(shí)別用戶查詢中最相關(guān)的指令
- 對(duì)于需要長時(shí)間對(duì)話的對(duì)話應(yīng)用,總結(jié)或篩選先前的對(duì)話內(nèi)容
- 分步總結(jié)長文檔,并遞歸地構(gòu)建完整的總結(jié)
給模型更多時(shí)間“思考”
如果被要求計(jì)算 17 乘以 28,我們可能不能立即給出答案,但可以花一些時(shí)間逐步計(jì)算出結(jié)果。同樣,在 AI 模型試圖立刻回答問題時(shí),往往比理性思考后再做出回答更容易出錯(cuò)。所以,在模型給出答案之前,要求其展示一下”思考過程”,有助于模型更可靠地推導(dǎo)出正確的答案。
技巧:
- 在倉促做出結(jié)論前,指導(dǎo)模型自己尋找解決方法
- 通過內(nèi)心獨(dú)白或連串問題來掩蓋模型的思考過程
- 問模型在之前的步驟中是否有遺漏
運(yùn)用外部工具
為了彌補(bǔ)模型的不足,我們可以利用其他工具的輸出作為輸入。例如,文本檢索系統(tǒng)(有時(shí)被稱為 RAG 或檢索增強(qiáng)生成系統(tǒng))可以向模型提供相關(guān)文檔的信息。像 OpenAI 的代碼執(zhí)行引擎這樣的工具,可以幫助模型進(jìn)行數(shù)學(xué)運(yùn)算和代碼執(zhí)行。如果某項(xiàng)任務(wù)通過工具來完成能比通過語言模型更可靠或更高效,那么就把任務(wù)交給這個(gè)工具處理,這樣就能結(jié)合兩者長處,達(dá)到最佳效果。
技巧:
- 運(yùn)用基于嵌入的搜索來高效實(shí)現(xiàn)知識(shí)檢索
- 利用代碼執(zhí)行進(jìn)行更精確的計(jì)算或調(diào)用外部 API
- 使模型能夠訪問特定功能
系統(tǒng)地對(duì)變更進(jìn)行測(cè)試
如果能對(duì)性能進(jìn)行量化,那么就能更好地提高性能。有時(shí),對(duì)提示詞的修改在少數(shù)特定例子上可能表現(xiàn)更佳,但在更具普遍性的樣本集上可能會(huì)導(dǎo)致整體性能下降。因此,為了確保改動(dòng)對(duì)總體性能產(chǎn)生積極的影響,可能需要設(shè)計(jì)一份全方位的測(cè)試(也被稱為”評(píng)估”)。
技巧:
- 根據(jù)標(biāo)準(zhǔn)答案的參考評(píng)估模型輸出效果
實(shí)用策略
上述的每一種策略都可以通過具體的技巧來具體實(shí)施。這些技巧是為了給你提供可嘗試的想法,但并不是完全詳盡無遺的。你也可以嘗試這里沒有提到的一些新穎創(chuàng)意的方法。