OpenAI 官方提示工程指南中文版

AI應(yīng)用信息1年前 (2024)發(fā)布 XIAOT

這份指南分享了如何更有效地利用像如 GPT-4 這樣的大語言模型（有時(shí)候也叫 GPT 模型）來獲得更好的結(jié)果。介紹的方法可以相互結(jié)合，以發(fā)揮更大的作用。我們鼓勵(lì)你進(jìn)行實(shí)驗(yàn)，尋找最適合你的技巧。

目前，這里演示的一些示例只適用于最先進(jìn)的模型?gpt-4。一般來說，如果你嘗試的模型在某個(gè)任務(wù)上未能成功，并且有更高級(jí)的模型可供使用，不妨用更高級(jí)的模型再嘗試一次。

六大策略助你獲得更佳結(jié)果

撰寫清晰的指令

這些模型并不會(huì)讀心術(shù)，無法猜到你的想法。如果模型的輸出內(nèi)容過長，你可以要求它簡短回答。如果模型輸出內(nèi)容過于簡單，你可以要求使用更專業(yè)的水平寫作。如果你對(duì)輸出格式不滿意，可以直接展示你期望的格式。最好就是讓模型不需要去猜你想要什么，這樣你最有可能獲得想要的結(jié)果。

技巧：

在查詢中添加詳細(xì)信息，以獲得更準(zhǔn)確的答案
請(qǐng)求模型扮演特定角色
使用分隔符來清晰區(qū)分輸入的不同部分
明確指出完成任務(wù)需要的步驟
提供實(shí)例作為參考
明確指定希望輸出的長度

提供參考文本

語言模型可能會(huì)自信地編造出虛假答案，特別是當(dāng)回應(yīng)一些深?yuàn)W主題或被要求提供引文和 URLs 時(shí)。就像學(xué)生在考試中借助筆記能夠幫助其取得更好的成績一樣，為這類模型提供參考文本也可減少其制造虛假信息的情況。

技巧：

引導(dǎo)模型根據(jù)參考文本回答問題
引導(dǎo)模型根據(jù)參考文本中的引用信息回答問題

把復(fù)雜的任務(wù)拆分成簡單的子任務(wù)

就像在軟件工程中，我們會(huì)習(xí)慣于把復(fù)雜的系統(tǒng)分解成一套模塊化的組件，對(duì)于提交給語言模型的任務(wù)也是同樣的道理。相較于簡單的任務(wù)，復(fù)雜任務(wù)的錯(cuò)誤率往往會(huì)更高。而更進(jìn)一步，我們常?？梢园堰@些復(fù)雜任務(wù)重新設(shè)定為一系列的工作流程，每一個(gè)流程就是一個(gè)更簡單的任務(wù)，而且這些任務(wù)之間是相互聯(lián)系的，前一個(gè)任務(wù)的輸出會(huì)作為后一個(gè)任務(wù)的輸入。

技巧：

利用意圖分類識(shí)別用戶查詢中最相關(guān)的指令
對(duì)于需要長時(shí)間對(duì)話的對(duì)話應(yīng)用，總結(jié)或篩選先前的對(duì)話內(nèi)容
分步總結(jié)長文檔，并遞歸地構(gòu)建完整的總結(jié)

給模型更多時(shí)間“思考”

如果被要求計(jì)算 17 乘以 28，我們可能不能立即給出答案，但可以花一些時(shí)間逐步計(jì)算出結(jié)果。同樣，在 AI 模型試圖立刻回答問題時(shí)，往往比理性思考后再做出回答更容易出錯(cuò)。所以，在模型給出答案之前，要求其展示一下”思考過程”，有助于模型更可靠地推導(dǎo)出正確的答案。

技巧：

在倉促做出結(jié)論前，指導(dǎo)模型自己尋找解決方法
通過內(nèi)心獨(dú)白或連串問題來掩蓋模型的思考過程
問模型在之前的步驟中是否有遺漏

運(yùn)用外部工具

為了彌補(bǔ)模型的不足，我們可以利用其他工具的輸出作為輸入。例如，文本檢索系統(tǒng)（有時(shí)被稱為 RAG 或檢索增強(qiáng)生成系統(tǒng)）可以向模型提供相關(guān)文檔的信息。像 OpenAI 的代碼執(zhí)行引擎這樣的工具，可以幫助模型進(jìn)行數(shù)學(xué)運(yùn)算和代碼執(zhí)行。如果某項(xiàng)任務(wù)通過工具來完成能比通過語言模型更可靠或更高效，那么就把任務(wù)交給這個(gè)工具處理，這樣就能結(jié)合兩者長處，達(dá)到最佳效果。

技巧：

運(yùn)用基于嵌入的搜索來高效實(shí)現(xiàn)知識(shí)檢索
利用代碼執(zhí)行進(jìn)行更精確的計(jì)算或調(diào)用外部 API
使模型能夠訪問特定功能

系統(tǒng)地對(duì)變更進(jìn)行測(cè)試

如果能對(duì)性能進(jìn)行量化，那么就能更好地提高性能。有時(shí)，對(duì)提示詞的修改在少數(shù)特定例子上可能表現(xiàn)更佳，但在更具普遍性的樣本集上可能會(huì)導(dǎo)致整體性能下降。因此，為了確保改動(dòng)對(duì)總體性能產(chǎn)生積極的影響，可能需要設(shè)計(jì)一份全方位的測(cè)試（也被稱為”評(píng)估”）。

技巧：