📄️ 🟢 介紹
如何找到最佳的提示詞來生成完美的圖片是一項特殊的挑戰。與文字提示相比,研究如何做到這一點的方法並沒有那麼成熟。這可能是因為建立物件自身的挑戰,這些物件基本上是主觀的並且往往缺乏良好的準確性度量方法。但不要擔心,社群(@parsons2022dalleprompt)已經對如何提示各種影象模型(@rombach2021highresolution)(@ramesh2022hierarchical)有了很大的進展。
📄️ 🟢 樣式修飾符
樣式修飾符是一些能夠產生特定樣式的描述符(例如,“帶有紅色色調”、“玻璃製成”、“用 Unity 渲染”)(@oppenlaender2022taxonomy)。它們可以組合在一起,產生更具體的樣式。它們可以“包括關於藝術時期、流派和風格,以及藝術材料和媒介、技術和藝術家(@oppenlaender2022taxonomy)”的資訊。
📄️ 🟢 質量增強器
“Quality boosters”(@oppenlaender2022taxonomy)是新增到提示中以提高生成影象的某些非特定樣式質量的術語。例如,“amazing”、“beautiful”和“good quality”都是質量增強器,可以用於改善生成影象的質量。
📄️ 🟢 重複
在提示中重複相同的詞語或者類似短語會導致模型在生成的圖片中強調該詞語。例如,@Phillip Isola 使用 DALLE 生成了這些瀑布:
📄️ 🟢 加權
一些模型(如 Stable Diffusion、Midjourney 等)允許你對提示中的詞語進行加權。這可以用於強調生成圖片中的某些詞語或短語。它還可以用於減弱生成的圖片中某些詞語或短語的影響。讓我們考慮一個簡單的例子:
📄️ 🟢 修復變形生成
變形生成在許多模型中都是一個常見問題,特別是在人體部位(如手、腳)上。透過良好的反向提示語(@blake2022with),可以在一定程度上解決這個問題。以下示例來自於這篇Reddit帖子。
📄️ 🟢 Shot type
Shot types refer to the various camera angles and compositions used in filmmaking to capture different perspectives and visual effects within a scene. These shot types play a crucial role in conveying the story, setting the mood, and influencing the audience's perception and emotions.
📄️ 🟢 Midjourney
Midjourney 是另一個 AI 影象生成器。與 Stable Diffusion 不同,Midjourney 使用 Discord Bot 作為 AI 影象生成的介面(在此加入 Discord,或在 Learn Prompting Discord 中嘗試該 Bot)。不過,使用 Midjourney Bot 的遵循相同的影象提示基本原則。
📄️ 🟢 資源
影象提示工程領域非常多樣化。以下是一份涵蓋了其中部分內容的資源清單。