Learn Prompt: Your CookBook to Communicating with AI

📄️ 🟢 Introducción

Encontrar el mejor estímulo para crear una imagen perfecta es un desafío particular. La investigación sobre métodos para hacerlo no está tan desarrollada como la de la creación de textos. Esto puede deberse a los desafíos inherentes en la creación de objetos que son fundamentalmente subjetivos y a menudo carecen de métricas de precisión. Sin embargo, no temáis, ya que la comunidad de creación de imágenes con estímulos (@parsons2022dalleprompt) ha hecho grandes descubrimientos sobre cómo estimular varios modelos de imágenes (@rombach2021highresolution) (@ramesh2022hierarchical).

📄️ 🟢 Modificadores de Estilo

Los modificadores de estilo son simplemente descriptores que producen consistentemente ciertos estilos (por ejemplo, "tintado de rojo", "hecho de vidrio", "renderizado en Unity")(@oppenlaender2022taxonomy). Pueden combinarse para producir estilos aún más específicos. Pueden "incluir información sobre períodos, escuelas y estilos artísticos, pero también sobre materiales y medios artísticos, técnicas y artistas"(@oppenlaender2022taxonomy).

📄️ 🟢 Potenciadores de calidad

Los potenciadores de calidad (@oppenlaender2022taxonomy) son términos agregados a una prompt para mejorar ciertas cualidades de la imagen generada que no están relacionadas con el estilo. Por ejemplo, "increíble", "hermoso" y "buena calidad" son potenciadores de calidad que se pueden utilizar para mejorar la calidad de la imagen generada.

📄️ 🟢 Repetición

Repetir la misma palabra dentro de una consulta, o frases similares, puede hacer que el modelo enfatice esa palabra en la imagen generada(@oppenlaender2022taxonomy). Por ejemplo, @Phillip Isola generó estas cascadas con DALLE:

📄️ 🟢 Términos ponderados

Algunos modelos (Stable Diffusion, Midjourney, etc.) permiten ponderar los términos en un prompt. Esto se puede utilizar para enfatizar ciertas palabras o frases en la imagen generada. También se puede utilizar para disminuir la importancia de ciertas palabras o frases en la imagen generada. Consideremos un ejemplo sencillo:

📄️ 🟢 Generaciones Deformes

Las generaciones deformes, especialmente en partes del cuerpo humano (por ejemplo, manos, pies), son un problema común en muchos modelos. Esto se puede tratar en cierta medida con buenos prompts negativos (@blake2022with). El siguiente ejemplo está adaptado de esta publicación de Reddit.

📄️ 🟢 Shot type

Shot types refer to the various camera angles and compositions used in filmmaking to capture different perspectives and visual effects within a scene. These shot types play a crucial role in conveying the story, setting the mood, and influencing the audience's perception and emotions.

📄️ 🟢 Midjourney

Midjourney es otro generador de imágenes por IA. A diferencia de Stable Diffusion, Midjourney utiliza un bot de Discord como interfaz para la generación de imágenes por IA (únete al Discord aquí o experimenta con el bot en el Discord de Learn Prompting). Sin embargo, el uso del bot de Midjourney sigue los mismos principios básicos para la generación de imágenes mediante la creación de un prompt.

📄️ 🟢 Recursos

El campo de la ingeniería de imágenes generadas por IA es muy diverso. Aquí hay una buena lista de recursos que cubren partes de él.