Tiempo de lectura aproximado: 10-15 minutos
Resumen hecho por IA de lo que vas a leer: Esta guía explora los parámetros básicos de los prompts como los steps,también explora los modos inpainting, variations y img2img, que permiten cambiar objetos de imágenes, crear variaciones de imágenes y transformar imágenes, respectivamente.
Anonimo
<aside> ⚠️ Todo lo de esta guía podría quedar obsoleto en un par de años, esta tecnología se desarrolla muy rápido
</aside>
Y en esta sección vamos a explorar extensamente los secretos de los prompts:
<aside> <img src="/icons/warning_orange.svg" alt="/icons/warning_orange.svg" width="40px" /> Esta es la parte más técnica de lo básico pero es necesario que la sepas para hacer buenas generaciones, dale, es fácil en verdad.
</aside>
Prompt/input: Donde metemos el prompt es decir el texto de la imagen que queremos generar, las palabras que aparecen antes en el prompt se enfatizan más automáticamente, por lo tanto el orden de las palabras es importante, tenlo en cuenta cuando vayas a escribir un mensaje a la IA!
Steps (Pasos): Aumentar este número aumentará el tiempo que tarda en salir la imagen, pero puede mejorar los resultados, ya que el programa interpretará que debe hacer pasos extra para completar lo que le has pedido
<aside> <img src="/icons/light-bulb_orange.svg" alt="/icons/light-bulb_orange.svg" width="40px" /> El valor normal para que te salgan imágenes buenas en Stable Difusion suele ser entre 50 y 100, en otros modelos varia (Por ejemplo en NovelAi que es de 28)
</aside>
CFG Scale/Guidance: Ajusta cuánto se parecerá la imagen al texto, es básicamente un 'creatividad vs literalidad'.
Un cfg bajo le dice a la IA que ignore el prompt que escribiste y haga lo que quiera
Un cfg alto le dice a la IA que deje de ser creativa y siga el prompt.
<aside> <img src="/icons/checkmark_blue.svg" alt="/icons/checkmark_blue.svg" width="40px" /> 7 es el numero por defecto, algunos modelos funcionan mejor con diferentes números, como los modelos de anime que funcionan bien con 12 cfg. En general, es recomendable permanecer entre 6 y 13 cfg. Más bajo o más alto y comenzarás a obtener resultados extraños
</aside>
Negative Prompts: Es todo lo que no quieres ver en la imagen final, es muy útil en las versiones 2 de stable diffusion, te pongo un ejemplo, si los resultados te salen desenfocados aquí añadirías “Blurry” es decir, desenfocado, así el programa interpretará que eso es lo que no quieres.
Seed/Semilla: es la imagen específica que resulta. Piense en ello como un identificador único para esa imagen en particular.
<aside> <img src="/icons/light-bulb_yellow.svg" alt="/icons/light-bulb_yellow.svg" width="40px" /> -1 Significa semilla aleatoria, es decir, que si la dejas así te generará imágenes aleatorias, si deseas obtener una imagen que ya obtuviste antes, usa la misma seed (Y el mismo prompt con los mismos parámetros) esto lo hacemos cuando queremos recrear los resultados de alguien o queremos que la IA parta de esos resultados para comprobar cosas, por ejemplo, que pasaría si con el mismo prompt y seed, cambiamos la CFG Scale, o si le metemos hypernetwoks o no (Filtros)…
</aside>
"Sampling Method” o Sampler: es esencialmente qué artista de IA quieres que cree la imagen. Euler A es el predeterminado y es decente con 20 steps. Dependiendo del que elijas y los pasos saldrán imágenes más o menos coherentes, pero no te comas mucho la cabeza, simplemente experimenta para ver cual se adapta más a tu estilo.
<aside> <img src="/icons/fire_pink.svg" alt="/icons/fire_pink.svg" width="40px" /> Para información de más parámetros, consultar la sección de tutoriales, en función de la interfaz grafica de stable diffusion que estés usando: Tutoriales y Videos útiles
</aside>