TECNOLOGIA

Trucos básicos para saber cómo dar órdenes a una inteligencia artificial y así generar mejores imágenes y textos

Por

febrero 10, 2023

104

ChatGPT (una IA conversacional que ofrece resultados en modo texto) tiene algo en común como MidJourney o DALL-E 2 (IAs generadoras de imágenes): la forma en que podemos usarlas para que generen el contenido que buscamos es mediante instrucciones en lenguaje natural, algo al alcance de cualquier usuario. Por supuesto, por ‘lenguaje natural’ sólo nos referimos a que no usamos lenguajes de programación…

…por que, por otro lado, hay que tener cuidado con cómo le hablamos si queremos que nos ‘respondan adecuadamente’. En primer lugar, tenemos que saber condensar lo fundamental de nuestra consulta, porque las IAs ‘tirarán adelante’ con la orden que introduzcamos, sin pedirnos ejemplos o aclaraciones. Además, hay algunas instrucciones que provocan reacciones concretas por parte de las IAs, y tenemos que saber ‘qué teclas pulsar’ (en sentido metafórico) para conseguirlas.

Ser experto en este campo se ha convertido ya en una profesión por derecho propio: ingeniero de instrucciones (o ‘prompt engineer’, si gustamos de anglicismos). Sin embargo, hay algunos trucos básicos que podemos aprender para manejarnos en este campo.

Las IAs como ChatGPT ya crean nuevas profesiones (muy bien pagadas): a qué se dedica esta nueva clase de 'ingenieros'

ZAO, la APP MÓVIL china que a través de DEEPFAKE te convierte en DICAPRIO en SEGUNDOS

Para IAs generadoras de imágenes

Sé simple: usa un lenguaje claro y conciso para describir a la IA lo que deseas que haga. Eso sí, ‘simple’ no es ‘breve’: usar menos de 7 palabras suele ser mala idea si buscas un resultado concreto.
Sé específico: Describe exactamente lo que quieres que la IA haga, sin asumir que interpretará igual que tú el lenguaje ambiguo. Incluiye detalles y ejemplos, para asegurarte de que la IA y tú estáis ‘pensando’ en lo mismo y, así, garantizar que el resultado coincide con lo que estabas pidiendo. Esto se explica mejor -claro está- en forma de ejemplo.

La siguiente imagen está generada a partir de la instrucción «A rabbit as Harry Potter» (‘un conejo como Harry Potter’). Le estamos poniendo un ejemplo a la IA (Harry Potter) y al mismo tiempo usamos un lenguaje sencillo (X as Y).

Harry

Usa un lenguaje positivo: describe lo que quieres obtener, no lo que no quieres.
Usa adjetivos, a ser posible varios (simétrico, abstracto, realista, complejo, clásico, colorido…)
Menciona la calidad que quieres obtener, para que la IA no vaguee: cosas como ‘high quality’ o ‘8K’ pueden ayudar.
Aprende Historia del Arte. Sobre todo, arte contemporáneo: menciona a autores (pintores, ilustradores…) o estilos (cosas como ‘Japanese poster graphics’, ‘synthwave’ o ‘1990s point and clics 16bit adventure game’) para delimitar el resultado.
Sé consciente de los sesgos: los modelos de IA están alimentados por el contenido de Internet, por lo que tienes que pensar cómo contrarrestarlos con tus instrucciones.

Mi último consejo: mucho cuidado con copiar y pegar literalmente prompts sin mirar para qué IA están pensados, porque cada una es un mundo. Por ejemplo, el ‘prompt’ «cat::1 eating ice-cream::3 beach::1» debería generar una imagen en la que aparezcan esos tres elementos (gato, comer helado, y playa), pero en la que el mayor peso de la imagen recae sobre el ‘comer helado’… siempre y cuando estemos usando MidJourney.

Pero mirad qué ocurre cuando lo usamos en DALL-E 2:

Centrado

Si DALL-E 2 lee ‘gato’, se centrará en el gato. Le dan igual las instrucciones de prioridad.

Para ChatGPT

Los consejos básicos del listado anterior se mantienen, claro: sí a la sencillez del lenguaje, no a la ambigüedad, proporciona detalles cuando sea necesario, etc. Pero lo cierto es que la capacidad conversacional de ChatGPT nos permite dirigirnos a esta IA de un modo totalmente distinto que a las generadoras de imágenes y, de hecho, su versatilidad a veces nos obliga a elaborar largos y complejos ‘prompts’ para lograr el resultado deseado.

ChatGPT puede exigir en algunos casos ‘prompts’ larguísimos pero, a ser posible, intenta no recurrir a encadenar un montón de frases subordinadas. Mejor usemos punto y seguido

Ya hemos visto en estas páginas cómo podemos engañar a ChatGPT para que se salte sus propias políticas de contenido (dándole instrucciones para jugar un juego de rol) o para comportarse como una consola de Linux virtualizada.

Como comprobarás leyendo cada enlace, el truco con ChatGPT reside en darle instrucciones claras de cómo queremos que reaccione a lo que le escribimos (recuerda que, dentro de una misma conversación, ChatGPT mantiene la ‘memoria’ de las instrucciones introducidas previamente).

Así, si queremos que nos genere una ‘tabla de contenidos’, podemos introducir algo como esto:

«Estás en el campeonato mundial de debate. La moción del debate es «Esta asamblea apoya la renta universal para todos los ciudadanos». La coalición de gobierno está a favor de la moción. Piense en los argumentos a favor de la moción, utilizando una tabla jerárquica de contenido que clasifique los argumentos en al menos 3 temas, luego escriba el discurso de la coalición. Luego haga lo mismo con la oposición, que debería argumentar en contra de los argumentos de la coalición».

Tabla

Y si lo que queremos es que ChatGPT actúe como un traductor que no sólo traduzca sino que mejore el estilo del texto introducido podemos recurrir a este otro prompt, extraído de un interesante repositorio de órdenes para ChatGPT:

«Quiero que actúes como traductor de inglés, corrector ortográfico y mejorador. Hablaré contigo en cualquier idioma y detectarás el idioma, lo traducirás y responderás en la versión corregida y mejorada de mi texto, en inglés. Quiero que reemplaces mis palabras y oraciones simplificadas de nivel A0 con palabras y oraciones en inglés de nivel superior más hermosas y elegantes. Mantén el mismo significado, pero hazlos más literarios. Quiero que solo respondas la corrección, las mejoras y nada más, no escribas explicaciones. Mi primera frase es [insertar]».