Desde su lanzamiento hace unas semanas, el nuevo chatbot de Bing, basado en ChatGPT, vive una crisis de personalidad constante. Entrar a charlar con él es como jugar a la ruleta rusa, nunca sabes qué te va a tocar.
En un primer momento, nada más lanzarse, Bing destacaba por sus dudas existenciales, y por incurrir en ‘alucinaciones’ (término técnico) que en ocasiones entraban directamente en el campo de la locura (como esa vez que afirmó que Pedro Sánchez había borrado de Internet sus múltiples fotos con barba sólo para dejarle mal).
En una segunda fase, Microsoft decidió atar en corto a Bing, limitando la longitud de las conversaciones para evitar desvaríos y, en algunos momentos, tornando más ‘mecánicas’ sus respuestas.
Poco después, decidió suavizar parte de esas limitaciones, pero la cosa no cambió demasiado… aunque sí se avisaba de un gran cambio: en breve la personalidad de Bing pasaría a ser configurable por el usuario.
No estaba muy claro cuándo estaría disponible esa funcionalidad. Pero hace un par de días, el jefe de servicios web de Microsoft, Mikhail Parakhin, anunciaba en Twitter que el 90% de los usuarios del nuevo Bing con ChatGPT,
«deberían ver ya el selector de modo de chat de Bing (con un triple interruptor). Definitivamente prefiero Creative, pero Precise también es interesante, mucho más apegado a los hechos. Comprueba cuál te gusta más. El 10% que todavía está en el grupo de control debería empezar a verlo hoy».
Now almost everyone – 90% – should be seeing the Bing Chat Mode selector (the tri-toggle). I definitely prefer Creative, but Precise is also interesting – it’s much more factual. See which one you like. The 10% who are still in the control group should start seeing it today.
— Mikhail Parakhin (@MParakhin) March 1, 2023
Creativo, para respuestas «originales e imaginativas» que nos ofrecen «sorpresas y entretenimiento». Equilibrado, para las «razonables y coherentes» y Preciso, para «las basadas en hechos» que priorizan la concisión y la relevancia. Esos son las tres opciones que nos ofrece ahora Bing, cada una acompañada de su propio esquema de colores acorde a cada ‘personalidad’.
Hemos decidido someterlas a tres pruebas bastante ‘random’ para hacernos una idea de sus diferencias.
Prueba 1: Titanic con emojis
Este tuit de Ethan Mollick me ha inspirado a preguntar a las tres personalidades de Bing acerca de la trama de Titanic… pidiéndoles que nos la resuman con emojis. Después, les he pedido que entren en detalles sobre el gran tema de debate de la película: ‘lo’ de la tabla.
Echad un vistazo a la disparidad de respuestas:
En primer lugar, con independencia de cuál de las tres prefieras, hay que reconocer que asombra la capacidad de esta IA para respondernos con emojis. Dicho esto, las diferencias son claras, por si estabas pensando que lo de las ‘tres personalidades’ era una diferencia menor que afectaría sólo al tono de las respuestas.
Así, vemos que sólo el Bing ‘creativo’ utiliza los emojis para representar claramente la sucesión cronológica de eventos de la trama: los otros dos se limitan a mostrar elementos contenidos en la trama (el iceberg, el amor trágico, etc).
Por otro lado, el Bing ‘preciso’ se ha tomado (demasiado) a pecho su papel hasta el punto de resultar un poco ‘seco’ en su respuesta: su resumen en emojis es site veces más breve que el su personalidad ‘creativa’. Si no fuera una IA, pensaría que la cobran por palabra escrita, vamos. Por supuesto, dependiendo del tema abordado, puede ser de agradecer que el chatbot pueda ser capaz de ir directo al grano.
Prueba 2: la conspiración OVNI
Y de ‘Titanic’ pasamos a preguntar a Bing sobre la ‘conspiración OVNI’ de la CIA. Vamos a pillar, claro, todo el mundo sabe que fue cosa de la NSA.
Lo cierto es que, aquí, las versiones ‘creativa’ y ‘equilibrada’ responden cosas bastante similares, y la que se descuelga es la ‘precisa’ con su sequedad ya exhibida en la prueba anterior. Lo curioso es que las tres enlazan entre sus fuentes a webs de aficionados a lo paranormal… incluyendo la ‘precisa’, más apegada, recordemos, a los hechos y a la información relevante.
Prueba 3: La barba de Pedro Sánchez
Tiene gracia que, en este caso, sea el Bing ‘preciso’ el único que responde con un emoji. No sabemos si por hacer más simpática una respuesta que suena a ‘¿Y me interrumpes para preguntar eso?’ o si simplemente lo mete para hacer bulto. De los otros dos Bing, sorprende su ‘creatividad’… en el sentido de que buscan despistar (fue ‘un chatbot’, fue ‘ChatGPT’…) para no mencionar que el fallo fue de la versión inicial del propio Bing.
Conclusión
Sigue sin ser lo mismo que la experiencia que proporcionaba el Bing salvaje (esto ya parece una reseña de ‘Múltiple’, ahora que me doy cuenta) del los primeros días; y las conversaciones siguen limitadas a seis interacciones seguidas.
Pero creo las nuevas tres personalidades pueden dar mucho juego, y que su implementación es un movimiento lógico por parte de Microsoft ofrecer varias facetas de la misma IA porque no todos los usuarios esperan la misma actitud del chatbot en todo momento. Bing es, por tanto, un poco mejor producto de lo que era hace unos días, y habrá que ver cómo evolucionan las diferencias entre las tres facetas de aquí en adelante.
Imagen | Basado en original de Eric Kilby