OpenAI lanza al fin GPT-5, el modelo de IA más potente del mercado. Promete una reducción drástica de las ‘alucinaciones’

0
44

Tras
meses
de
especulación,
filtraciones
y
un
halo
de
secretismo
cuidadosamente
cultivado,

OpenAI
ha
presentado
oficialmente
GPT‑5
,
la
nueva
versión
de
su
sistema
de
inteligencia
artificial
generativa.
El
anuncio
se
ha
realizado
durante
un
evento
online,
en
el
que
los
empleados
de
la
compañía
han
expuesto
las
principales
novedades
del
modelo,
el
más
potente
desarrollado
hasta
la
fecha.

CHAT
GPT-4
en
4
MINUTOS

Entonces,
¿qué
es
GPT-5?


GPT-5

es
la
nueva
iteración
de
los
modelos
generativos
de
lenguaje
desarrollados
por
OpenAI,
sucesora
de
la
exitosa
serie
GPT-4.
La
llegada
de
la
nueva
gran
revolución
en
el
campo
de
la
IA,
sin
embargo,
ha
resultado
menos
chocante
de
lo
esperado

al
haber
sido
filtrada
unas
horas
antes
de
lo
previsto
,
debido
a
un
error
en
el
blog
de
GitHub…
y
porque,
en
las
semanas
previas,
varios
empleados
de
OpenAI
habían
comenzado
a
insinuar
una
gran
novedad.


¿Principales
novedades?

  • Capacidades
    mejoradas
    de
    razonamiento
    lógico.
  • Mejor
    desempeño
    en
    tareas
    de
    programación
    compleja.
  • Experiencia
    conversacional
    más
    fluida
    y
    contextual.
  • Versatilidad
    según
    necesidades
    de
    velocidad,
    costo
    o
    interacción
    multimodal.

Cuatro
versiones
del
nuevo
modelo

Aunque
la
publicación
de
GitHub
fue
rápidamente
eliminada,
dejó
al
descubierto
información
clave
sobre
las
capacidades,
versiones
y
el
enfoque
que
tomará
esta
poderosa
herramienta
de
IA.
Así,
sabíamos
ya
de
la
existencia
de
al
menos

cuatro
variantes

del
modelo:

gpt‑5
,

gpt‑5‑mini
,

gpt‑5‑nano

y

gpt‑5‑chat
.

OpenAI
apuesta
así
por
una
gama
diversificada
de
versiones
de
GPT-5
para
ajustarse
a
diferentes
escenarios:


  1. GPT-5
    :
    Modelo
    principal,
    orientado
    a
    tareas
    lógicas
    y
    procesos
    con
    múltiples
    pasos.
    Ideal
    para
    resolver
    problemas
    complejos
    que
    requieren
    razonamiento
    estructurado.

  2. GPT-5-mini
    :
    Una
    versión
    ligera,
    diseñada
    para
    aplicaciones
    sensibles
    al
    costo.
    Representa
    un
    equilibrio
    entre
    rendimiento
    y
    eficiencia.

  3. GPT-5-nano
    :
    Optimizado
    para
    velocidad,
    es
    ideal
    para
    sistemas
    que
    necesitan

    baja
    latencia
    ,
    como
    asistentes
    en
    tiempo
    real
    o
    aplicaciones
    embebidas.

  4. GPT-5-chat

    Enfocado
    en

    conversaciones
    avanzadas,
    multimodales
    y
    conscientes
    del
    contexto
    ,
    con
    especial
    orientación
    hacia
    aplicaciones
    empresariales
    y
    asistentes
    virtuales
    de
    alto
    nivel.

  5. GPT‑5-Pro:

    Esta
    variante
    no
    formaba
    parte
    de
    la
    filtración
    de
    GitHub;
    se
    trata
    de
    una
    versión
    mejorada
    del
    modelo
    base
    que
    utiliza
    más
    recursos
    computacionales
    para
    ofrecer
    mayor
    precisión,
    mejor
    razonamiento
    y
    calidad
    de
    respuesta.
    Está
    disponible
    exclusivamente
    para
    suscriptores
    del
    plan
    ChatGPT
    Pro
    (200 USD/mes).

Disponibilidad

Los
suscriptores
del
plan
Plus
(20
$
al
mes)
de
ChatGPT
tendrán
acceso,
eso
sí,
a
límites
de
uso
más
altos
para
GPT-5
que
los
usuarios
gratuitos.
Por
otro
lado,
las
organizaciones
que
participan
en
los
planes
Team,
Edu
y
Enterprise
de
OpenAI
obtendrán
acceso
a
GPT-5
como
su
modelo
predeterminado
la
próxima
semana.

Mejoras
de
rendimiento

Una
de
las
mejoras
más
destacadas
de
GPT‑5
frente
a
versiones
anteriores
es
su

precisión
factual
.
OpenAI
ha
trabajado
intensamente
para
reducir
las

alucinaciones
,
es
decir,
las
ocasiones
en
que
el
modelo
inventa
datos
o
responde
incorrectamente.

Según
pruebas
internas,

GPT‑5
(con
razonamiento
activado)
alucina
en
solo
un
4,8%
de
los
casos
,
una
mejora
sustancial
frente
a
tasas
anteriores
del
20,%
en
GPT‑4o
y
hasta
22%
en
el
modelo
o3.

benchmarks

benchmarks

Esta
mejora
se
ha
hecho
especialmente
evidente
en
el
ámbito
de
la

salud
,
un
área
sensible
donde
la
exactitud
es
crucial.
En
el
benchmark

HealthBench
Hard
Hallucinations
,
diseñado
para
medir
errores
graves
en
respuestas
sobre
temas
médicos,
GPT‑5
mostró
una

tasa
de
alucinación
de
apenas
el
1,6%
,
muy
por
debajo
de
los
modelos
anteriores
(12.9%
para
GPT‑4o
y
15,8%
para
o3).

Además,
GPT‑5
ha
demostrado
un
rendimiento
líder
en
múltiples

pruebas
de
benchmarking
,
superando
a
modelos
de
competencia
como
Claude
Opus
(Anthropic),
Gemini
(Google
DeepMind)
y
Grok
(xAI)
en
varios
frentes:

  • En

    SWE-bench
    Verified
    ,
    un
    benchmark
    con
    tareas
    reales
    de
    codificación
    extraídas
    de
    GitHub,
    obtuvo
    un

    74,9%
    de
    precisión
    ,
    superando
    ligeramente
    a
    Claude
    Opus
    4.1
    (74,5%)
    y
    ampliamente
    a
    Gemini
    2.5
    Pro
    (59,6%).
  • En
    el
    exigente

    GPQA
    Diamond
    ,
    que
    evalúa
    preguntas
    científicas
    de
    nivel
    doctoral,
    GPT‑5
    alcanzó
    un

    89.4%
    ,
    por
    encima
    de
    Claude
    (80,9%)
    y
    Grok
    4
    Heavy
    (88,9%).
  • Incluso
    en
    el
    test

    Humanity’s
    Last
    Exam
    ,
    una
    evaluación
    transversal
    en
    matemáticas,
    humanidades
    y
    ciencias
    naturales,
    la
    versión

    GPT‑5
    Pro

    logró
    un
    42%
    de
    aciertos
    utilizando
    herramientas,
    rozando
    los
    resultados
    de
    Grok
    4
    Heavy
    (44,4%).

Estos
resultados
consolidan,
aparentemente,
a
GPT‑5
como
uno
de
los
modelos
más
precisos
y
fiables
del
mercado.


En
Genbeta
|
«¿Queréis
que
lancemos
GPT-6
como
open
source?
¿Sí?
Pues
no
va
a
pasar».
El
CEO
de
OpenAI
descarta
la
idea
(¿pero
no
del
todo?)