Los que daban a OpenAI por muerta tras el aterrizaje de DeepSeek se dan cuenta ahora de que o3-mini ya lo ha destronado

0
11

Si
algo
ha
quedado
claro
con

la
irrupción
de
o3-mini

es
que

la
IA
avanza
a
un
ritmo
imparable
.
Cada
mes
(o
cada
par
de
semanas),
los
modelos
mejoran
gracias
a
una
combinación
de

fuerza
bruta
computacional

y
de

innovaciones
algorítmicas
.

Y
es
que,
recientemente,
tras
una
semana
en
la
que

DeepSeek

estuvo
en
boca
de
todos
gracias
a
su
inesperada
eficiencia,
OpenAI
dio
un
sonoro
golpe
sobre
la
mesa
con
su
modelo

o3-mini
:
no
sólo
ha
superado
al
hasta
ahora
impresionante
modelo
de
IA ‘made
in
China’,
sino
que
lo
ha
hecho
con
un
rendimiento
superior
y
un
costo
tres
veces
menor.

Los
datos
son
contundentes:
o3-mini
se
destaca
en
diversas
pruebas
de
referencia.
En
el
test

ARC-AGI-1
,
clave
para
medir
la
capacidad
de
razonamiento
de
estos
modelos,
ha
demostrado
un
equilibrio
excepcional
entre

precisión,
costo
y
eficiencia
computacional
.

Otros
test
también
muestran
que
el
nuevo
modelo
de
OpenAI
es

más
inteligente,
rápido
y
económico
.
Sorprendentemente,
algunos,
como
Livebench,
muestran
que
el
recién
llegado
es
capaz
incluso
de
superar
a
modelos
de
la
serie

o1
,
que
son
considerablemente
más
costosos.

Coste Ai

Coste Ai

Eso
sí,
DeepSeek
sigue
ganando
a
o3-mini
en
un
aspecto
en
el
que
OpenAI
no
parece
interesado
en
competir:
es
una
IA ‘open
source’
que
puedes
instalar
en
tu
propio
PC
si
así
lo
deseas

CHAT
GPT-4
en
4
MINUTOS

Un
cambio
en
cómo
razonamos
con
IA

El
dominio
de
o3-mini
no
solo
se
debe
a
la
potencia
bruta,
sino
también
a
su
capacidad
para «pensar
antes
de
responder».
OpenAI
introdujo
con

o1

el
concepto
de ‘cadena
de
pensamiento’,
permitiendo
que
la
IA

rumiara

antes
de
dar
una
respuesta.

Modelos
como

o3-mini
y
DeepSeek
R1

han
perfeccionado
esta
técnica,
logrando
que
la
inteligencia
artificial

hable
consigo
misma

y
evalúe
distintas
soluciones
antes
de
decidir.

Esto
ha
sido
especialmente
beneficioso
en
tareas
de

razonamiento
lógico
y
matemático
,
donde
se
observan
mejoras
significativas.
Además,
hace
no
mucho,

se
criticaba
a
los
modelos
generativos
como
ChatGPT
por
su
bajo
rendimiento
en
matemáticas
:
hoy
en
día,
gracias
precisamente
a
estos
avances,
esa
afirmación
ha
quedado
obsoleta.

La
IA
no
solo
se
mide
en
pruebas,
también
en
preferencias
del
usuario

Un
aspecto
curioso
de
la
evolución
de
estos
modelos
es
que

el
mejor
en
los
test
no
siempre
es
el
favorito
del
público
.
Un
caso
paradigmático
es
el
de

Claude
3.5
Sonnet
,
que
ha
ganado
popularidad
no
tanto
por
sus
datos
de
rendimiento
como
por
su «personalidad».

Este
fenómeno
demuestra
que,
además
de
la
precisión
y
eficiencia,
los
usuarios
valoran
la

experiencia
conversacional

y
la
forma
en
que
un
modelo
se
comunica.

Imagen
|
Marcos
Merino
Bonilla

En
Genbeta
|

Sam
Altman
cree
que
OpenAI
se
equivocó
con
la
visión
con
el
código
abierto:
DeepSeek
lo
ha
cambiado
todo