Si
algo
ha
quedado
claro
con
la
irrupción
de
o3-mini
es
que
la
IA
avanza
a
un
ritmo
imparable.
Cada
mes
(o
cada
par
de
semanas),
los
modelos
mejoran
gracias
a
una
combinación
de
fuerza
bruta
computacional
y
de
innovaciones
algorítmicas.
Y
es
que,
recientemente,
tras
una
semana
en
la
que
DeepSeek
estuvo
en
boca
de
todos
gracias
a
su
inesperada
eficiencia,
OpenAI
dio
un
sonoro
golpe
sobre
la
mesa
con
su
modelo
o3-mini:
no
sólo
ha
superado
al
hasta
ahora
impresionante
modelo
de
IA ‘made
in
China’,
sino
que
lo
ha
hecho
con
un
rendimiento
superior
y
un
costo
tres
veces
menor.
Los
datos
son
contundentes:
o3-mini
se
destaca
en
diversas
pruebas
de
referencia.
En
el
test
ARC-AGI-1,
clave
para
medir
la
capacidad
de
razonamiento
de
estos
modelos,
ha
demostrado
un
equilibrio
excepcional
entre
precisión,
costo
y
eficiencia
computacional.
Otros
test
también
muestran
que
el
nuevo
modelo
de
OpenAI
es
más
inteligente,
rápido
y
económico.
Sorprendentemente,
algunos,
como
Livebench,
muestran
que
el
recién
llegado
es
capaz
incluso
de
superar
a
modelos
de
la
serie
o1,
que
son
considerablemente
más
costosos.

Eso
sí,
DeepSeek
sigue
ganando
a
o3-mini
en
un
aspecto
en
el
que
OpenAI
no
parece
interesado
en
competir:
es
una
IA ‘open
source’
que
puedes
instalar
en
tu
propio
PC
si
así
lo
deseas
GPT-4
en
4
MINUTOS
Un
cambio
en
cómo
razonamos
con
IA
El
dominio
de
o3-mini
no
solo
se
debe
a
la
potencia
bruta,
sino
también
a
su
capacidad
para «pensar
antes
de
responder».
OpenAI
introdujo
con
o1
el
concepto
de ‘cadena
de
pensamiento’,
permitiendo
que
la
IA
rumiara
antes
de
dar
una
respuesta.
Modelos
como
o3-mini
y
DeepSeek
R1
han
perfeccionado
esta
técnica,
logrando
que
la
inteligencia
artificial
hable
consigo
misma
y
evalúe
distintas
soluciones
antes
de
decidir.
Esto
ha
sido
especialmente
beneficioso
en
tareas
de
razonamiento
lógico
y
matemático,
donde
se
observan
mejoras
significativas.
Además,
hace
no
mucho,
se
criticaba
a
los
modelos
generativos
como
ChatGPT
por
su
bajo
rendimiento
en
matemáticas:
hoy
en
día,
gracias
precisamente
a
estos
avances,
esa
afirmación
ha
quedado
obsoleta.
La
IA
no
solo
se
mide
en
pruebas,
también
en
preferencias
del
usuario
Un
aspecto
curioso
de
la
evolución
de
estos
modelos
es
que
el
mejor
en
los
test
no
siempre
es
el
favorito
del
público.
Un
caso
paradigmático
es
el
de
Claude
3.5
Sonnet,
que
ha
ganado
popularidad
no
tanto
por
sus
datos
de
rendimiento
como
por
su «personalidad».
Este
fenómeno
demuestra
que,
además
de
la
precisión
y
eficiencia,
los
usuarios
valoran
la
experiencia
conversacional
y
la
forma
en
que
un
modelo
se
comunica.
Imagen
|
Marcos
Merino
Bonilla
En
Genbeta
|
Sam
Altman
cree
que
OpenAI
se
equivocó
con
la
visión
con
el
código
abierto:
DeepSeek
lo
ha
cambiado
todo