DeepSeek
es
la
compañía
de
inteligencia
artificial
(IA)
de
moda.
Sus
modelos
de
lenguaje
más
recientes
han
desafiado
el
liderazgo
de
OpenAI
y
han
provocado
un
auténtico
terremoto
en
la
industria
tecnológica.
Estos
días
hemos
sabido
que
se
fundó
en
mayo
de
2023
y
que
ha
desarrollado
sus
productos
con
una
fracción
de
la
capacidad
de
cómputo
de
algunos
de
sus
principales
rivales
occidentales.
Pero
¿qué
más
se
sabe?
Vamos
a
verlo.
El
prometedor
presente
de
DeepSeek
es
el
resultado
de
años
de
investigación
que
comenzaron
mucho
antes
de
su
constitución
oficial.
Su
origen
se
encuentra
en
High-Flyer,
un
fondo
cuantitativo
de
inversión
creado
en
2015
por
el
estudiante
de
ingeniería
electrónica
Liang
Wenfeng
junto
a
dos
compañeros
de
clase.
Según
cuentan
en
su
página
web,
la
idea
era
que
los
algoritmos
se
convirtieran
en
el
corazón
de
su
negocio
al
permitir
operaciones
en
tiempo
real.
Una
compañía
enfocada
en
el
mercado
bursátil
chino
High-Flyer
concretó
su
primera
posición
bursátil
asistida
por
IA
en
octubre
de
2016,
movimiento
que
desencadenó
un
imparable
esfuerzo
para
seguir
trabajando
en
ese
sentido.
La
compañía
conformó
equipos
de
investigación
y
desarrollo
de
software
y
hardware.
Y
aparentemente
fue
la
decisión
adecuada.
En
2017
ya
aplicaba
IA
en
casi
todas
sus
estrategias
de
inversión
cuantitativas,
pero
para
seguir
avanzando
necesitaba
romper
algunas
barreras.
Descubrieron
que
las
tareas
de
entrenamiento
de
modelos
complejos
requerían
de
una
potencia
de
cálculo
descomunal.
Esto
no
les
desanimó
y
en
2019
pusieron
en
marcha
una
división
dedicada
llamada
High-Flyer
AI
para
abordar
el
desafío.
El
grupo
construyó
empezó
a
trabajar
con
500
GPU,
después
construyó
un
supercomputador
de
1.100
GPU
A100
de
NVIDIA
y
en
2022
gastó
140
millones
de
dólares
para
elevar
el
número
hasta
10.000
GPU,
antes
de
la
entrada
en
vigor
de
los
controles
de
exportación
de
Estados
Unidos.
High-Flyer
estaba
completamente
enfocada
en
desarrollar
su
negocio
de
trading
algorítmico.
Tenía
su
propia
plataforma
de
entrenamiento
de
aprendizaje
profundo
y
una
destacada
infraestructura
de
cómputo.
Mientras
tanto,
en
Estados
Unidos
había
una
empresa
llamada
OpenAI
que
apostaba
por
la
IA
generativa
y
que
había
sorprendido
a
muchos
con
las
bondades
de
su
modelo
de
lenguaje
GPT-3.
Como
recoge
China
Talk,
Liang
quería
ir
más
allá
de
las
finanzas.
Durante
mucho
tiempo
había
estado
convencido
de
que
la
IA
cambiaría
el
mundo,
y
había
encontrado
la
oportunidad
de
llevar
su
esfuerzo
al
siguiente
nivel.
En
2023,
High-Flyer
anunció
que
sentaría
las
bases
de
una
nueva
organización
para
avanzar
en
el
desarrollo
de
la
inteligencia
artificial
general
(AGI).
Así
nació
DeepSeek,
con
una
inyección
de
capital
de
High-Flyer.
DeepSeek
es
producto
de
años
de
trabajo
de
High-Flyer
y
evidentemente
ha
bebido
mucho
de
esta
compañía.
Ambas
firmas
comparten
oficinas
en
el
mismo
edificio,
aunque
parece
que
utilizan
recursos
de
cómputo
diferente.
La
startup
de
IA
dice
que
cuenta
con
chips
H20,
que
se
venden
como
rosquillas
en
China,
y
H800
de
NVIDIA,
y
que
ha
utilizado
solo
2.048
GPU
de
este
último
modelo
para
entrenar
sus
modelos
más
recientes,
una
afirmación
que
algunos
han
cuestionado.
Imágenes
|
High-Flyer
|
DeepSeek