Si Gemini ya me había dejado sin palabras, solo me faltaba ver cómo genera vídeo. Los resultados son sorprendentes

0
105

La
generación
de
vídeo
a
partir
de
una
orden
de
texto
llegó
por
fin
a

Gemini
:
tras
el

anuncio
por
parte
de
Google
,
ya
fue
aterrizando
en
los
móviles
de
quienes
tienen
una

suscripción
Advanced
.
Lo
esperaba
con
ganas
y
por
fin
pude
probarlo:
está
a
la
altura
de
las
expectativas.

Tras
sorprenderme
con
el
entendimiento
del
texto
y
su
generación,
después
de
que

crear
imágenes

se
convirtiera
en
algo
cotidiano
y
cuando
ya
me
había
acostumbrado
a
intercambiar
Google
por
las
búsquedas
mediante
chatbot,

la
frontera
del
vídeo
quedó
finalmente
traspasada
.

Veo
2

es
la
apuesta
de
Google
en
la
generación
animada,
este
modelo
ya
está
disponible
desde
Gemini.

Si
puedes
imaginarlo,
puedes
crear
tu
vídeo

Veo 2 Videos Ia

Veo 2 Videos Ia

Google
prometió
que
la
generación
de
vídeo
con
su
modelo
Veo
2
se
integraría
en
el
selector
de
Gemini,
primero
para
los
usuarios
que
tienen
una
suscripción
Advanced.
Después
llegará
de
forma
más
limitada
a
los
usuarios
de
las
cuentas
gratuitas,
una
gran
ventaja
sobre
herramientas
como

Sora
,
de
Open
AI.
Que
se
democratice
la
IA
en
todas
sus
vertientes
es
una
buena
noticia.

¿Que
se
hacía
algo
lioso
decantarse
por
un
LLM
a
la
hora
de
utilizar
Gemini,
ya
fuera
en
la
app
como
en
la
web?
Pues
otro
selector
más:
Veo
2
se
une
a
Gemini
2.0,
2.5
y
la

búsqueda
profunda
.
Ahora
mismo
tengo
cinco
opciones
distintas,
creo
que
lo
lógico
es
que
Veo
2
se
activara
al
pedirle
al
chatbot
un
vídeo,
igual
que
hace
Imagen
3
con
las
imágenes.
Supongo
que,
de
momento,
es
una
manera
de
destacar
la
novedad.

Veo 2 Videos Ia

Veo 2 Videos Ia

La
interfaz
de
generación
no
tiene
nada
del
otro
mundo:
un
cuadro
de
texto
y
ya,
de
momento
no
se
le
pueden
adjuntar
archivos
(sí
grabar
una
orden
de
voz).
¿Que
busco
animar
una
imagen?
La
copio
con
el
portapapeles
y
la
pego
en
el
chatbot,
luego
escribo
con
texto

cómo
deseo
animar
dicha
imagen
.
Los
resultados
son
muy
buenos,
la
clave
aquí
se
encuentra
en
afinar
el
prompt.

Veo
2
se
comporta
de
forma
muy
precisa
a
la
orden:
cuanto
más
extenso
y
afinado
sea
el
prompt,
Meno
riesgo
de
alucinaciones

Veo
2
tiene
un
potencial
enorme,
su
calidad
se
encuentra
a
un
excelente
nivel
(bajo
mis
pruebas,
me
ha
gustado
más
que
Sora
y
Pika,
por
ejemplo),
logra
animar
de
manera
realista
(a
24
fps),
no
he
visto
exageradas
alucinaciones
(todo
depende
de
lo
específica
que
sea
la
orden
de
texto)
y
parece
que
Google
no
le
ha
puesto
demasiados
filtros
de
copyright.
Por
ejemplo,
creó
vídeos
de
Dragón
Ball
y
de
los
Simpson
sin
poner
objeciones.

Veo
2
necesita
un
par
de
minutos
de
tiempo
para
crear
vídeos
de
8
segundos

Gato Baterista

Gato Baterista

«Gato
tocando
la
batería
en
una
calle
de
San
Francisco.
El
público
del
gato
le
arroja
monedas,
todos
los
integrantes
de
ese
público
son
perros»

Una
vez
está
activo
en
la
cuenta,
aparecerá
el
selector
de
Veo
2.
Por
mis
pruebas,
solo
lo
tengo
en
los
móviles,
no
en
la
web.
Aunque
encontré
un
truco:
si
inicio
una
conversación
con
el
modelo
de
vídeo
en
el
teléfono,
y
la
continúo
en
el
navegador,

Gemini
me
seguirá
haciendo
vídeos
si
se
lo
pido
.
Aunque
en
la
web
no
me
aparezca
Veo
2.

¿Y
cuáles
son
las
cualidades
de
las
creaciones?
Veamos.

  • Vídeos
    de
    entre
    cinco
    y
    ocho
    segundos.
  • Resolución
    máxima
    a
    720p.
  • 24
    fotogramas
    por
    segundo.
  • Formato
    16:9
    y
    guardado
    en
    archivos
    MP4.
  • Límite
    mensual
    en
    la
    generación
    de
    vídeos.
    Gemini
    avisará
    conforme
    se
    acerque
    dicho
    límite.
  • Veo
    2
    incluye
    una
    marca
    de
    agua
    invisible
    en
    cada
    fotograma
    para
    identificar
    los
    vídeos
    como
    creados
    con
    IA.
  • Las
    órdenes
    de
    generación
    pueden
    escribirse
    en
    español.
  • De
    momento
    solo
    disponible
    para
    cuentas
    de
    Gemini
    Advanced.

No
está
nada
mal,
es
el
complemento
perfecto
a
la
creación
de
imágenes
con
Imagen
3
y
al
resto
de
opciones
relacionadas
con
el
texto
que
ofrecen
los
modelos
de
Gemini.
La
IA
interpreta
suficientemente
bien
las
órdenes,
incluso
aunque
no
sean
demasiado
detalladas.
Y
se
obtienen
resultados
que
van
más
allá
de
la
curiosidad.

Google
no
está
dispuesta
a
dejar
que
la
adelanten
en
IA

El límite de la muerte de Veo 2: Gemini permite unas diez generaciones diarias

El límite de la muerte de Veo 2: Gemini permite unas diez generaciones diarias


El
límite
de
la
muerte
de
Veo
2:
Gemini
permite
unas
quince
generaciones
diarias

De
ser
pionera
en
las
herramientas
de
IA
a
quedar
relegada
a
los
puestos
de
consolación
por
un
grave
error
de
cálculo:
no
ver
el
potencial
de
los
largos
modelos
de
lenguaje

como
chatbots
generativos
.
Open
AI
marcó
el
inicio
con
ChatGPT
y
consiguió
hacerse
con
la
referencia.
Aunque
Google
pisó
el
acelerador
y
anda
recortando
camino
a
base
de
arrojar
paladas
de
billetes
a
a
los
motores
(como
Open
AI,
que

es
una
máquina
de
quemar
dinero
).

Veo
2
me
ha
sorprendido,
ya
decía
que
me
parece
mejor
que
los
contrincantes.
Aunque
claro,
veremos
qué
ocurre
en
los
próximos
meses:
la
competencia
es
tan
dura,
que
no
pasa
una
semana
sin
que
dejemos
de
ver
novedades
en
el
campo
de
la
IA.
Le
tengo
muchas
ganas
al
próximo

Google
I/O

de
mediados
de
mayo,
estoy
convencido
de
que
Gemini
será
el
protagonista
absoluto.

Imagen
de
portada
|
Iván
Linares

En
Xataka
Android
|

Mientras
ChatGPT
quita
funciones
a
los
usuarios
gratuitos,
Google
hace
todo
lo
contrario:
ahora
Gemini
2.5
Pro
funciona
gratis