En
el
discurso
político
cotidiano
no
es
raro
que
salgan
a
colación
conceptos
como ‘Administración
Electrónica’, ‘accesibilidad’
o ‘transparencia’.
Pero ‘discurso’
y ‘hechos’
suelen
tener
poco
en
común
en
este
ámbito,
y
existe
un
vicio
recurrente
de
la
Administración
Pública
española
que
lo
deja
bien
claro:
el
amor
de
ésta
por
los
documentos
PDF.
Pero,
¿por
qué
apostar
por
un
formato
de
archivo
concreto
podría
ir
en
detrimento
de
la
accesibilidad
y/o
la
transparencia?
El
ciberactivista
(y
hacker)
Jaime
Gómez-Obregón,
conocido
por
su
lucha
contra
la
opacidad
gubernamental,
acaba
de
abordar
en
X
este
debate
en
particular.
Para
el
ciberactivista,
la
diferencia
entre
datos
estructurados
y
desestructurados
es
clave,
y
lo
explica
con
un
ejemplo
para ‘dummies’:
«Datos
estructurados:
lo
que
sale
de
Excel.
Datos
desestructurados:
lo
que
sale
de
Word».
Hace
un
par
de
años,
hablando
sobre
la
importancia
de
liberar
los
datos
del
Registro
Mercantil,
Gómez-Obregón
difundió
este
vídeo
en
el
que
Hitler
explica
qué
se
puede
hacer
con
todos
esos
datos
estructurados:
Ejemplos
de ‘malas
prácticas’
Gómez-Obregón
denuncia
una
tendencia
preocupante
entre
los
políticos
y
administraciones:
el
uso
excesivo
y
muchas
veces
inapropiado
del
formato
PDF
para
divulgar
información
que,
por
ley,
debe
ser
pública
y
accesible.
El
ciberactivista
critica
que,
cuando
los
gobiernos
se
ven
obligados
a
publicar
información,
optan
por
hacerlo
en
PDF,
complicando
el
análisis
y
la
reutilización
de
los
datos.
Un
ejemplo
claro
de
esta
práctica
es,
según
él,
la
publicación
por
parte
del
Gobierno
de
la
lista
de
bienes
inmatriculados
por
la
Iglesia.
La
información,
que
debería
ser
accesible
y
fácilmente
manejable
por
medios
de
comunicación
y
entidades
cívicas,
fue
inicialmente
publicada
en
un
PDF
de
más
de
5000
páginas.
Esta
maniobra
fue
calificada
por
Gómez-Obregón
como «un
insulto».
Solo
después
del
revuelo
causado,
el
gobierno
decidió
publicar
la
lista
en
un
formato
estructurado,
como
una
hoja
de
cálculo,
facilitando
su
consulta
y
análisis.
También,
a
raíz
precisamente
de
otro
tuit
suyo,
la
Cámara
de
Zaragoza
retiró
de
su
web
un
documento
que
Gómez-Obregón
definió
como
un ‘récord
sideral’:
un
documento
PDF
de
24.000
páginas.
Aunque,
en
este
caso,
no
se
ha
publicado
en
ningún
otro
formato
alternativo.
Gómez-Obregón
señala
que
desestructurar
datos
es
fácil,
pero
estructurarlos
de
nuevo
puede
ser
extremadamente
complejo,
un
reto
al
que
se
enfrentan
constantemente
quienes
vigilan
la
Administración
Pública.
Como
parte
de
su
propio
trabajo
en
este
sentido,
Gómez-Obregón
destaca
lo
logrado
en
su
portal ‘gobiernovasco.marketing’,
donde
logró
convertir
datos
desestructurados
en
PDF
a
un
formato
estructurado
como
JSON.

¿Qué
tienen
que
tener
claro
los
políticos
y
los
funcionarios?
La
crítica
de
Gómez-Obregón
no
se
detiene
ahí.
Hay
tres
cosas
que,
según
nuestro
protagonista, «la
gente
de
la
Administración
debería
tener
súper
claro»:
-
PDF
no
es
un
contenedor
para
datos. «Si
estás
exportando
de
hoja
de
cálculo
a
PDF,
o
si
tu
PDF
solo
contiene
tablas,
seguramente
estés
haciéndolo
mal». -
PDF
no
es
un
documento
estructurado. «Sobre
datos
en
PDF
no
se
puede
hacer
análisis.
No
se
pueden
aplicar
fórmulas.
No
se
pueden
utilizar
métodos
informáticos
para
extraer
conclusiones». -
PDF
no
es
un
formato
web. «Cada
vez
que
desde
un
portal
oficial
enlazas
a
un
PDF,
un
gatito
muere».
Aunque
hay
quien
no
estaría
de
acuerdo
con
esto
último.
¿Usuarios
con
conocimientos
básicos
o
políticos
con
conocimientos
avanzados?
Lo
cierto
es
que
hace
años
que
ciberactivistas
y
periodistas
vienen
insistiendo
sobre
este
asunto,
y
los
poderes
públicos
no
sólo
siguen
usando
PDFs,
sino
incluso
PDFs
compuestos
de
imágenes
escaneadas,
lo
que
en
muchos
casos
obliga
a
recurrir
también
a
herramientas
OCR.
El
‘Principio
de
Hanlon’
reza «Nunca
atribuyas
a
la
maldad
lo
que
se
explica
adecuadamente
por
la
estupidez»,
pero
es
legítimo
preguntarse
si
en
este
caso
no
están
encubriendo
como
falta
de
conocimientos
informáticos
lo
que,
en
realidad,
no
es
sino
un
conveniente
y
constante
boicot
a
la
transparencia
de
la
Administración.
Imagen
|
Marcos
Merino
mediante
IA









































