«A nuestros políticos les flipa el PDF». Es el mejor modo de ocultar cosas a plena vista, según denuncia este ciberactivista

0
80

En
el
discurso
político
cotidiano
no
es
raro
que
salgan
a
colación
conceptos
como ‘Administración
Electrónica’, ‘accesibilidad’
o ‘transparencia’.
Pero ‘discurso’
y ‘hechos’
suelen
tener
poco
en
común
en
este
ámbito,
y
existe

un
vicio
recurrente
de
la
Administración
Pública

española
que
lo
deja
bien
claro:

el
amor
de
ésta
por
los
documentos
PDF
.

Pero,
¿por
qué
apostar
por
un
formato
de
archivo
concreto
podría
ir
en
detrimento
de
la
accesibilidad
y/o
la
transparencia?
El
ciberactivista
(y
hacker
)
Jaime
Gómez-Obregón,
conocido
por

su
lucha
contra
la
opacidad
gubernamental
,
acaba
de
abordar

en
X

este
debate
en
particular.

Para
el
ciberactivista,
la
diferencia
entre

datos
estructurados
y
desestructurados

es
clave,
y
lo
explica
con
un
ejemplo
para ‘dummies’:

«Datos
estructurados:
lo
que
sale
de
Excel.
Datos
desestructurados:
lo
que
sale
de
Word».

Hace
un
par
de
años,
hablando
sobre
la
importancia
de
liberar
los
datos
del
Registro
Mercantil,
Gómez-Obregón
difundió
este
vídeo
en
el
que
Hitler
explica

qué
se
puede
hacer
con
todos
esos
datos
estructurados
:

Ejemplos
de ‘malas
prácticas’

Gómez-Obregón
denuncia
una
tendencia
preocupante
entre
los
políticos
y
administraciones:
el
uso
excesivo
y
muchas
veces
inapropiado
del
formato
PDF
para
divulgar
información
que,
por
ley,
debe
ser
pública
y
accesible.
El
ciberactivista
critica
que,

cuando
los
gobiernos
se
ven
obligados
a
publicar
información,
optan
por
hacerlo
en
PDF
,
complicando
el
análisis
y
la
reutilización
de
los
datos.

Un
ejemplo
claro
de
esta
práctica
es,
según
él,
la
publicación
por
parte
del
Gobierno
de
la
lista
de
bienes
inmatriculados
por
la
Iglesia.
La
información,
que
debería
ser
accesible
y
fácilmente
manejable
por
medios
de
comunicación
y
entidades
cívicas,
fue
inicialmente
publicada
en

un
PDF
de
más
de
5000
páginas.
Esta
maniobra
fue
calificada
por
Gómez-Obregón
como «un
insulto»
.

Solo
después
del
revuelo
causado,
el
gobierno
decidió
publicar
la
lista
en
un
formato
estructurado,
como
una
hoja
de
cálculo,
facilitando
su
consulta
y
análisis.
También,
a
raíz
precisamente
de

otro
tuit

suyo,
la
Cámara
de
Zaragoza
retiró
de
su
web
un
documento
que
Gómez-Obregón
definió
como

un ‘récord
sideral’:
un
documento
PDF
de
24.000
páginas
.
Aunque,
en
este
caso,
no
se
ha
publicado
en
ningún
otro
formato
alternativo.

Gómez-Obregón
señala
que
desestructurar
datos
es
fácil,
pero

estructurarlos
de
nuevo
puede
ser
extremadamente
complejo
,
un
reto
al
que
se
enfrentan
constantemente
quienes
vigilan
la
Administración
Pública.
Como
parte
de
su
propio
trabajo
en
este
sentido,
Gómez-Obregón

destaca
lo
logrado
en
su
portal ‘gobiernovasco.marketing’
,
donde
logró
convertir
datos
desestructurados
en
PDF
a
un
formato
estructurado
como
JSON.

Elpdf

Elpdf

¿Qué
tienen
que
tener
claro
los
políticos
y
los
funcionarios?

La
crítica
de
Gómez-Obregón
no
se
detiene
ahí.
Hay
tres
cosas
que,
según
nuestro
protagonista, «la
gente
de
la
Administración
debería
tener
súper
claro»:


  • PDF
    no
    es
    un
    contenedor
    para
    datos.
    «Si
    estás
    exportando
    de
    hoja
    de
    cálculo
    a
    PDF,
    o
    si
    tu
    PDF
    solo
    contiene
    tablas,
    seguramente
    estés
    haciéndolo
    mal».

  • PDF
    no
    es
    un
    documento
    estructurado.
    «Sobre
    datos
    en
    PDF
    no
    se
    puede
    hacer
    análisis.
    No
    se
    pueden
    aplicar
    fórmulas.
    No
    se
    pueden
    utilizar
    métodos
    informáticos
    para
    extraer
    conclusiones».

  • PDF
    no
    es
    un
    formato
    web.
    «Cada
    vez
    que
    desde
    un
    portal
    oficial
    enlazas
    a
    un
    PDF,
    un
    gatito
    muere».
    Aunque
    hay
    quien

    no
    estaría
    de
    acuerdo

    con
    esto
    último.

¿Usuarios
con
conocimientos
básicos
o
políticos
con
conocimientos
avanzados?

Lo
cierto
es
que
hace
años
que
ciberactivistas
y
periodistas
vienen
insistiendo
sobre
este
asunto,
y
los
poderes
públicos

no
sólo
siguen
usando
PDFs,
sino
incluso
PDFs
compuestos
de
imágenes
escaneadas
,
lo
que
en
muchos
casos
obliga
a
recurrir
también
a
herramientas
OCR.

El
‘Principio
de
Hanlon’

reza «Nunca
atribuyas
a
la
maldad
lo
que
se
explica
adecuadamente
por
la
estupidez»,
pero
es
legítimo
preguntarse
si
en
este
caso
no
están
encubriendo
como
falta
de
conocimientos
informáticos
lo
que,
en
realidad,
no
es
sino

un
conveniente
y
constante
boicot
a
la
transparencia
de
la
Administración
.

Imagen
|
Marcos
Merino
mediante
IA

En
Genbeta
|

Tus
impuestos
mantienen
un
acortador
de
URLs
oficial…
pero
el
Gobierno
de
España
prefiere
utilizar
uno
inseguro
de
terceros