Formato legible por máquina
Un formato legible por máquina es una forma estructurada de presentar información que los sistemas informáticos pueden procesar e interpretar automáticamente. Para la transparencia de la publicidad política, esto significa que los datos sobre los anuncios deben proporcionarse en formatos como CSV, JSON o XML—no solo en formatos legibles por humanos como PDF o imágenes—para que las autoridades, los investigadores y la sociedad civil puedan analizar y verificar eficientemente los datos publicitarios.
Base jurídica
Aunque el Reglamento 2024/900 no define explícitamente "formato legible por máquina", el requisito aparece en el contexto de las obligaciones de transparencia:
"Los Estados miembros designarán una o varias autoridades competentes responsables de la supervisión y aplicación del presente Reglamento... Dichas autoridades dispondrán de recursos técnicos y financieros, locales e infraestructuras adecuados y necesarios para el desempeño efectivo de sus funciones."
— Artículo 29, Reglamento 2024/900
El RGPD y las disposiciones sobre portabilidad de datos hacen referencia a los formatos legibles por máquina de manera más explícita:
"El interesado tendrá derecho a recibir los datos personales que le incumban... en un formato estructurado, de uso común y lectura mecánica."
— Artículo 20(1), Reglamento 2016/679 (RGPD)
Por qué es importante
Los formatos legibles por máquina son esenciales para una supervisión eficaz de la transparencia en la publicidad política. Cuando los editores y prestadores de servicios de publicidad política mantienen repositorios de transparencia y responden a solicitudes de información, la entrega de datos en formatos legibles por máquina permite el análisis automatizado a escala de miles o millones de anuncios.
Para las autoridades competentes que supervisan el cumplimiento del Reglamento TTPA, los datos legibles por máquina permiten la verificación cruzada eficiente de los avisos de transparencia, la verificación de la información del patrocinador y la detección de patrones que podrían indicar infracciones—como segmentación no divulgada o etiquetas ausentes. La revisión manual de documentos no estructurados haría que dicha supervisión fuera prácticamente imposible durante los períodos electorales, cuando aumenta el volumen de publicidad.
Para los investigadores, periodistas y organizaciones de la sociedad civil, los formatos legibles por máquina democratizan el acceso a los datos de publicidad política. Estas partes interesadas pueden crear herramientas para rastrear el gasto de las campañas, analizar patrones de segmentación y exigir responsabilidades a los actores políticos—pero solo si los datos se proporcionan en formatos que su software pueda procesar automáticamente.
Puntos clave
- Datos estructurados: La información se organiza en campos predecibles (p. ej., nombre del patrocinador, fecha de publicación, alcance) en lugar de texto de formato libre
- Formatos comunes: Incluyen CSV (valores separados por comas), JSON (notación de objetos de JavaScript), XML (lenguaje de marcado extensible) y API estandarizadas
- Procesamiento automatizado: Permite que los sistemas informáticos lean, analicen y agreguen datos sin intervención manual
- No PDF ni imágenes: Aunque los humanos pueden leer PDF y capturas de pantalla, estos formatos requieren revisión manual u OCR (reconocimiento óptico de caracteres) complejo para extraer datos
- Verificación a escala: Permite a las autoridades de supervisión auditar eficientemente el cumplimiento en grandes volúmenes de anuncios políticos
- Accesibilidad para la investigación: Permite a investigadores independientes y a la sociedad civil analizar patrones de publicidad política y gastos
Formato legible por máquina vs. Formato legible por humanos
Los formatos legibles por humanos, como documentos PDF, archivos de Word o avisos de transparencia impresos, permiten a las personas leer y comprender directamente la información publicitaria. Los formatos legibles por máquina estructuran la misma información para que los ordenadores puedan procesarla automáticamente.
A menudo se necesitan ambos para el cumplimiento del TTPA: los avisos de transparencia deben ser comprensibles para los votantes (legibles por humanos), mientras que los repositorios de datos y las respuestas a las solicitudes de las autoridades deben proporcionarse en formatos que permitan la verificación y el análisis automatizados (legibles por máquina). Una tabla PDF de datos publicitarios es legible por humanos pero no verdaderamente legible por máquina; los mismos datos en un archivo CSV son ambas cosas.
| Aspecto | Legible por máquina | Solo legible por humanos |
|---|---|---|
| Ejemplos de formato | CSV, JSON, XML, API | PDF, DOCX, imágenes |
| Procesamiento informático | Automático | Requiere entrada manual u OCR |
| Uso habitual | Análisis de datos, verificación | Revisión directa por personas |
| Escalabilidad | Alta—millones de registros | Baja—se necesita revisión manual |
Términos relacionados
- Aviso de transparencia
- Servicio de publicidad política
- Editor
- Autoridad competente
- Repositorio de anuncios
- Portabilidad de datos
- Técnicas de segmentación
- Patrocinador
- Prestador de servicios de publicidad política
- Verificación