Format lisible par machine
Un format lisible par machine est une façon structurée de présenter des informations que les systèmes informatiques peuvent traiter et interpréter automatiquement. Pour la transparence de la publicité politique, cela signifie que les données relatives aux publicités doivent être fournies dans des formats tels que CSV, JSON ou XML — et non uniquement dans des formats lisibles par l'homme comme les PDF ou les images — afin que les autorités, les chercheurs et la société civile puissent analyser et vérifier efficacement les données publicitaires.
Base juridique
Bien que le règlement 2024/900 ne définisse pas explicitement le « format lisible par machine », l'exigence apparaît dans le contexte des obligations de transparence :
« Les États membres désignent une ou plusieurs autorités compétentes chargées de la surveillance et de l'application du présent règlement... Ces autorités disposent de ressources techniques et financières, de locaux et d'infrastructures adéquats et nécessaires pour exercer efficacement leurs missions. »
— Article 29, règlement 2024/900
Le RGPD et les dispositions relatives à la portabilité des données font référence aux formats lisibles par machine de manière plus explicite :
« La personne concernée a le droit de recevoir les données à caractère personnel la concernant... dans un format structuré, couramment utilisé et lisible par machine. »
— Article 20, paragraphe 1, règlement 2016/679 (RGPD)
Pourquoi c'est important
Les formats lisibles par machine sont essentiels pour une surveillance efficace de la transparence dans la publicité politique. Lorsque les éditeurs et les prestataires de services de publicité politique tiennent des répertoires de transparence et répondent aux demandes d'information, la fourniture de données dans des formats lisibles par machine permet une analyse automatisée à grande échelle portant sur des milliers ou des millions de publicités.
Pour les autorités compétentes chargées de surveiller le respect du règlement TTPA, les données lisibles par machine permettent une vérification efficace des mentions de transparence, la vérification des informations relatives aux commanditaires et la détection de schémas pouvant indiquer des violations — telles que le ciblage non divulgué ou l'absence d'étiquetage. L'examen manuel de documents non structurés rendrait une telle surveillance pratiquement impossible pendant les périodes électorales où les volumes de publicité augmentent.
Pour les chercheurs, les journalistes et les organisations de la société civile, les formats lisibles par machine démocratisent l'accès aux données sur la publicité politique. Ces parties prenantes peuvent créer des outils pour suivre les dépenses de campagne, analyser les schémas de ciblage et tenir les acteurs politiques responsables — mais seulement si les données sont fournies dans des formats que leurs logiciels peuvent traiter automatiquement.
Points clés
- Données structurées : les informations sont organisées dans des champs prévisibles (par exemple, nom du commanditaire, date de publication, portée) plutôt que sous forme de texte libre
- Formats courants : comprennent CSV (valeurs séparées par des virgules), JSON (JavaScript Object Notation), XML (extensible markup language) et les API standardisées
- Traitement automatisé : permet aux systèmes informatiques de lire, d'analyser et d'agréger des données sans intervention manuelle
- Pas de PDF ou d'images : bien que les humains puissent lire les PDF et les captures d'écran, ces formats nécessitent un examen manuel ou une reconnaissance optique de caractères (OCR) complexe pour extraire les données
- Vérification à grande échelle : permet aux autorités de surveillance de contrôler efficacement la conformité d'un grand volume de publicités politiques
- Accessibilité pour la recherche : permet aux chercheurs indépendants et à la société civile d'analyser les schémas de publicité politique et les dépenses
Format lisible par machine vs. format lisible par l'homme
Les formats lisibles par l'homme, tels que les documents PDF, les fichiers Word ou les mentions de transparence imprimées, permettent aux personnes de lire et de comprendre directement les informations publicitaires. Les formats lisibles par machine structurent les mêmes informations afin que les ordinateurs puissent les traiter automatiquement.
Les deux sont souvent nécessaires pour la conformité au TTPA : les mentions de transparence doivent être compréhensibles pour les électeurs (lisibles par l'homme), tandis que les répertoires de données et les réponses aux demandes des autorités doivent être fournis dans des formats permettant la vérification et l'analyse automatisées (lisibles par machine). Un tableau de données publicitaires au format PDF est lisible par l'homme mais pas vraiment lisible par machine ; les mêmes données dans un fichier CSV le sont à la fois.
| Aspect | Lisible par machine | Lisible par l'homme uniquement |
|---|---|---|
| Exemples de formats | CSV, JSON, XML, API | PDF, DOCX, images |
| Traitement informatique | Automatique | Nécessite une saisie manuelle ou une OCR |
| Utilisation typique | Analyse de données, vérification | Examen direct par des personnes |
| Évolutivité | Élevée — des millions d'enregistrements | Faible — examen manuel nécessaire |
Termes connexes
- Mention de transparence
- Service de publicité politique
- Éditeur
- Autorité compétente
- Répertoire des publicités
- Portabilité des données
- Techniques de ciblage
- Commanditaire
- Prestataire de services de publicité politique
- Vérification