Машинночетим формат
Машинночетимият формат е структуриран начин за представяне на информация, който компютърните системи могат автоматично да обработват и интерпретират. За прозрачността на политическата реклама това означава, че данните за рекламите трябва да се предоставят във формати като CSV, JSON или XML — не само в четими от хора формати като PDF или изображения — така че органите, изследователите и гражданското общество да могат ефективно да анализират и проверяват рекламните данни.
Правно основание
Макар Регламент 2024/900 да не дефинира изрично „машинночетим формат", изискването се появява в контекста на задълженията за прозрачност:
„Държавите-членки определят един или повече компетентни органи, отговорни за надзора и прилагането на настоящия регламент... Тези органи разполагат с подходящи технически и финансови ресурси, помещения и инфраструктура, необходими за ефективното изпълнение на техните задачи."
— Член 29, Регламент 2024/900
GDPR и разпоредбите за преносимост на данни препращат към машинночетими формати по-изрично:
„Субектът на данни има правото да получи личните данни, които го засягат... в структуриран, широко използван и машинночетим формат."
— Член 20, параграф 1, Регламент 2016/679 (GDPR)
Защо е важно
Машинночетимите формати са от съществено значение за ефективен надзор на прозрачността в политическата реклама. Когато издателите и доставчиците на услуги за политическа реклама поддържат хранилища за прозрачност и отговарят на искания за информация, предоставянето на данни в машинночетими формати позволява автоматизиран анализ в мащаб на хиляди или милиони реклами.
За компетентните органи, надзиращи спазването на Регламента за TTPA, машинночетимите данни позволяват ефективна проверка на уведомленията за прозрачност, верификация на информацията за спонсорите и откриване на модели, които биха могли да указват нарушения — като неоповестено таргетиране или липсващи етикети. Ръчният преглед на неструктурирани документи би направил такъв надзор практически невъзможен по време на изборни периоди, когато обемите на рекламите нарастват рязко.
За изследователите, журналистите и организациите на гражданското общество машинночетимите формати демократизират достъпа до данни за политическата реклама. Тези заинтересовани страни могат да създават инструменти за проследяване на разходите за кампании, анализиране на моделите на таргетиране и възлагане на отчетност на политическите субекти — но само ако данните се предоставят във формати, които техният софтуер може да обработва автоматично.
Ключови моменти
- Структурирани данни: Информацията е организирана в предвидими полета (напр. име на спонсора, дата на публикуване, обхват), а не в свободен текст
- Общоприети формати: Включват CSV (стойности, разделени със запетая), JSON (JavaScript Object notation), XML (extensible markup language) и стандартизирани API
- Автоматизирана обработка: Позволява на компютърните системи да четат, анализират и агрегират данни без ръчна намеса
- Не PDF или изображения: Макар хората да могат да четат PDF файлове и екранни снимки, тези формати изискват ръчен преглед или сложно OCR (оптично разпознаване на символи) за извличане на данни
- Проверка в мащаб: Позволява на надзорните органи ефективно да одитират спазването на изискванията за големи обеми политически реклами
- Достъпност за изследвания: Позволява на независими изследователи и гражданското общество да анализират моделите и разходите за политическа реклама
Машинночетим формат спрямо четим от хора формат
Четимите от хора формати като PDF документи, Word файлове или отпечатани уведомления за прозрачност позволяват на хората директно да четат и разбират рекламната информация. Машинночетимите формати структурират същата информация така, че компютрите да могат автоматично да я обработват.
И двата типа често са необходими за спазване на TTPA: уведомленията за прозрачност трябва да бъдат разбираеми за избирателите (четими от хора), докато хранилищата с данни и отговорите на искания от органите следва да се предоставят във формати, които позволяват автоматизирана проверка и анализ (машинночетими). PDF таблица с рекламни данни е четима от хора, но не е истински машинночетима; същите данни в CSV файл са и двете.
| Аспект | Машинночетим | Само четим от хора |
|---|---|---|
| Примери за формати | CSV, JSON, XML, API | PDF, DOCX, изображения |
| Компютърна обработка | Автоматична | Изисква ръчно въвеждане или OCR |
| Типична употреба | Анализ на данни, проверка | Директен преглед от лица |
| Мащабируемост | Висока — милиони записи | Ниска — необходим е ръчен преглед |
Свързани термини
- Уведомление за прозрачност
- Услуга за политическа реклама
- Издател
- Компетентен орган
- Хранилище за реклами
- Преносимост на данните
- Техники за таргетиране
- Спонсор
- Доставчик на услуги за политическа реклама
- Проверка