Géppel olvasható formátum
A géppel olvasható formátum az információk strukturált megjelenítésének olyan módja, amelyet a számítógépes rendszerek automatikusan feldolgozhatnak és értelmezhetnek. A politikai hirdetések átláthatósága szempontjából ez azt jelenti, hogy a hirdetésekkel kapcsolatos adatokat olyan formátumokban kell rendelkezésre bocsátani, mint például a CSV, JSON vagy XML – nem csupán ember által olvasható formátumokban, mint a PDF-ek vagy képek –, hogy a hatóságok, kutatók és a civil társadalom hatékonyan elemezhessék és ellenőrizhessék a hirdetési adatokat.
Jogalap
Bár a 2024/900 rendelet nem határozza meg kifejezetten a „géppel olvasható formátum" fogalmát, a követelmény az átláthatósági kötelezettségek kontextusában jelenik meg:
„A tagállamok kijelölnek egy vagy több illetékes hatóságot, amelyek felelősek e rendelet felügyeletéért és végrehajtásáért... E hatóságoknak megfelelő technikai és pénzügyi forrásokkal, helyiségekkel és infrastruktúrával kell rendelkezniük feladataik hatékony ellátásához."
— 29. cikk, 2024/900 rendelet
A GDPR és az adathordozhatóságra vonatkozó rendelkezések egyértelműbben hivatkoznak a géppel olvasható formátumokra:
„Az érintett jogosult arra, hogy a rá vonatkozó, általa egy adatkezelő rendelkezésére bocsátott személyes adatokat tagolt, széles körben használt, géppel olvasható formátumban megkapja."
— 20. cikk (1) bekezdés, 2016/679 rendelet (GDPR)
Miért fontos
A géppel olvasható formátumok elengedhetetlenek a politikai hirdetések hatékony átláthatósági felügyeletéhez. Amikor a közzétevők és a politikai hirdetési szolgáltatások nyújtói átláthatósági adattárakat vezetnek és információkérésekre válaszolnak, az adatok géppel olvasható formátumban történő rendelkezésre bocsátása lehetővé teszi az automatizált elemzést nagy léptékben, akár több ezer vagy millió hirdetés esetében.
A TTPA-rendelet betartását felügyelő illetékes hatóságok számára a géppel olvasható adatok lehetővé teszik az átláthatósági közlemények hatékony ellenőrzését, a támogató információk ellenőrzését és olyan minták észlelését, amelyek szabálysértésekre utalhatnak – mint például a nem közölt célzás vagy hiányzó címkék. A strukturálatlan dokumentumok manuális áttekintése gyakorlatilag lehetetlenné tenné az ilyen felügyeletet választási időszakokban, amikor a hirdetések mennyisége megugrána.
A kutatók, újságírók és civil társadalmi szervezetek számára a géppel olvasható formátumok demokratizálják a politikai hirdetési adatokhoz való hozzáférést. Ezek az érdekelt felek eszközöket építhetnek a kampányköltések nyomon követésére, a célzási minták elemzésére és a politikai szereplők elszámoltathatóságának biztosítására – de csak akkor, ha az adatok olyan formátumokban állnak rendelkezésre, amelyeket szoftverük automatikusan feldolgozhat.
Főbb pontok
- Strukturált adatok: Az információk kiszámítható mezőkben vannak rendszerezve (pl. támogató neve, közzététel dátuma, elérés), nem szabadszöveges formában
- Általános formátumok: Ide tartoznak a CSV (vesszővel elválasztott értékek), JSON (JavaScript objektum jelölés), XML (bővíthető jelölőnyelv) és a szabványosított API-k
- Automatizált feldolgozás: Lehetővé teszi a számítógépes rendszerek számára, hogy manuális beavatkozás nélkül olvassák, elemezzék és összesítsék az adatokat
- Nem PDF-ek vagy képek: Bár az emberek olvashatják a PDF-eket és képernyőképeket, ezek a formátumok manuális áttekintést vagy összetett OCR-t (optikai karakterfelismerést) igényelnek az adatok kinyeréséhez
- Ellenőrzés nagy léptékben: Lehetővé teszi a felügyeleti hatóságok számára, hogy hatékonyan ellenőrizzék a megfelelést nagy mennyiségű politikai hirdetés esetében
- Kutatási hozzáférhetőség: Lehetővé teszi a független kutatók és a civil társadalom számára a politikai hirdetési minták és költések elemzését
Géppel olvasható formátum vs. ember által olvasható formátum
Az ember által olvasható formátumok, mint például a PDF-dokumentumok, Word-fájlok vagy nyomtatott átláthatósági közlemények lehetővé teszik az emberek számára, hogy közvetlenül elolvassák és megértsék a hirdetési információkat. A géppel olvasható formátumok ugyanazt az információt úgy strukturálják, hogy a számítógépek automatikusan feldolgozhassák.
Mindkettőre gyakran szükség van a TTPA-megfelelés érdekében: az átláthatósági közleményeknek érthetőnek kell lenniük a választók számára (ember által olvasható), míg az adattárakat és a hatósági kérésekre adott válaszokat olyan formátumokban kell rendelkezésre bocsátani, amelyek lehetővé teszik az automatizált ellenőrzést és elemzést (géppel olvasható). A hirdetési adatok PDF-táblázata ember által olvasható, de nem igazán géppel olvasható; ugyanazok az adatok CSV-fájlban mindkettő.
| Szempont | Géppel olvasható | Csak ember által olvasható |
|---|---|---|
| Formátum példák | CSV, JSON, XML, API | PDF, DOCX, képek |
| Számítógépes feldolgozás | Automatikus | Manuális bevitelt vagy OCR-t igényel |
| Jellemző felhasználás | Adatelemzés, ellenőrzés | Közvetlen áttekintés egyének által |
| Skálázhatóság | Magas – több millió rekord | Alacsony – manuális áttekintés szükséges |
Kapcsolódó fogalmak
- Átláthatósági közlemény
- Politikai hirdetési szolgáltatás
- Közzétevő
- Illetékes hatóság
- Hirdetési adattár
- Adathordozhatóság
- Célzási technikák
- Támogató
- Politikai hirdetési szolgáltatások nyújtói
- Ellenőrzés