Masinloetav vorming
Masinloetav vorming on struktureeritud viis teabe esitamiseks, mida arvutisüsteemid saavad automaatselt töödelda ja tõlgendada. Poliitilise reklaami läbipaistvuse puhul tähendab see, et reklaamide andmed tuleb esitada vormingutes nagu CSV, JSON või XML – mitte ainult inimloetavates vormingutes nagu PDF-id või pildid –, et ametiasutused, teadlased ja kodanikuühiskond saaksid reklaamiandmeid tõhusalt analüüsida ja kontrollida.
Õiguslik alus
Kuigi määrus 2024/900 ei defineeri „masinloetavat vormingut" selgesõnaliselt, esineb nõue läbipaistvuskohustuste kontekstis:
„Liikmesriigid määravad ühe või mitu pädevat asutust, kes vastutavad käesoleva määruse järelevalve ja täitmise eest... Neil asutustel peavad olema piisavad tehnilised ja rahalised ressursid, ruumid ja infrastruktuur, mis on vajalikud nende ülesannete tõhusaks täitmiseks."
— Artikkel 29, määrus 2024/900
Isikuandmete kaitse üldmäärus ja andmete ülekantavust käsitlevad sätted viitavad masinloetavatele vormingutele selgemalt:
„Andmesubjektil on õigus saada isikuandmeid, mis teda puudutavad... struktureeritud, üldkasutatavas ja masinloetavas vormingus."
— Artikkel 20 lõige 1, määrus 2016/679 (isikuandmete kaitse üldmäärus)
Miks see on oluline
Masinloetavad vormingud on hädavajalikud poliitilise reklaami tõhusaks läbipaistvuse järelevalveks. Kui väljaandjad ja poliitilise reklaami teenuste osutajad peavad läbipaistvuse hoidlaid ja vastavad teabenõuetele, võimaldab andmete esitamine masinloetavates vormingutes automaatset analüüsi suuremas mahus tuhandete või miljonite reklaamide puhul.
Pädevatele asutustele, kes teostavad järelevalvet TTPA määruse järgimise üle, võimaldavad masinloetavad andmed tõhusat läbipaistvusteadete ristkontrolli, sponsori teabe kontrollimist ja mustrite tuvastamist, mis võivad viidata rikkumistele – näiteks avalikustamata sihtimine või puuduvad märgised. Struktureerimata dokumentide käsitsi läbivaatamine muudaks sellise järelevalve praktiliselt võimatuks valimisperioodidel, kui reklaamimahud kasvavad.
Teadlaste, ajakirjanike ja kodanikuühiskonna organisatsioonide jaoks demokratiseerivad masinloetavad vormingud juurdepääsu poliitilise reklaami andmetele. Need sidusrühmad saavad luua vahendeid kampaaniakulutuste jälgimiseks, sihtimistavade analüüsimiseks ja poliitiliste tegijate vastutusele võtmiseks – kuid ainult juhul, kui andmed on esitatud vormingutes, mida nende tarkvara saab automaatselt töödelda.
Põhipunktid
- Struktureeritud andmed: teave on organiseeritud etteaimatavate väljadena (nt sponsori nimi, avaldamiskuupäev, ulatus), mitte vabas vormis tekstina
- Levinud vormingud: hõlmavad CSV (komaeraldusega väärtused), JSON (JavaScript Object Notation), XML (laiendatav märgistuskeel) ja standardiseeritud API-d
- Automaatne töötlemine: võimaldab arvutisüsteemidel andmeid lugeda, analüüsida ja koondada ilma käsitsi sekkumiseta
- Mitte PDF-id ega pildid: kuigi inimesed saavad PDF-e ja ekraanipilte lugeda, nõuavad need vormingud andmete ekstraheerimiseks käsitsi läbivaatamist või keerukat optilise märgituvastuse (OCR) tehnoloogiat
- Kontrollimine suuremas mahus: võimaldab järelevalveasutustel tõhusalt auditeerida vastavust suurte poliitiliste reklaamide mahtude puhul
- Uurimistöö kättesaadavus: võimaldab sõltumatutel teadlastel ja kodanikuühiskonnal analüüsida poliitilise reklaami mustreid ja kulutusi
Masinloetav vorming vs inimloetav vorming
Inimloetavad vormingud nagu PDF-dokumendid, Word-failid või trükitud läbipaistvusteated võimaldavad inimestel reklaamiteavet otse lugeda ja mõista. Masinloetavad vormingud struktureerivad sama teabe nii, et arvutid saavad seda automaatselt töödelda.
Mõlemat on sageli vaja TTPA nõuete täitmiseks: läbipaistvusteated peavad olema valijatele arusaadavad (inimloetavad), samas kui andmehoidlad ja vastused asutuste päringutele tuleks esitada vormingutes, mis võimaldavad automatiseeritud kontrollimist ja analüüsi (masinloetavad). PDF-tabel reklaamiandmetega on inimloetav, kuid mitte päriselt masinloetav; samad andmed CSV-failis on mõlemad.
| Aspekt | Masinloetav | Ainult inimloetav |
|---|---|---|
| Vormingu näited | CSV, JSON, XML, API | PDF, DOCX, pildid |
| Arvuti töötlemine | Automaatne | Nõuab käsitsi sisestamist või OCR-i |
| Tüüpiline kasutus | Andmeanalüüs, kontrollimine | Otsene läbivaatus üksikisikute poolt |
| Mastaapsus | Kõrge – miljonid kirjed | Madal – vajalik käsitsi läbivaatus |
Seotud mõisted
- Läbipaistvusteade
- Poliitilise reklaami teenus
- Väljaandja
- Pädev asutus
- Reklaamihoidla
- Andmete ülekandmine
- Sihtimisvõtted
- Sponsor
- Poliitilise reklaami teenuste osutaja
- Kontrollimine