Mašīnlasāms formāts
Mašīnlasāms formāts ir strukturēts veids, kā prezentēt informāciju, ko datorsistēmas var automātiski apstrādāt un interpretēt. Politiskās reklāmas pārredzamībai tas nozīmē, ka dati par reklāmām ir jāsniedz tādos formātos kā CSV, JSON vai XML — ne tikai cilvēkiem lasāmos formātos, piemēram, PDF vai attēlos —, lai iestādes, pētnieki un pilsoniskā sabiedrība varētu efektīvi analizēt un verificēt reklāmas datus.
Juridiskais pamats
Lai gan Regula 2024/900 skaidri nedefinē "mašīnlasāmu formātu", prasība parādās pārredzamības pienākumu kontekstā:
"Dalībvalstis izraugās vienu vai vairākas kompetentās iestādes, kas ir atbildīgas par šīs regulas uzraudzību un izpildi... Šīm iestādēm ir jābūt atbilstošiem tehniskajiem un finanšu resursiem, telpām un infrastruktūrai, kas nepieciešama to uzdevumu efektīvai izpildei."
— 29. pants, Regula 2024/900
VDAR un datu pārnesamības noteikumi skaidrāk atsaucas uz mašīnlasāmiem formātiem:
"Datu subjektam ir tiesības saņemt personas datus, kas to attiecas... strukturētā, plaši izmantotā un mašīnlasāmā formātā."
— 20. panta 1. punkts, Regula 2016/679 (VDAR)
Kāpēc tas ir svarīgi
Mašīnlasāmi formāti ir būtiski efektīvai pārredzamības uzraudzībai politiskajā reklāmā. Kad izdevēji un politiskās reklāmas pakalpojumu sniedzēji uztur pārredzamības repozitorijus un atbild uz informācijas pieprasījumiem, datu sniegšana mašīnlasāmos formātos ļauj veikt automatizētu analīzi liela mēroga apjomā tūkstošos vai miljonos reklāmu.
Kompetentajām iestādēm, kas uzrauga atbilstību TTPA regulai, mašīnlasāmi dati ļauj efektīvi veikt pārredzamības paziņojumu pārbaudi, sponsoru informācijas verificēšanu un tādu modeļu atklāšanu, kas varētu liecināt par pārkāpumiem — piemēram, neatklātu mērķauditorijas atlasi vai trūkstošām etiķetēm. Nestrukturētu dokumentu manuāla pārskatīšana padarītu šādu uzraudzību praktiski neiespējamu vēlēšanu periodos, kad reklāmas apjomi strauji pieaug.
Pētniekiem, žurnālistiem un pilsoniskās sabiedrības organizācijām mašīnlasāmi formāti demokratizē piekļuvi politiskās reklāmas datiem. Šīs ieinteresētās personas var izveidot rīkus, lai izsekotu kampaņu izdevumiem, analizētu mērķauditorijas atlases modeļus un sauktu pie atbildības politiskos dalībniekus — bet tikai tad, ja dati ir sniegti formātos, ko to programmatūra var automātiski apstrādāt.
Galvenie punkti
- Strukturēti dati: Informācija ir organizēta paredzamos laukos (piemēram, sponsora nosaukums, publikācijas datums, sasniedzamība), nevis brīvā teksta formātā
- Izplatīti formāti: Ietver CSV (ar komatiem atdalītas vērtības), JSON (JavaScript objektu pieraksts), XML (paplašināma iezīmēšanas valoda) un standartizēti API
- Automatizēta apstrāde: Ļauj datorsistēmām lasīt, analizēt un apkopot datus bez manuālas iejaukšanās
- Ne PDF vai attēli: Lai gan cilvēki var lasīt PDF un ekrānuzņēmumus, šiem formātiem ir nepieciešama manuāla pārskatīšana vai sarežģīta OCR (optiskā rakstzīmju atpazīšana), lai izvilktu datus
- Verifikācija liela mēroga apjomā: Ļauj uzraudzības iestādēm efektīvi auditēt atbilstību lielā politisko reklāmu apjomā
- Pētniecības pieejamība: Ļauj neatkarīgiem pētniekiem un pilsoniskajai sabiedrībai analizēt politiskās reklāmas modeļus un izdevumus
Mašīnlasāms formāts pret cilvēkiem lasāmu formātu
Cilvēkiem lasāmi formāti, piemēram, PDF dokumenti, Word faili vai drukāti pārredzamības paziņojumi, ļauj cilvēkiem tieši lasīt un saprast reklāmas informāciju. Mašīnlasāmi formāti strukturē to pašu informāciju tā, lai datori varētu to automātiski apstrādāt.
Abi bieži ir nepieciešami TTPA atbilstībai: pārredzamības paziņojumiem ir jābūt saprotamiem vēlētājiem (cilvēkiem lasāmi), turpretī datu repozitoriji un atbildes uz iestāžu pieprasījumiem ir jāsniedz formātos, kas ļauj veikt automatizētu verifikāciju un analīzi (mašīnlasāmi). PDF tabula ar reklāmas datiem ir cilvēkiem lasāma, bet nav īsti mašīnlasāma; tie paši dati CSV failā ir abi.
| Aspekts | Mašīnlasāms | Tikai cilvēkiem lasāms |
|---|---|---|
| Formātu piemēri | CSV, JSON, XML, API | PDF, DOCX, attēli |
| Datora apstrāde | Automātiska | Nepieciešama manuāla ievade vai OCR |
| Tipiska lietošana | Datu analīze, verifikācija | Tieša personu pārskatīšana |
| Mērogojamība | Augsta — miljoni ierakstu | Zema — nepieciešama manuāla pārskatīšana |
Saistītie termini
- Pārredzamības paziņojums
- Politiskās reklāmas pakalpojums
- Izdevējs
- Kompetentā iestāde
- Reklāmu repozitorijs
- Datu pārnesamība
- Mērķauditorijas atlases metodes
- Sponsors
- Politiskās reklāmas pakalpojumu sniedzējs
- Verifikācija