Mašininis skaitomas formatas
Mašininis skaitomas formatas yra struktūrizuotas būdas pateikti informaciją, kurią kompiuterinės sistemos gali automatiškai apdoroti ir interpretuoti. Politinės reklamos skaidrumo atveju tai reiškia, kad duomenys apie reklamas turi būti pateikti tokiais formatais kaip CSV, JSON arba XML – ne tik žmogui suprantamais formatais, pvz., PDF ar vaizdais – kad valdžios institucijos, tyrėjai ir pilietinė visuomenė galėtų efektyviai analizuoti ir tikrinti reklamos duomenis.
Teisinis pagrindas
Nors Reglamente 2024/900 nėra aiškiai apibrėžtas „mašininis skaitomas formatas", ši sąvoka atsiranda skaidrumo įsipareigojimų kontekste:
„Valstybės narės paskiria vieną ar kelias kompetentingas institucijas, atsakingas už šio reglamento priežiūrą ir vykdymo užtikrinimą... Šios institucijos turi turėti tinkamus techninius ir finansinius išteklius, patalpas ir infrastruktūrą, būtinus veiksmingam jų užduočių atlikimui."
— 29 straipsnis, Reglamentas 2024/900
BDAR ir duomenų perkeliamumui taikomos nuostatos aiškiau nurodo mašininius skaitomus formatus:
„Duomenų subjektas turi teisę gauti savo asmens duomenis... struktūrizuotu, įprastai naudojamu ir kompiuterio skaitomu formatu."
— 20 straipsnio 1 dalis, Reglamentas 2016/679 (BDAR)
Kodėl tai svarbu
Mašininiai skaitomi formatai yra būtini veiksmingai politinės reklamos skaidrumo priežiūrai. Kai leidėjai ir politinės reklamos paslaugų teikėjai tvarko skaidrumo saugyklas ir atsako į informacijos užklausas, duomenų pateikimas mašininiais skaitomais formatais leidžia atlikti automatizuotą analizę dideliu mastu, apimančią tūkstančius ar milijonus reklamų.
Kompetentingoms institucijoms, prižiūrinčioms atitiktį TTPA reglamentui, mašininiai skaitomi duomenys leidžia efektyviai tikrinti skaidrumo pranešimus, patikrinti rėmėjų informaciją ir nustatyti modelius, kurie gali rodyti pažeidimus – pvz., neatskleidžiant tikslinimo arba nepaliekant žymų. Nestruktūrizuotų dokumentų peržiūra rankiniu būdu padarytų tokią priežiūrą praktiškai neįmanomą per rinkimų laikotarpius, kai reklamos apimtys išauga.
Tyrejams, žurnalistams ir pilietinės visuomenės organizacijoms mašininiai skaitomi formatai demokratizuoja prieigą prie politinės reklamos duomenų. Šios suinteresuotosios šalys gali kurti įrankius kampanijos išlaidoms sekti, tikslinimo modeliams analizuoti ir politiniams subjektams traukti atsakomybėn – tačiau tik tuo atveju, jei duomenys pateikti formatais, kuriuos jų programinė įranga gali apdoroti automatiškai.
Pagrindiniai aspektai
- Struktūrizuoti duomenys: Informacija yra organizuota nuspėjamuose laukuose (pvz., rėmėjo pavadinimas, paskelbimo data, pasiekiamumas), o ne laisva forma parašytame tekste
- Įprasti formatai: Apima CSV (kableliu atskirtų reikšmių), JSON (JavaScript objekto užrašą), XML (išplėstinę žymėjimo kalbą) ir standartizuotas API
- Automatinis apdorojimas: Leidžia kompiuterinėms sistemoms skaityti, analizuoti ir apjungti duomenis be rankinio įsikišimo
- Ne PDF ar vaizdai: Nors žmonės gali skaityti PDF ir ekrano kopijas, šiems formatams reikia rankinio peržiūrėjimo arba sudėtingo OCR (optinio simbolių atpažinimo), kad būtų išgauti duomenys
- Patikrinimas dideliu mastu: Leidžia priežiūros institucijoms efektyviai audituoti atitiktį didelių politinės reklamos kiekių atveju
- Tyrimų prieinamumas: Leidžia nepriklausomiems tyrejams ir pilietinei visuomenei analizuoti politinės reklamos modelius ir išlaidas
Mašininis skaitomas formatas palyginti su žmogui skaitomu formatu
Žmogui skaitomi formatai, tokie kaip PDF dokumentai, Word failai ar spausdinti skaidrumo pranešimai, leidžia žmonėms tiesiogiai skaityti ir suprasti reklamos informaciją. Mašininiai skaitomi formatai struktūrizuoja tą pačią informaciją taip, kad kompiuteriai galėtų ją automatiškai apdoroti.
Dažnai reikalingi abu formatai, kad būtų laikomasi TTPA: skaidrumo pranešimai turi būti suprantami rinkėjams (žmogui skaitomi), o duomenų saugyklos ir atsakymai į institucijų užklausas turėtų būti pateikti formatais, kurie leidžia automatizuotą patikrinimą ir analizę (mašininiai skaitomi). PDF lentelė su reklamos duomenimis yra žmogui skaitoma, bet ne tikrai mašininis skaitoma; tie patys duomenys CSV faile yra ir viena, ir kita.
| Aspektas | Mašininis skaitomas | Tik žmogui skaitomas |
|---|---|---|
| Formatų pavyzdžiai | CSV, JSON, XML, API | PDF, DOCX, vaizdai |
| Kompiuterinis apdorojimas | Automatinis | Reikia rankinio įvedimo ar OCR |
| Įprastas naudojimas | Duomenų analizė, patikrinimas | Tiesioginis asmenų peržiūrėjimas |
| Mastelis | Didelis – milijonai įrašų | Mažas – reikia rankinio peržiūrėjimo |
Susiję terminai
- Skaidrumo pranešimas
- Politinės reklamos paslauga
- Leidėjas
- Kompetentinga institucija
- Reklamos saugykla
- Duomenų perkeliamumas
- Tikslinimo metodai
- Rėmėjas
- Politinės reklamos paslaugų teikėjas
- Patikrinimas