Format czytelny maszynowo
Format czytelny maszynowo to ustrukturyzowany sposób prezentacji informacji, który systemy komputerowe mogą automatycznie przetwarzać i interpretować. W kontekście przejrzystości reklamy politycznej oznacza to, że dane dotyczące reklam muszą być udostępniane w formatach takich jak CSV, JSON lub XML — nie tylko w formatach czytelnych dla człowieka, takich jak pliki PDF czy obrazy — aby organy, naukowcy i społeczeństwo obywatelskie mogli sprawnie analizować i weryfikować dane dotyczące reklam.
Podstawa prawna
Chociaż rozporządzenie 2024/900 nie definiuje wprost „formatu czytelnego maszynowo", wymóg ten pojawia się w kontekście obowiązków przejrzystości:
„Państwa członkowskie wyznaczają jeden lub więcej właściwych organów odpowiedzialnych za nadzór i egzekwowanie niniejszego rozporządzenia... Organy te dysponują odpowiednimi zasobami technicznymi i finansowymi, lokalami i infrastrukturą niezbędnymi do skutecznego wykonywania swoich zadań".
— Artykuł 29, rozporządzenie 2024/900
RODO i przepisy dotyczące przenoszenia danych odnoszą się do formatów czytelnych maszynowo w sposób bardziej wyraźny:
„Osoba, której dane dotyczą, ma prawo otrzymać w ustrukturyzowanym, powszechnie używanym formacie nadającym się do odczytu maszynowego dane osobowe jej dotyczące".
— Artykuł 20 ust. 1, rozporządzenie 2016/679 (RODO)
Dlaczego to ważne
Formaty czytelne maszynowo są niezbędne dla skutecznego nadzoru nad przejrzystością reklamy politycznej. Gdy wydawcy i dostawcy usług reklamy politycznej prowadzą repozytoria przejrzystości i odpowiadają na wnioski o udzielenie informacji, dostarczanie danych w formatach czytelnych maszynowo umożliwia zautomatyzowaną analizę na dużą skalę obejmującą tysiące lub miliony reklam.
Dla właściwych organów nadzorujących zgodność z rozporządzeniem TTPA dane czytelne maszynowo umożliwiają skuteczne wzajemne sprawdzanie zawiadomień o przejrzystości, weryfikację informacji o sponsorach oraz wykrywanie wzorców, które mogą wskazywać na naruszenia — takie jak nieujawnione targetowanie lub brakujące oznaczenia. Ręczne przeglądanie nieustrukturyzowanych dokumentów uczyniłoby taki nadzór praktycznie niemożliwym w okresach wyborczych, gdy wolumen reklam gwałtownie wzrasta.
Dla naukowców, dziennikarzy i organizacji społeczeństwa obywatelskiego formaty czytelne maszynowo demokratyzują dostęp do danych dotyczących reklamy politycznej. Ci interesariusze mogą tworzyć narzędzia do śledzenia wydatków na kampanie, analizowania wzorców targetowania i rozliczania podmiotów politycznych — ale tylko wtedy, gdy dane są udostępniane w formatach, które ich oprogramowanie może automatycznie przetwarzać.
Kluczowe aspekty
- Dane ustrukturyzowane: Informacje są zorganizowane w przewidywalne pola (np. nazwa sponsora, data publikacji, zasięg), a nie w formie tekstu swobodnego
- Powszechne formaty: Obejmują CSV (wartości rozdzielane przecinkami), JSON (notacja obiektów JavaScript), XML (rozszerzalny język znaczników) oraz standaryzowane interfejsy API
- Automatyczne przetwarzanie: Umożliwia systemom komputerowym odczytywanie, analizowanie i agregowanie danych bez ręcznej interwencji
- Nie pliki PDF ani obrazy: Chociaż ludzie mogą czytać pliki PDF i zrzuty ekranu, formaty te wymagają ręcznego przeglądu lub złożonego rozpoznawania znaków optycznych (OCR) w celu wyodrębnienia danych
- Weryfikacja na dużą skalę: Umożliwia organom nadzorczym skuteczne kontrolowanie zgodności w odniesieniu do dużej liczby reklam politycznych
- Dostępność badawcza: Umożliwia niezależnym naukowcom i społeczeństwu obywatelskiemu analizowanie wzorców i wydatków na reklamę polityczną
Format czytelny maszynowo a format czytelny dla człowieka
Formaty czytelne dla człowieka, takie jak dokumenty PDF, pliki Word lub drukowane zawiadomienia o przejrzystości, umożliwiają osobom bezpośrednie czytanie i zrozumienie informacji o reklamach. Formaty czytelne maszynowo strukturyzują te same informacje w sposób umożliwiający ich automatyczne przetwarzanie przez komputery.
Oba często są potrzebne do zachowania zgodności z TTPA: zawiadomienia o przejrzystości muszą być zrozumiałe dla wyborców (czytelne dla człowieka), podczas gdy repozytoria danych i odpowiedzi na wnioski organów powinny być udostępniane w formatach umożliwiających zautomatyzowaną weryfikację i analizę (czytelne maszynowo). Tabela PDF z danymi reklamowymi jest czytelna dla człowieka, ale nie jest prawdziwie czytelna maszynowo; te same dane w pliku CSV są jednocześnie czytelne maszynowo i dla człowieka.
| Aspekt | Czytelny maszynowo | Tylko czytelny dla człowieka |
|---|---|---|
| Przykłady formatów | CSV, JSON, XML, API | PDF, DOCX, obrazy |
| Przetwarzanie komputerowe | Automatyczne | Wymaga ręcznego wprowadzania lub OCR |
| Typowe zastosowanie | Analiza danych, weryfikacja | Bezpośredni przegląd przez osoby |
| Skalowalność | Wysoka — miliony rekordów | Niska — wymagany ręczny przegląd |
Powiązane terminy
- Zawiadomienie o przejrzystości
- Usługa reklamy politycznej
- Wydawca
- Właściwy organ
- Repozytorium reklam
- Przenoszenie danych
- Techniki targetowania
- Sponsor
- Dostawca usług reklamy politycznej
- Weryfikacja