Metodologia
Identyfikacja beneficjentów
Głównym identyfikatorem beneficjentów w Polsce jest NIP (Numer Identyfikacji Podatkowej) — 10-cyfrowy numer nadawany przez urząd skarbowy. Używamy NIP do łączenia danych z różnych rejestrów (mapadotacji.gov.pl, KRS, REGON).
Część beneficjentów — szczególnie w danych Kohesio z platformy DG REGIO — nie posiada NIP w zbiorze danych, gdyż system UE nie wymagał tego identyfikatora. W takich przypadkach korzystamy z identyfikatora Kohesio (np. kohesio-Q4611933) i próbujemy dopasować podmiot przez wyszukiwanie nazwy.
Agregacja kwot
Kwoty projektów prezentujemy w dwóch walutach: EUR (kwota dofinansowania UE według regulacji europejskich) i PLN (kwota w złotych według kursu NBP).
Przeliczenie EUR/PLN następuje na podstawie średniego kursu NBP z roku realizacji projektu (Tabela A). Gdy dane o roku realizacji są niepełne, stosujemy kurs z roku podpisania umowy o dofinansowanie. W przypadku braku obu dat, stosujemy kurs z ostatniego dostępnego roku.
Agregaty (sumy per voivodato, per program, per rok) obliczamy po stronie bazy danych. Dokładność: 2 miejsca po przecinku dla EUR, 0 dla PLN.
Kwoty: dofinansowanie UE vs wartość projektu
Serwis prezentuje przede wszystkim kwotę dofinansowania UE (dotację europejską), nie całkowitą wartość projektu. Wartość projektu jest wyższa — obejmuje wkład własny beneficjenta (zwykle 15–50% kosztów).
Przykład: projekt o wartości 10 mln PLN z dofinansowaniem 85% = dotacja UE 8,5 mln PLN. W serwisie pokazujemy 8,5 mln PLN.
Aktualizacja danych
Dane aktualizujemy cyklicznie, pobierając nowe wersje plików z mapadotacji.gov.pl i Kohesio. Każda karta wskazuje datę ostatniej aktualizacji datasetu (pole "Dane pobrane").
Skrypt ETL jest w pełni automatyczny i idempotentny — wielokrotne uruchomienie nie tworzy duplikatów. Surowe pliki CSV są przechowywane lokalnie z datą pobrania i nie są commitowane do repozytorium (ze względu na rozmiar).
Ograniczenia danych
- Dane mogą zawierać opóźnienia wynikające z harmonogramu aktualizacji rejestrów źródłowych.
- Projekty 2021-2027 są w trakcie realizacji — kwoty będą się zmieniać w miarę certyfikowania wydatków.
- Część projektów posiada wiele beneficjentów (lider + partnerzy) — w takich przypadkach kwota przypisana jest do lidera.
- Dane o fizycznych osobach nie są publikowane — rejestr zawiera wyłącznie podmioty gospodarcze i instytucje publiczne.
Brak AI w danych surowych
Żadne kwoty, nazwy beneficjentów ani dane projektowe nie są generowane przez sztuczną inteligencję. Każda liczba pochodzi bezpośrednio z wyżej wymienionych rejestrów. AI jest używana wyłącznie do tworzenia treści redakcyjnych (opisy, glosariusz, poradniki) — i jest to zawsze wyraźnie zaznaczone.