Metodologia

Identyfikacja beneficjentów

Głównym identyfikatorem beneficjentów w Polsce jest NIP (Numer Identyfikacji Podatkowej) — 10-cyfrowy numer nadawany przez urząd skarbowy. Używamy NIP do łączenia danych z różnych rejestrów (mapadotacji.gov.pl, KRS, REGON).

Część beneficjentów — szczególnie w danych Kohesio z platformy DG REGIO — nie posiada NIP w zbiorze danych, gdyż system UE nie wymagał tego identyfikatora. W takich przypadkach korzystamy z identyfikatora Kohesio (np. kohesio-Q4611933) i próbujemy dopasować podmiot przez wyszukiwanie nazwy.

Agregacja kwot

Kwoty projektów prezentujemy w dwóch walutach: EUR (kwota dofinansowania UE według regulacji europejskich) i PLN (kwota w złotych według kursu NBP).

Przeliczenie EUR/PLN następuje na podstawie średniego kursu NBP z roku realizacji projektu (Tabela A). Gdy dane o roku realizacji są niepełne, stosujemy kurs z roku podpisania umowy o dofinansowanie. W przypadku braku obu dat, stosujemy kurs z ostatniego dostępnego roku.

Agregaty (sumy per voivodato, per program, per rok) obliczamy po stronie bazy danych. Dokładność: 2 miejsca po przecinku dla EUR, 0 dla PLN.

Kwoty: dofinansowanie UE vs wartość projektu

Serwis prezentuje przede wszystkim kwotę dofinansowania UE (dotację europejską), nie całkowitą wartość projektu. Wartość projektu jest wyższa — obejmuje wkład własny beneficjenta (zwykle 15–50% kosztów).

Przykład: projekt o wartości 10 mln PLN z dofinansowaniem 85% = dotacja UE 8,5 mln PLN. W serwisie pokazujemy 8,5 mln PLN.

Aktualizacja danych

Dane aktualizujemy cyklicznie, pobierając nowe wersje plików z mapadotacji.gov.pl i Kohesio. Każda karta wskazuje datę ostatniej aktualizacji datasetu (pole "Dane pobrane").

Skrypt ETL jest w pełni automatyczny i idempotentny — wielokrotne uruchomienie nie tworzy duplikatów. Surowe pliki CSV są przechowywane lokalnie z datą pobrania i nie są commitowane do repozytorium (ze względu na rozmiar).

Ograniczenia danych

  • Dane mogą zawierać opóźnienia wynikające z harmonogramu aktualizacji rejestrów źródłowych.
  • Projekty 2021-2027 są w trakcie realizacji — kwoty będą się zmieniać w miarę certyfikowania wydatków.
  • Część projektów posiada wiele beneficjentów (lider + partnerzy) — w takich przypadkach kwota przypisana jest do lidera.
  • Dane o fizycznych osobach nie są publikowane — rejestr zawiera wyłącznie podmioty gospodarcze i instytucje publiczne.

Brak AI w danych surowych

Żadne kwoty, nazwy beneficjentów ani dane projektowe nie są generowane przez sztuczną inteligencję. Każda liczba pochodzi bezpośrednio z wyżej wymienionych rejestrów. AI jest używana wyłącznie do tworzenia treści redakcyjnych (opisy, glosariusz, poradniki) — i jest to zawsze wyraźnie zaznaczone.

Źródła danych →Zasięg danych →Kontakt →