Shape Shape Shape Shape
Zintegrowany System Danych Publicznych

Agregator danych publicznych

W ramach tego projektu stworzyliśmy kompleksowy system przetwarzania i integracji danych z różnych publicznych rejestrów, w tym Krajowego Rejestru Sądowego (KRS), Białej Listy VAT, SUDOP oraz Centralnego Rejestru Beneficjentów Rzeczywistych (CRBR). Nasza platforma gromadzi informacje o ponad 800 000 organizacjach z KRS, dostarczając cyfrowy dostęp do ich szczegółowych danych rejestrowych oraz powiązań osobowo-kapitałowych.

Dzięki zastosowanym rozwiązaniom, system umożliwia nie tylko przetwarzanie danych osobowych zawartych w odpisach KRS, ale także analizę relacji kapitałowych między firmami i organizacjami, gromadzenie danych o pomocy publicznej oraz integrację tych danych z innymi systemami za pomocą API. Całość działa na infrastrukturze, która automatycznie aktualizuje dane codziennie, gwarantując 100% aktualność informacji.

Główne funkcjonalności:

  1. Przetwarzanie odpisów KRS: System automatycznie pobiera odpisy z Krajowego Rejestru Sądowego i przetwarza je w celu pozyskania danych rejestrowych oraz osobowych. Dzięki temu możliwa jest identyfikacja powiązań osobowo-kapitałowych między organizacjami oraz dostęp do szczegółowych informacji o ich zarządach, wspólnikach, a także innych kluczowych osobach.
  2. Gromadzenie danych o pomocy publicznej: Projekt integruje również dane dotyczące pomocy publicznej przyznawanej organizacjom, co pozwala na pełny wgląd w wsparcie finansowe otrzymywane przez podmioty. Informacje te są szczególnie istotne dla monitorowania działalności firm i organizacji non-profit.
  3. Repozytorium akt rejestrowych: System pobiera dane z repozytorium akt rejestrowych, które zawiera dodatkowe dokumenty dotyczące działalności organizacji. Pozwala to na pozyskanie pełnych informacji o strukturze prawnej i działaniach każdej z organizacji.
  4. Przetwarzanie sprawozdań finansowych: Oprócz podstawowych informacji rejestrowych, nasza platforma pobiera i przetwarza sprawozdania finansowe publikowane w KRS. System konwertuje te dokumenty w czytelny, przejrzysty format, co umożliwia łatwy dostęp do danych finansowych użytkownikom końcowym oraz partnerom biznesowym.
  5. API i inne formy integracji: Oferujemy cyfrowy dostęp do danych rejestrowych za pośrednictwem API, umożliwiając integrację z innymi systemami zewnętrznymi. To kluczowe rozwiązanie, które wspiera automatyzację procesów w firmach i organizacjach, pozwalając na bezpośrednie pobieranie danych bez potrzeby ręcznego przeszukiwania rejestrów.
  6. Codzienna aktualizacja danych: System jest skonfigurowany do codziennego pobierania i aktualizowania danych z rejestrów. Dzięki temu użytkownicy zawsze mają dostęp do najbardziej aktualnych informacji, co zwiększa wiarygodność i precyzję danych udostępnianych na platformie.

Wyzwania:

Jednym z największych wyzwań w projekcie była obsługa tak dużej ilości danych pochodzących z wielu rejestrów. Każdego dnia system pobiera, przetwarza i aktualizuje dane dotyczące ponad 800 000 organizacji, co wymagało nie tylko optymalizacji procesów technicznych, ale także zbudowania wydajnej i skalowalnej infrastruktury.

  • Obsługa dużych ilości danych: Pobieranie i przetwarzanie danych z wielu rejestrów publicznych jednocześnie stanowiło ogromne wyzwanie ze względu na różnorodność formatów i struktur danych, a także potrzebę synchronizacji z rejestrami, które regularnie aktualizują swoje bazy.
  • Optymalizacja procesów: Zbudowanie efektywnego systemu do przetwarzania danych wymagało zaawansowanej optymalizacji procesów pobierania oraz przetwarzania. Każdy etap — od pobierania danych z rejestrów po ich zapis w bazie danych MySQL — został zoptymalizowany pod kątem szybkości i niezawodności, aby obsługiwać duże ilości danych bez opóźnień.
  • Zarządzanie zgodnością z regulacjami: Projekt musiał być zgodny z przepisami dotyczącymi ochrony danych osobowych (RODO), co wymagało dodatkowych zabezpieczeń i procedur, zwłaszcza w kontekście przetwarzania danych osobowych zawartych w odpisach KRS.

Technologie:

Projekt został zbudowany w oparciu o sprawdzone i skalowalne technologie:

  • Laravel: Framework Laravel został użyty do budowy backendu aplikacji, zapewniając solidne i bezpieczne fundamenty systemu. Laravel oferuje zaawansowane mechanizmy obsługi baz danych, co było kluczowe przy zarządzaniu tak dużą ilością danych.
  • MySQL: Jako baza danych wykorzystaliśmy MySQL, co pozwoliło na efektywne przechowywanie i zarządzanie danymi. MySQL jest skalowalną bazą, która świetnie sprawdza się w środowiskach o dużej liczbie transakcji i zapytań.
  • Python: W miejscach, gdzie było to potrzebne, np. przy analizie danych finansowych lub zaawansowanym przetwarzaniu plików, wykorzystaliśmy język Python. Jego wszechstronność i potężne biblioteki sprawiły, że był idealnym wyborem do przetwarzania dużych zbiorów danych.

Kluczowe osiągnięcia:

  1. Stworzenie wydajnego systemu przetwarzania danych: Pomimo ogromnej liczby przetwarzanych danych oraz częstych aktualizacji, udało się stworzyć system, który automatycznie i bez opóźnień synchronizuje się z zewnętrznymi rejestrami, gwarantując użytkownikom dostęp do zawsze aktualnych informacji.
  2. Automatyzacja procesów przetwarzania sprawozdań finansowych: Dzięki zaawansowanemu przetwarzaniu sprawozdań finansowych, udało się przedstawić skomplikowane dane w przejrzysty i zrozumiały sposób, co znacznie ułatwiło korzystanie z tych informacji zarówno przez użytkowników, jak i partnerów biznesowych.
  3. Integracja z repozytorium akt rejestrowych: Pobieranie akt rejestrowych dla każdej organizacji z repozytorium stanowiło kluczowy element projektu, umożliwiający użytkownikom pełny wgląd w dokumentację prawną i działalność organizacji.
  4. Skalowalność i stabilność: System został zaprojektowany z myślą o przyszłej skalowalności, dzięki czemu z łatwością można rozszerzać jego funkcjonalność oraz obsługiwać coraz większą liczbę użytkowników i zapytań.