Oparty na zdarzeniach framework ETL dla ADF i Snowflake

mar 7, 2024

Tablica ze znacznikami czasu

Wprowadzenie

W obliczu dynamicznie zmieniającego się świata finansów, fundusz inwestycyjny o włosko-holenderskich korzeniach, posiadający oddział w Irlandii, stanął przed wyzwaniem modernizacji swoich przestarzałych systemów przetwarzania danych. Klient, wykorzystujący dotychczasowe rozwiązania oparte na SSIS (SQL Server Integration Services), zdecydował się na przejście na nowoczesną technologię w celu poprawy efektywności i elastyczności operacyjnej. Głównym celem była integracja oraz przetwarzanie danych pochodzących z różnorodnych źródeł, w tym danych giełdowych, w celu utworzenia nowego systemu raportowania. Wybór padł na platformę Snowflake, cenioną za jej zdolności do zarządzania zbiorami podobnych plików i elastyczność w obsłudze danych.

Problem

Kluczowym wyzwaniem było przetworzenie i integracja danych z różnorodnych formatów plików, w tym plików Excel i archiwów ZIP, bez konieczności tworzenia skomplikowanych transformacji danych dla każdego nowego źródła. Pierwotny plan zakładał zatrudnienie dodatkowych deweloperów do przeprojektowania systemu, jednakże propozycja automatyzacji procesu ładowania danych wydawała się bardziej efektywnym i oszczędzającym koszty rozwiązaniem.

Rozwiązanie

Zaproponowane rozwiązanie polegało na zbudowaniu harmonogramu ładowania danych przy ograniczonej przepustowości, z wykorzystaniem architektury event-driven opartej o Azure Event Hub. Pozwoliło to na natychmiastowe ładowanie dostępnych danych bez konieczności oczekiwania na pojawienie się wszystkich plików, znacząco redukując czas oczekiwania na zasoby i umożliwiając elastyczne zarządzanie kolejnością ładowania danych. System został zaprojektowany w taki sposób, aby był w stanie generować zdarzenia na podstawie pojawiających się plików, co z kolei uruchamiało kolejne etapy przetwarzania danych. Zastąpienie sztywnego harmonogramu ładowania przez system zdarzeń znacząco zwiększyło efektywność i skalowalność procesu.

Do realizacji projektu wykorzystano narzędzia takie jak Azure SQL Database, Azure Data Factory, oraz Azure Event Hub. Użycie Azure Data Factory umożliwiło ujednolicenie komunikacji i mapowania plików, co uprościło zarządzanie procesem ładowania danych. Interesującym aspektem projektu była rezygnacja z wykorzystania Informatica, co pozwoliło klientowi na oszczędności, pokazując, że wybrane narzędzia Azure w pełni zaspokoiły potrzeby projektu.

Wnioski

Implementacja nowego systemu przetwarzania danych przyniosła funduszowi szereg korzyści, w tym większą bezawaryjność, lepszą kontrolę pików obciążenia oraz oszczędności czasu i pieniędzy dzięki automatyzacji procesów. Jednym z kluczowych wniosków jest fakt, że system zbudowany na architekturze event-driven pozwala na szybką reakcję na ewentualne błędy, nie blokując całego systemu, co zwiększa jego odporność i efektywność. Dzięki centralizacji definicji ładowania plików, każda poprawka lub modyfikacja jest znacznie prostsza i szybsza, co przekłada się na zwiększoną elastyczność i skalowalność systemu.

Projekt ten stanowi przykład efektywnej transformacji systemów przetwarzania danych, demonstrując, jak zaawansowane technologie i podejście oparte na automatyzacji mogą przynieść znaczące korzyści operacyjne i finansowe w sektorze finansowym.

Check out our recent posts:

Ile kosztuje wdrożenie BI?

Ile kosztuje wdrożenie systemu BI? Odpowiedź zależy od zakresu projektu, złożoności danych i modelu operacyjnego. W tym artykule wyjaśniamy główne czynniki kosztowe BI, typowe scenariusze wdrożeń oraz ukryte koszty, które firmy powinny uwzględnić, planując dashboardy, platformy danych i systemy raportowe.

Co planują najwięksi dostawcy BI na 2026 rok

Najwięksi dostawcy BI rozwijają funkcje konwersacyjne i spójność semantyczną, jednocześnie wyznaczając jasne harmonogramy migracji, które mogą wpłynąć na codzienne operacje BI. W przypadku MŚP punkt ciężkości przesuwa się w stronę uporządkowanego planowania, jasno zdefiniowanej odpowiedzialności za metryki oraz kontrolowanego wdrażania nowych funkcji. W tym artykule analizujemy najnowsze aktualizacje dostawców i przekładamy je na praktyczne wnioski do planowania BI na 2026 rok.

4 sposoby wykorzystania AI w systemach BI dla firm produkcyjnych

Wiele firm produkcyjnych już korzysta z Business Intelligence, ale dane najczęściej pokazują to, co już się wydarzyło. Raporty dają przejrzysty obraz sytuacji, jednak drobne zmiany na hali produkcyjnej zwykle stają się widoczne dopiero wtedy, gdy zaczynają wpływać na koszty, jakość lub wydajność. AI pozwala przesunąć ten moment trochę wcześniej. Pomaga zauważyć subtelne sygnały wtedy, gdy wciąż jest czas na spokojną reakcję i niewielkie korekty. Poniżej przedstawiamy pięć sposobów, w jakie firmy produkcyjne wykorzystują AI w swoich systemach BI, aby wcześniej dostrzegać problemy i stabilniej prowadzić operacje.