01 Zakres zadań
- Długofalowa współpraca z międzynarodową, topową firmą consultingową, świadczącą usługi IT dla dużych i średnich firm z sektora finansowego i zarządzania ryzykiem.
- Projektowanie, budowanie i utrzymywanie data pipeline'ów z wykorzystaniem Pythona, PySpark i SQL.
- Rozwijanie i operowanie rozwiązaniami danych na platformie Databricks Lakehouse.
- Tworzenie i zarządzanie workflowami przy użyciu Apache Airflow.
- Implementacja procesów CI/CD z wykorzystaniem Azure DevOps i Azure Pipelines.
- Praca z Git w oparciu o pull requesty i feature-branch workflows.
- Automatyzacja i monitoring zadań przetwarzania danych (m.in. Databricks Lakeflow Jobs).
- Pakowanie, wdrażanie i zarządzanie rozwiązaniami za pomocą Databricks Asset Bundles.
- Zapewnianie jakości danych poprzez testowanie i automatyzację (pytest, pre-commit hooks).
- Korzystanie ze skonteneryzowanych środowisk deweloperskich (Devcontainers, rozszerzenia VS Code).
- Ścisła współpraca z zespołami inżynieryjnymi, analitycznymi i biznesowymi w celu dostarczania niezawodnych i efektywnych rozwiązań danych.
