01 Zakres zadań
- Projektowanie, rozwijanie i utrzymywanie skalowalnych potoków danych ETL/ELT
- Budowanie i optymalizacja architektur hurtowni danych w chmurze oraz modeli danych
- Przetwarzanie i zarządzanie dużymi zbiorami danych w środowiskach Big Data
- Rozwijanie i utrzymywanie rozwiązań z użyciem usług GCP, szczególnie BigQuery i Dataflow
- Optymalizacja wydajności i kosztów rozwiązań do przetwarzania danych
- Tworzenie i utrzymywanie przepływów pracy z użyciem Python, PySpark i Airflow
- Współpraca z zespołami interdyscyplinarnymi przy dostarczaniu kompleksowych rozwiązań danych
- Wsparcie inicjatyw AI/ML poprzez przygotowanie i zarządzanie strukturami danych do trenowania modeli i wdrożeń produkcyjnych
- Zapewnianie najlepszych praktyk inżynierii oprogramowania: Clean Code, testowanie, code review i CI/CD
- Monitorowanie i utrzymywanie niezawodności, skalowalności i wydajności platformy danych
