01 Zakres zadań
- udział w projekcie z obszaru integracji oraz przetwarzania danych w środowiskach chmurowych i on‑prem,
- realizacja zadań związanych z budową i rozwojem procesów integracyjnych w GCP oraz on‑prem,
- praca z narzędziami ETL w środowisku GCP: Apache AirFlow, DataFlow, DataProc,
- wykorzystanie baz danych GCP: BigQuery, BigTable oraz Scylla Cloud,
- praca z kolejkami danych: Kafka, GCP Pub/Sub,
- projektowanie, budowa i tuning baz danych w środowiskach on‑prem (Oracle, PostgreSQL, ScyllaDB),
- korzystanie z narzędzi ETL na on‑prem na poziomie zaawansowanym: Informatica Power Center, NIFI,
- praca z narzędziem harmonogramującym Automate Now (Infinity Data),
- tworzenie i wystawianie usług REST API,
- rozwój narzędzi i frameworków w Pythonie oraz PySpark,
- tworzenie narzędzi wspomagających wydajne ładowanie danych w języku Rust,
- odpowiedzialność za obszar wystawiania danych pod usługi działające w wysokim reżimie wydajnościowym (24h),
- praca w środowisku dużych wolumenów danych (~100 TB),
- praca w modelu hybrydowym: 1 dzień w tygodniu w biurze w Warszawie,
- stawka do 135 PLN/h w oparciu o współpracę B2B.