Solution Architect (AWS, Spark) (Remote)
31900-35300 PLN miesięcznie (B2B)
Crestt Sp. z o.o.
Czym będziesz się zajmować?
Szukamy osoby z doświadczeniem technicznym i biznesowym, która dobrze odnajdzie się w bezpośrednim kontakcie z klientem. Kluczowa jest samodzielność, inicjatywa i gotowość do zaangażowania w działania zarówno projektowe, jak i wewnętrzne/organizacyjne.
- Lokalizacja: Warszawa lub zdalnie (na początku współpracy wymagane 2 dni onboardingu w biurze, w późniejszym etapie oczekujemy wizyt w biurze raz na miesiąc/dwa miesiące)
- Projektowanie rozwiązań opartych o usługi chmurowe (AWS) z uwzględnieniem wymagań klienta i najlepszych praktyk architektonicznych
- Współtworzenie i rozwój nowoczesnych procesów przetwarzania danych (ETL/ELT) z wykorzystaniem Apache Spark (głównie PySpark)
- Udział w spotkaniach z klientem – prezentowanie rozwiązań, zbieranie wymagań, doradztwo techniczne
- Wspieranie zespołów developerskich w implementacji rozwiązań (code review, konsultacje, rozwiązywanie problemów)
- Tworzenie i utrzymywanie dokumentacji architektonicznej
- Wdrażanie rozwiązań CI/CD oraz zarządzanie infrastrukturą jako kodem (IaC)
- Zapewnienie jakości i spójności danych poprzez dobór odpowiednich narzędzi i mechanizmów kontrolnych
- Inicjowanie i udział w działaniach usprawniających procesy wewnętrzne oraz dzielenie się wiedzą w zespole
Kogo poszukujemy?
Nasze wymagania:- AWS S3 – znajomość różnych klas przechowywania, versioning, struktura bucketów i prefixów
- Apache Spark (w szczególności PySpark), np. w usługach: Glue, EMR, Databricks, Synapse
- Git – zarządzanie branchami, rozwiązywanie konfliktów, code review
- Format Parquet – wiedza o strukturze kolumnowej, ewolucji schematu, partycjonowaniu danych
- Python – doświadczenie programistyczne
- SQL – zaawansowane zapytania (CTE, funkcje okienkowe, procedury składowane)
- Hive Metastore (np. Glue Catalog, Databricks, Nifi, Presto itd.)
- Airflow
- Infrastructure-as-Code (IaC) – np. CloudFormation, Terraform, Ansible, ARM, Chef
- CI/CD – np. CodePipeline, GitHub Actions, GitLab, Jenkins, TeamCity
- AWS Glue, AWS Lambda (lub ich odpowiedniki na Azure/GCP)
- AWS Redshift – w tym Redshift Spectrum, procedury, materializowane widoki, tymczasowe tabele
- AWS Step Functions
- dbt
- Formaty plików typu Delta Lake, Apache Iceberg, Hudi
- HDFS
- Scala
- Doświadczenie z koncepcjami: Data Lakehouse, Data Quality, Data Lineage, Data Governance
- Praca z danymi strumieniowymi / w czasie rzeczywistym
- Znajomość modelowania danych: Star Schema, Kimball, Data Vault, Common Data Model
- Obszary: Master Data Management
Czego wymagamy?
Znajomości:
Mile widziane:
Języki:
- Polski
- Angielski
Jakie warunki i benefity otrzymasz?
- 190-210 PLN godzinowo (B2B)
- B2B - Elastyczne godziny pracy (100%)
- Praca zdalna: Możliwa w całości
- Pakiet medyczny, Ubezpieczenie, Pakiet sportowy
Gdzie będziesz pracował?
Rejtana 17, Warszawa lub zdalnie
Kim jesteśmy?
Crestt powstał w odpowiedzi na rosnące zapotrzebowanie ze strony biznesu na zastosowanie nowoczesnych technologii w codziennych działaniach. Naszym celem jest dostarczenie rozwiązań IT opartych o najnowsze rozwiązania technologiczne o niepodważalnej wartości biznesowej.
We współpracy z naszymi Partnerami, stworzyliśmy najwyższej klasy rozwiązania IT. Nasze produkty optymalizują procesy biznesowe w największych polskich firmach, a jednoczesnie są dopasowane do indywidualnych potrzeb każdej z nich. Jesteśmy stali w jakości, a elastyczni w podejściu.