28 000 – 32 000 PLN
netto /miesiąc
B2BEtat: 100%
Podobne ogłoszenia
Senior Data Scientist/AI Engineer (Reinforcement Learning) @TeamQuest
Senior Data Scientist/AI Engineer (Reinforcement Learning)
TeamQuest
Zdalnie
B2B
Praca zdalna
DCG
Zdalnie
B2B
Praca zdalna
Scalo
Zdalnie
B2B
Praca zdalna
1dea
Zdalnie
B2B
Praca zdalna
Acaisoft
Zdalnie
B2B
Praca zdalna
Senior ML / Data Science Engineer (Genai / LLM) @1dea
Senior ML / Data Science Engineer (Genai / LLM)
1dea
Zdalnie
B2B
Praca zdalna
1dea
Zdalnie
B2B
Praca zdalna
TeamQuest
Warszawa
B2B
Warszawa
Praca hybrydowa
DCG
Zdalnie
B2B
Praca zdalna
Scalo
Zdalnie
B2B
Praca zdalna
NOWE TQ0102130 Senior Data Scientist/AI Engineer (RL)
TeamQuest
100% zdalnie (Warszawa)
Data Science
Senior
XP
min. 5 lat doświadczenia
Senior
min. 5 lat doświadczenia
Kogo poszukujemy?
Obowiązki:
- Projektowanie i wdrażanie środowisk RL obsługujących ocenę agentów na dużą skalę oraz eksperymenty z uczeniem wzmacniającym.
- Twórz potoki generowania zadań, dynamiczne zestawy danych i środowiska skryptowe o kontrolowanej złożoności i stochastyczności.
- Opracuj weryfikatory i modele nagród, aby automatycznie oceniać trajektorie i oceniać wnioskowanie modelu.
- Współpracuj z inżynierami infrastruktury i systemów, aby zapewnić skalowalność, powtarzalność i wyposażenie środowisk w narzędzia umożliwiające szczegółową telemetrię.
- Projektuj interfejsy API i struktury orkiestracji do uruchamiania, resetowania i oceniania agentów w różnych środowiskach.
- Optymalizacja wydajności środowiska, rejestrowania i powtarzalności nagród w rozproszonych konfiguracjach
Oferujemy:
- Atrakcyjne wynagrodzenia
- Możliwość pełnej pracy zdalnej
- Udział w interesujących prohjektach
Czym będziesz się zajmować?
Wymagania:
- Ponad 5 lat doświadczenia w inżynierii oprogramowania w Pythonie.
- Co najmniej 3 lata doświadczenia na stanowisku Data Scientist, Machine Learning/Environment Engineering.
- Praca w godzinach 14:00 - 22:00
- Praktyczna znajomość frameworków AI (Langchain, Langraph, mcp-server).
- Bogate doświadczenie praktyczne w pracy ze sztuczną inteligencją, obejmujące m.in. inżynierię natychmiastową i kodowanie klimatu.
Dodatkowe atuty:
- Znajomość Kodeksu lub Kodeksu Claude'a.
- Doświadczenie w integrowaniu sztucznej inteligencji z systemem będzie dodatkowym atutem.
- Zrozumienie koncepcji RL - modelowanie nagród, dynamika środowiska,
weryfikowalność, ocena i pętle interakcji agentów.
- Znajomość instrumentów, metryk i kanałów danych do oceny RL.
- Ekspertyza w planowaniu własnej pracy.
Jakie otrzymasz benefity?
Pakiet medycznyPakiet sportowy
Gdzie i jak będziesz pracował?
Centrum, Warszawa
Tryb pracy: Elastyczne godziny pracy
Godziny pracy biura: 7-20
Model pracy
Stacjonarnie
Hybrydowo
100% zdalnie
Kim jesteśmy?
Nasz klient to dynamicznie rozwijająca się firma specjalizująca się w dostarczaniu nowoczesnych rozwiązań chmurowych i aplikacji opartych na Kubernetes, mających na celu zwiększenie efektywności operacyjnej oraz obniżenie kosztów dla biznesów.





