Вместе с нами тебе предстоит:
- Участвовать в развёртывании и эксплуатации ML‑сервисов:
- упаковывать модели и inference‑сервисы в Docker‑контейнеры (по готовым шаблонам);
- помогать в оркестрации сервисов в Kubernetes (базовые операции);
- поддерживать готовые решения для запуска LLM‑инференса (vLLM и аналоги).
2. Помогать в проектировании и поддержке CI/CD‑процессов:
- автоматизировать сборку и деплой сервисов с использованием GitLab CI или Jenkins (по готовым пайплайнам);
- участвовать в настройке multi‑stage pipeline’ов (dev → staging → prod) и rollback‑механизмов.
3. Участвовать в настройке систем observability:
- помогать во внедрении мониторинга метрик (Prometheus + Grafana);
- собирать логи и трейсы (OpenTelemetry или аналоги);
- настраивать базовые алертинги под руководством старших инженеров.
4. Развёртывать и поддерживать API‑сервисы для ML:
- разворачивать inference‑эндпоинты на базе FastAPI/Flask (по готовым конфигурациям);
- обеспечивать базовую отказоустойчивость и масштабируемость.
5. Взаимодействовать с кросс‑функциональными командами:
- работать с Data Scientists и ML‑инженерами для внедрения MLOps‑практик;
- участвовать в обсуждении архитектурных решений.
6. При необходимости помогать в оптимизации инфраструктуры под требования LLM:
- выполнять базовые настройки GPU‑ресурсов;
- мониторить latency и throughput inference‑сервисов.
Мы ожидаем:
- Опыт работы в роли DevOps или MLOps‑инженера — от 1,5 лет, включая работу с production‑системами.
2. Уверенное владение Docker:
- умение писать простые Dockerfile;
- понимание концепции слоёв и multi‑stage сборок;
- работа с образами и репозиториями.
3. Базовые навыки работы с Kubernetes:
- создание манифестов для Deployments и Services;
- настройка ConfigMaps и Secrets;
- понимание принципов масштабирования и rolling updates.
4. Опыт настройки систем мониторинга:
- работа с Prometheus и Grafana (сбор базовых метрик);
- знакомство с OpenTelemetry или аналогами (сбор логов и трейсов).
5. Понимание принципов CI/CD:
- опыт работы с GitLab CI или GitHub Actions (настройка простых пайплайнов);
- знание концепций multi‑stage деплоя и rollback.
6. Практические навыки работы с Python:
- написание скриптов автоматизации;
- взаимодействие с API;
- поддержка простых backend‑сервисов (FastAPI/Flask).
- Опыт развёртывания LLM‑инференса (работа с vLLM или аналогами).
- Знакомство с системами аутентификации (OAuth2, JWT).
- Опыт работы с Ingress‑контроллерами (Nginx, Traefik).
- Понимание работы с persistent storage (PV/PVC) в Kubernetes.
- Участие в pet‑проектах или open‑source, связанных с DevOps/MLOps.
- Знание основ работы с GPU в Kubernetes.
Похожие вакансии
Опыт работы в роли DevOps Engineer от 2 лет. Опыт работы с CI/CD (GitLab CI, Jenkins, GitHub Actions).
3+ года опыта DevOps / SRE / Platform Engineering. Опыт CI/CD и production-инфраструктуры. Опыт работы с несколькими проектами или...
Опыт работы DevOps-ом от 3 лет с применением описанных технологий. Опыт работы с kubernetes в production от 2 лет...
Образование - высшее профильное IT. Уверенные знания для администрирования ОС Linux, Windows. Понимание контейнеризации Docker, Docker compose. Умение работать с Bash...
Опыт администрирования Linux, Windows систем. Знание и понимание принципов работы систем виртуализации и контейнеризации. Опыт работы с LAMP-стеком (базовые...

