В связи с расширением команды и масштабированием проектов находимся в поиске L2 Duty Engineer в IT-компанию, которая занимается разработкой и полным сопровождением заказного программного обеспечения, веб-сайтов и мобильных приложений, предоставляя широкий спектр услуг.
Стек: windows server, Active Directory, Zabbix/Grafana/Kibana, Powershell, Jira/Jsm/Youtrack
Чем предстоит заниматься:
-
Операционное обеспечение стабильности инфраструктуры 24/7
-
Принятие самостоятельных операционных решений в условиях инцидентов и ограниченного времени.
-
Ответственность за стабильность инфраструктуры в рамках дежурной смены.
-
Мониторинг и управление инцидентами
-
Активный и проактивный мониторинг серверов, сервисов и инфраструктурных компонентов.
-
Раннее выявление деградаций и потенциальных инцидентов до их влияния на production.
-
Управление инцидентами полного цикла: обнаружение, первичная диагностика, стабилизация, восстановление либо корректная эскалация.
-
Анализ логов, метрик и показателей работоспособности инфраструктуры и сервисов.
-
Root-cause анализ и предотвращение повторяющихся проблем
-
Участие в root-cause анализе инцидентов совместно со смежными командами.
-
Формирование фактической картины инцидентов на основе данных мониторинга и логов.
-
Инициирование эксплуатационных улучшений, направленных на снижение количества повторяющихся сбоев.
-
Работа с дата-центрами и аппаратными инцидентами
-
Взаимодействие с дата-центрами по вопросам аппаратных неисправностей и регламентных работ.
-
Планирование, сопровождение и контроль работ по обслуживанию серверов.
-
Поддержка процессов деплоя и изменений
-
Поддержка процессов деплоя сервисов, анализ возникающих проблем в процессе деплоя.
-
Эскалация нестандартных и критических проблем, возникающих при деплое.
-
Эксплуатационные регламентные работы
-
Выполнение регламентных операций по обслуживанию и обновлению ОС и программного обеспечения согласно регламентам.
-
Документация и база знаний
-
Формирование и актуализация внутренней документации (KB, регламенты, инструкции для внешних пользователей)
-
Взаимодействия и консультации
-
Консультация разработчиков по вопросам эксплуатации, стабильности инфраструктуры и процессов CI/CD
-
Обеспечение корректного оформления и ведения эксплуатационных задач в тикет-системах согласно установленным процедурам.
-
Навигация и координация взаимодействия команд при необходимости
Наши ожидания от кандидата:
-
Базовый опыт администрирования Windows Server.
-
Знакомство с технологиями виртуализации Hyper-V
-
Понимание основ работы сетей (OSI, TCP/IP, DNS, DHCP)
-
Умение пользоваться базовыми инструментами (ping, traceroute, wireshark, tcpdump и тд)
-
Понимание принципов REST API и протокола HTTP/HTTPS, а так же навык работы ним
-
Навыки анализа логов, метрик и алертинга.
-
Опыт работы с системами мониторинга и логирования (zabbix/grafana/kibana).
-
Опыт работы по регламентам и эксплуатационным процедурам.
-
Стрессоустойчивость и умение сохранять концентрацию в критических ситуациях.
-
Умение принимать решения в условиях ограниченного времени и неполной информации.
-
Ответственность за результат и стабильность инфраструктуры в рамках смены.
-
Развитые навыки деловой устной и письменной коммуникации, способность структурировано излагать информацию и корректно передавать контекст.
-
Английский на уровне чтения технической документации
Будет плюсом:
-
Базовое понимание CI/CD процессов и типовых причин сбоев при деплое.
-
Базовые знания Linux
-
Практический опыт автоматизации с использованием Ansible
-
Опыт развития и улучшения систем мониторинга и алертинга.
-
Опыт написания собственных PowerShell модулей или скриптов автоматизации.
-
Практическое понимание того, как выстраивается работа с инцидентами, изменениями и плановыми работами.
Мы предлагаем:
- Оформление по ТК Республики Беларусь;
- Стабильную официальную заработную плату;
- Комфортный, современный офис в Минске;
- Расширенный социальный пакет.
Данное рабочее место является планируемым к созданию и замещению (перспективным).
Похожие вакансии
Высшее техническое образование. Понимание основ работы вычислительных сетей, DNS, DHCP, почтовых служб (Postfix, Exim, Dovecot). Аналитический склад ума, ответственность, стремление...
Высшее техническое образование. Опыт работы от 3-х лет.
Образование-средне-специальное,высшее. Ответственность. Исполнительность. Честность. Стрессоустойчивость. Трудолюбие. Стремление обучаться.
Опыт работы не менее двух лет по проектированию объектов в должностях специалистов и (или) руководителей в соответствующей области знаний (связь...
Образование - высшее профильное IT. Уверенные знания для администрирования ОС Linux, Windows. Понимание контейнеризации Docker, Docker compose. Умение работать с Bash...

