Обязанности:
Компания Nexpanse создает мобильные B2C продукты на базе generative AI технологий. Мы ищем ML Dev Ops инженера, который сможет: Деплоить и поддерживать LLM-модели Обеспечить стабильную работу Front/Back сервисов web и мобильного приложения Что нужно делать Разрабатывать и поддерживать конвейеры CI/CD для моделей машинного обучения Автоматизировать процессы развертывания и мониторинга моделей LLM в prod/stage Оптимизировать производительность моделей в микросервисной инфраструктуре Проводить нагрузочные тестирования Управлять версиями моделей и их конфигурацией Оптимизировать расходы на содержание AI инфраструктуры Внедрять и поддерживать практики MLOps для обеспечения эффективной работы всей команды Выстраивание high availability безопасной инфраструктуры Требования: Опыт работы с AI/ML-решениями в проде Уверенное знание Python Умение работать с инструментами контейнеризации (Docker, Kubernetes) Опыт разработки и внедрения CI/CD конвейеров Знание облачных платформ (AWS, GCP, Azure) и опыт работы с ними. Опыт работы с инструментами мониторинга и логирования (Prometheus, Grafana, ELK stack и т.д.) Будет плюсом Опыт работы с FastAPI / LangChain / LLM-сервисами Опыт работы с Airflow и умение выстраивать DWH пайплайны Преимущества 100% удаленная работа Интересные проекты и задачи Компенсация расходов на фитнес Юридическая помощь в релокации Конкурентоспособная заработная плата Прозрачная система мотивации, ориентированная на результат Перспективы карьерного роста Работа над международными проектами