Задача заключается в переносе 4 сайтов и 1 backend-приложения с двух VPS-хостингов на один. Необходимо скопировать файлы и базы данных, обновить конфигурации и проверить работоспособность. Срок выполнения — 2–3 часа после начала работы.
DevOps для настройки кластера GPU-серверов (Proxmox, Vast.ai)
Мы запускаем крупный проект по созданию облачной платформы для AI/ML вычислений и 3D-рендеринга (GPU-as-a-Service). В нашем распоряжении находится большой парк GPU-оборудования (тысячи единиц), который мы будем поэтапно вводить в эксплуатацию.
Ищем опытного DevOps-инженера или системного администратора Linux для настройки первой партии из 10 GPU-ферм (ригов), каждая из которых содержит 8-10 видеокарт.
Цель этого этапа:
Создать надежную, масштабируемую и безопасную конфигурацию для 10 пилотных серверов, подготовить их для сдачи в аренду на публичных площадках (Vast.ai, Runpod) и заложить фундамент для дальнейшего развертывания сотен таких же серверов.
Это не разовый проект. Мы ищем специалиста для долгосрочного сотрудничества и готовы хорошо оплачивать высокий уровень экспертизы.
Ключевые задачи и обязанности:
Консультация и выбор стека: Обсудить и утвердить оптимальный технологический стек (ОС, система виртуализации, сетевая архитектура).
Настройка "эталонного" хоста:
Установка и настройка ОС Linux (предпочтительно Ubuntu Server 22.04 LTS).
Установка и настройка гипервизора Proxmox VE.
Ключевая задача: Настройка корректного проброса GPU (PCIe Passthrough / VFIO) в гостевые виртуальные машины (ВМ).
Настройка сетевых мостов (bridges) и, возможно, VLAN для изоляции.
Создание и настройка гостевых ВМ:
Создание шаблонов ВМ с Linux.
Установка в ВМ драйверов NVIDIA, CUDA Toolkit, Docker.
Автоматизация развертывания:
Создание скриптов (предпочтительно Ansible, но можно и Bash) для автоматизации настройки новых хостов и ВМ по образу "эталонного". Цель — минимизировать ручную работу при масштабировании.
Обеспечение безопасности: Проведение базовой "закалки" (hardening) хостовой и гостевой ОС (настройка фаервола ufw, отключение парольного доступа по SSH и т.д.).
Интеграция с платформами: Установка и настройка ПО от Vast.ai / Runpod на гостевых ВМ для их подключения к маркетплейсу.
Документация: Создание подробной и понятной документации по всей проделанной работе, включая шаги по развертыванию нового сервера с помощью созданных скриптов.
Требуемые навыки и опыт (обязательно):
Глубокие знания в администрировании Linux (Ubuntu/Debian).
Подтвержденный практический опыт работы с системой виртуализации Proxmox VE.
Успешный опыт настройки проброса нескольких GPU (GPU Passthrough) в виртуальные машины. Это самый критичный навык для проекта.
Опыт работы с экосистемой NVIDIA: установка драйверов, CUDA, работа с nvidia-smi.
Понимание принципов работы сетей: мосты, VLAN, маршрутизация.
Опыт работы с Docker.
Навыки написания скриптов для автоматизации (Bash/Python/Ansible).
Будет большим плюсом (желательно):
Опыт работы с ZFS.
Опыт развертывания и управления хостами на платформах Vast.ai, Runpod или аналогичных.
Опыт работы с высоконагруженными системами и оборудованием для майнинга/рендеринга.
Что мы ожидаем в результате:
10 физических серверов (ферм), полностью настроенных и работающих под управлением Proxmox.
Настроенные и готовые к работе виртуальные машины, подключенные к Vast.ai/Runpod.
Набор скриптов для автоматизации развертывания 11-го и последующих серверов.
Техническая документация, достаточная для того, чтобы ваш коллега мог понять архитектуру и продолжить работу.
При отклике на этот проект, пожалуйста, ответьте на несколько вопросов:
Опишите ваш самый релевантный опыт, связанный с настройкой GPU-серверов и виртуализацией. С какими сложностями при пробросе GPU вы сталкивались и как их решали?
Какой стек технологий (ОС, файловая система, инструменты автоматизации) вы бы предложили для решения этой задачи и почему?
Укажите вашу почасовую ставку и примерную оценку времени, которое потребуется на выполнение этого пилотного проекта (настройка 10 серверов + автоматизация).
Заявки фрилансеров
Похожие заказы
- $20Системное администрирование2 заявкиОткрыт8 часов назад
- $15
Необходимо выполнить перенос данных с двух VPS на один с достаточным объемом свободного места. Задача включает проверку объема занятого и свободного места, перенос данных, а также подготовку инструкций по отключению неиспользуемых серверов. Срок выполнения — сегодня, бюджет — $15.
Системное администрирование3 заявкиОткрытдень назад Ищется DevOps-специалист для настройки VPS на UltaHost с HestiaCP. Необходимо установить MySQL или MariaDB, phpMyAdmin, FTP-сервер и настроить Node.js. Ожидается создание рабочего сервера с доступом к одному Node.js проекту по домену и предоставление инструкций по его управлению. Бюджет обсуждаем.
Системное администрирование2 заявкиОткрыт2 дня назад- $10
Требуется задеплоить готовый проект на удаленный сервер. Необходимы навыки в системном администрировании. Убедитесь, что проект корректно функционирует после деплоя.
Системное администрирование3 заявкиОткрыт5 дней назад - $50
Требуется установить seedbox на dedicated server с использованием Transmission Web Interface для интеграции с API. Ищутся фрилансеры с опытом в системном администрировании и настройке подобных систем.
Системное администрирование2 заявкиОткрыт11 дней назад Требуется создание почтового ящика на VPS для домена, который уже имеет ящик, доступный через ЯД. Нужно обеспечить доступ к новому ящику с тем же именем через почтовый клиент roundcube, сохранив при этом существующий ящик. Нужна консультация по возможности реализации данной задачи.
Системное администрирование2 заявкиОткрыт12 дней назадТребуется установить сайт на движке WordPress, настроить SSL сертификат и связать домен с хостингом. Ожидается выполнение всех необходимых шагов для корректной работы сайта.
Системное администрирование23 заявкиОткрыт12 дней назадТребуется настроить VPS сервер для хостинга лендингов с нуля. Необходимо установить веб-сервер (nginx или apache), настроить firewall, выбрать удобную панель управления для редактирования файлов лендингов, а также настроить безопасный доступ по SSH с использованием ключей. Структура папок должна быть логичной, каждый лендинг в отдельной папке.
Системное администрирование6 заявокОткрыт13 дней назадТребуется проактивный Drop Hunter для поиска и выкупа дроп-доменов по критериям тематики, региона и метрик. Опыт работы с инструментами Ahrefs, парсингом доменов и аукционами является обязательным. Возможность работы в международной команде, гибкий график, конкурентная зарплата и разнообразные условия труда.
Системное администрирование2 заявкиОткрыт14 дней назад- $5
Требуется установить простой HTML сайт на хостинг. Необходимо выполнить базовую настройку и обеспечить корректную работу сайта. Ожидается опыт работы с хостингом и настройкой веб-страниц.
Системное администрирование10 заявокОткрыт15 дней назад