ITGLOBAL представил GPU-инфраструктуру, оптимизированную для эксплуатации нейросетей и больших языковых моделей (LLM). Решение ориентировано на компании, которые переводящие свои ИИ-разработки в стадию реального использования в IT-ландшафте.
GPU-инфраструктура построена с учетом требований прикладных сценариев к производительности. Решение построено на базе ускорителей NVIDIA RTX PRO 6000 Blackwell Server Edition, NVIDIA L40S и NVIDIA H200. Доступен выбор конфигураций для разных стадий ИИ-проекта: от первичного тестирования до эксплуатации высоконагруженных систем с интенсивным параллельным инференсом. Подбор мощностей осуществляется индивидуально под параметры конкретной модели: её размер, интенсивность запросов и требования к скорости генерации ответов.
«Корпоративные языковые модели перешли от этапа экспериментов к стадии активной эксплуатации в составе критичных систем. В таких сценариях важна не просто доступность GPU, а специализированная среда, учитывающая характер нагрузки инференса. Мы предложили готовое решение, которое позволяет заказчикам обеспечить стабильную работу ИИ-сервисов без необходимости инвестировать в собственное сложное оборудование и его обслуживание», — отмечает Евгений Свидерский, директор облачного бизнеса ITGLOBAL.COM, корпорация ITG.