Мир испытывает потребность хранения все большего количества данных. По оценке IDC объем информации в компьютерных системах в 2017 году превысил 20 зеттабайт (зеттабайт — это 10 в 21 степени байт, или миллиард терабайт) и продолжает расти: к 2020 году данных будет уже более 100 зеттабайт, а к 2025 — больше 160 зеттабайт. Логично, что аналитики прогнозируют увеличение затрат на работу с ними: согласно прогнозу IDC, расходы на аналитику и хранение больших данных увеличатся в текущем году на 12,4% и составят $150 млрд, тогда как к 2020 году компании будут тратить уже $210 млрд, чтобы справиться с наплывом данных.
Популярным решением для снижения затрат стала гиперконвергенция: Gartner констатирует взрывной рост в данном сегменте — вложения в технологию за прошедший 2016 год увеличились почти на 80%. Аналитики прогнозируют, что такие системы займут 24% всего рынка интегрированных решений уже в 2019 году при практически «нулевом» старте в 2012 году. Причины применения этого подхода в кардинальном снижении расходов: гиперконнвергентные решения позволяют снизить TCO (расходы на поддержание функционирования) инфраструктуры более, чем в два раза.
Что такое гиперконвергенция
Технологическая основа гиперконвергенции — это распределенное хранение данных и виртуализация. Распределенное хранение за счет программных средств объединяет все используемые в серверах диски в единый массив — пользователю все равно на каком диске, какая часть информации хранится, он управляет ею из одного места.. Распределенное хранилище позволяет получать нужный объем хранилища путем добавления дисков в сервера или заменой существующих на большие. Это гораздо дешевле, даже с учетом стоимости такого ПО, если сравнивать с сетевыми системами внешнего хранения данных, такими как SAN, NAS.
Виртуализация подразумевает объединение ресурсов и выделение внутри их виртуальных серверов: то есть объединяет процессорные мощности, память и диски в единый вычислительный центр, в котором выделяет ресурсы на запуск нужного количества копий операционной системы, программ и т.п. Такое решение позволяет почти на 100% загружать серверные мощности, а также упрощает обслуживание оборудования: например, со сломавшегося сервера нагрузка передается на другие, он просто обновляется по мере возможности без перерыва на восстановление данных.
Клиенты
На гиперконвергентные решения переходят компании из самых разных сегментов: промышленность, розничная торговля, банковский сектор — все, кому нужно хранить большие объемы информации и обрабатывать ее. Например, японский банк Fukuoka Hibiki Shinkin отчитался о снижении эксплуатационных расходов на 10% после внедрения гиперконвергентного решения, уменьшив стоимость владения ИТ-инфраструктурой почти на 40%.
Реальная экономию от внедрения гиперконвергентных систем составляет порядка $51 000 на каждых 100 пользователей. К таким выводам пришли аналитики IDC в 2017 году, изучив работу новых ИТ-систем в 11 крупных международных компаниях. В своем исследовании компания отметила, что революционные изменения в инфраструктуре позволяют окупить вложения в среднем за 7 месяцев и получить ROI (параметр, показывающий эффективность возврата инвестиций) вплоть до 530% за первые 5 лет эксплуатации.
Высокие показатели объясняются тем, что применение гиперконвергентных решений позволяет добиться экономии за счет одновременного снижения затрат на само оборудование, а также на его внедрение и обслуживание. Отсутствие необходимости приобретать серверы определенного формата, а также дорогостоящие системы хранения снижает стоимость. А единый интерфейс управления такими системами позволяет сократить затраты на ИТ-персонал, так, как и хранилищем, и всей средой виртуализации можно управлять из одного интерфейса.
Трудности внедрения
Сокращение расходов на информационные технологии — постоянный тренд, как минимум, последних 10 лет, системы виртуализации данных и процессорных ресурсов также известны десятилетиями, что мешало использованию гиперконвергентных решений ранее?
Во-первых, любая крупная компания уже имеет какую-то инфраструктуру, и на ее кардинальное изменение смогут пойти далеко не все и не сразу.
Вторая проблема заключается в том, что обслуживание обычных систем хранения или «шкафов с дисками» происходит совершенно иначе, чем обслуживание распределенных хранилищ данных. Гиперконвергентные решения подразумевают использование серверов для двух целей сразу, для хранения распределенных данных и для вычислительной мощности, это значит, нельзя просто так подключить или отключить отдельный диск или же полностью перезагрузить хранилище, не затрагивая при этом компьютерные мощности. Требуется время на изучение технологии.
Третий аспект — это обеспечение доступности серверов. Распределенное хранилище сильнее нагружает сеть. Требования к производительности сети выше. Внедрение гиперконфергентного решения в большинстве случает требует back-net сети.
Синергетический эффект
Тем, кто преодолел трудности внедрения использование гиперконвергентного хранилища совместно с технологией виртуализации может дать даже более высокую оптимизацию затрат, чем двухкратная, и позволяет минимизировать время запуска новых версий своих сервисов. Например, Visa использует решение по так называемой контейнерной виртуализации, которое делает возможным запуск в десятки и сотни раз большего количества небольших сервисов или приложений на той же инфраструктуре. И это только начало происходящей сегодня ИТ-трансформации.
Текущая реализация гиперконвергентных решений приспособлена к большому спектру нагрузок от обработки данных от умных устройств, до рабочих столов офисных служащих и мощных виртуальных машин для инженеров и дизайнеров. Хороший пример успешного применения нового типа инфраструктуры недавно опубликовали аналитики Gartner, консультировавшие одну весьма крупную латиноамериканскую компанию с оборотом в $33 млрд. За счет комплексного подхода внедрение гиперконвергентного решения показало ROI на уровне 53% уже за первый год, а значит в течение второго года оно уже окупается и начинает приносить прибыль по сравнению с предыдущим. Это очень короткие сроки окупаемости для высокотехнологичного решения. Согласно отчету, экономия достигнута за счет средств на лицензиях, поддержке, дополнениях, энергопотреблении, хранении данных и даже развертывании приложений.
Потенциальные потребители
Аналитики IDC уверены, что больше всего средств на хранение и обработку больших данных будут тратить компании из сектора финансовых услуг, а также представители дискретного и непрерывного производства, федеральные органы государственной власти и поставщики профессиональных услуг, которые вместе инвестируют свыше $100 млрд в новые технологии работы с данными. Самые высокие темпы роста расходов аналитики прогнозируют в банковском секторе (CAGR до 13,3%), а также в здравоохранении, страховании, сегмент операций с ценными бумагами и услуг управления инвестициями и в отрасли телекоммуникаций с CAGR порядка 12,8%.