Дайте больше данных! Репортаж с Teradata Universe 2018

Пишу из Лондона, где проходит мероприятие Teradata Universe 2018. Teradata – большая корпорация, которая с 1979 года занимается разработкой аппаратно-программных решений для анализа данных. Собственно, признаки возраста компании содержатся в названии: в 1979 году терабайт был каким-то совершенно заоблачным объемом данных, и название звучало весьма футуристично. Сейчас никого не удивить даже Петадатой, но не менять же ради этого известный бренд. Кстати, два с половиной года назад я писал об интересном проекте Teradata, понятном даже простым смертным.

В ЦОДах многих крупных российских банков стоят целые ряды стоек с брендом Teradata, за которые заплатили совершенно умопомрачительные суммы, но, по мнению покупателей, цель оправдывала средства. Однако буквально в последние пару лет компания решила постепенно отказаться от разработки проприетарного железа и сосредоточиться именно на программных решениях, которые можно развертывать в любых разновидностях облаков – частных или публичных. Конечно, желающим купить и железо никто от ворот поворота давать не будет, шкафы с содержимым различной мощности останутся в ассортименте. Но в Teradata никто не скрывает, что внутри стоит оборудование Dell и других уважаемых производителей.

Почему так произошло? По данным исследования Vanson Bourne, опубликованному сегодня, 69% руководителей крупных компаний планирует полностью перевести анализ данных в облака. Разумеется, все понимают нюансы этого переезда (50% переживают насчет безопасности, 49% считают технологии облачного анализа недостаточно зрелыми, 35% сомневается насчет одобрения переезда регуляторами), однако и до 2023 года еще немало времени. В самой Teradata утверждают, что разницы в скорости между локальным и облачным анализом нет, и все упирается лишь в настройки оборудования. Например, если разные куски массива лежат в разных облачных сервисах и «общаются» по тонкому каналу данных, скорость действительно может пострадать. Но есть люди, готовые помочь все наладить.

Споры на тему «хранить все у себя или отдавать на сторону» ведутся давно, и у адепта каждого подхода есть вполне убедительные документы. Но облака действительно бывают разными по степени защиты и приватности, а утащить данные из конкретной серверной все же проще, чем из дата-центра с тысячами машин, разбросанных на большой территории.

Да и плюсы, в общем, очевидны – легкость развертывания, удешевление администрирования, простое масштабирование, легкость сбора данных воедино из разных частей страны или мира. Все это читатель, скорее всего, знает не хуже нашего.

Автора этого поста уже давно удивляет, что до сих пор объектом анализа остаются только цифры и слова. Это, несомненно, важно, однако графическая информация и – особенно – видео могут стать куда более ценным источником big data в финансовом секторе. Ведь есть странный парадокс: аналитика ведется в режиме реального времени, однако отрабатывает она лишь следы действий, иногда остывшие и затоптанные. Тогда как анализ поведения, мимики и даже одежды человека, пришедшего в банк, могут дать гораздо больше, чем его профиль в соцсетях.

Тим Генри, старший вице-президент подразделения с не очень переводимым на русский названием Strategic Offering Management, полностью согласился с тем, что видео обрабатывать очень заманчиво, но в настоящее время такие объемы данных под силу обработать не всем системам и особенно каналам связи. Тем не менее, Тим уточнил, что компания постоянно расширяет список нативно поддерживаемых системой форматов, и кто знает, кто знает…

Teradata заявляет о стремлении сделать свои решения пригодными для развертывания на любом оборудовании и на любой платформе. Развертывай где хочешь, анализируй что хочешь, покупай целиком или по подписке. Не понравилось – расстанемся друзьями, никаких штрафных санкций.

К сожалению, по доброй традиции аналитиков и консультантов, в выступлениях и кулуарных разговоров звучит очень мало деталей. Точнее, их вообще не звучит. Цены, скорости, известные уязвимости – все это остается за кадром. С одной стороны, так и должно быть: Teradata в данном случае просто обязана держать язык за зубами. С другой, журналистам крайне трудно пробираться сквозь слова про безопасную безопасность и скоростную скорость, нащупывая за ними конкретику.

Но анализ разнородных данных действительно колоссальный рынок, и тот, кто первым сделает его по-настоящему проактивным, рванет вперед посерьезнее, чем при внедрении первых конвейерных, а затем роботизированных линий.

Конечно, есть ощущение, что у обладателей огромного количества информации (читай – Google и иже с ними) шансов больше, чем у финансовых институтов. Но это неточно. Пока неточно.

Также рекомендую почитать 10 тезисов главного технического директора Teradata Стивена Бробста. Только что закончил расшифровывать материал. Совершенно потрясный дядька.