Во время недавней поездки в Израиль все знакомые из местных вдруг стали расспрашивать меня про «Яндекс.Музыку». Я сначала и не понял природу внезапного интереса к сервису, но быстро выяснилось, что Яндекс месяц назад запустил его в Израиле, выкатив на старте очень гуманную цену – 9.9 шекелей (190 рублей). Через месяц цена выросла до 19.9 шекелей (380 рублей), но и это по израильским меркам вполне доступно.

Изучение каталога показало, что к началу работы в Израиле Яндекс добавил в него много местных исполнителей – как совсем старых, которые старшее поколение слушало по радио (а репатрианты девяностых в ульпанах), так и новых, вроде победительницы Евровидения Нетты. Сейчас интерфейс «Яндекс.Музыки» в Израиле поддерживает русский и английский языки, однако местные композиции (почти все) отыскиваются и по ивритскому названию. В будущем на иврит переведут и интерфейс. Интересно, что Яндекс не демпингует: заработавший в марте сервис Spotify берет те же 19.9 шекелей в месяц.

Самые пытливые заметили в официальном комментарии о старте «Музыки» в Израиле слова о персональных рекомендациях, созданных на основе нейросетей и технологий машинного обучения «Яндекса». За ними стоит чуть большее, чем просто составление умного плейлиста (хотя это на самом деле и совсем не просто). Практически одновременно с запуском сервиса в Тель-Авивском университете заработала Школа анализа данных Яндекса, которую для международных нужд назвали Y-DATA. И вот это действительно важно.

Бывший не наш народ

У людей, не бывавших в Израиле, или съездивших туда разок, чтобы галопом пронестись по святым местам, складывается ощущение, что «там все русские». Действительно, в гостиницах и магазинах трудятся в основном репатрианты из бывшего СССР, да и коренные жители, когда стоит задача заработать денег, охотно вспоминают язык бабушек и дедушек.

Но на этом сходство с Россией заканчивается. Если не считать некоторого количества пенсионеров, смотрящих с утра до ночи российские телеканалы, «бывший наш народ» имеет совершенно другие интересы, ценности и героев. А еще в Израиле принципиально иное законодательство, причудливо сочетающее оттоманское, британское и еврейское право. Поэтому попытки дерзко въехать сюда на популярном имени и наработанных в России практиках заканчивались быстро и невесело. Имя почему-то не знали, практики не работали.

Трудно даже представить — сколько в этом кадре машинного обучения

Уверен, вы много раз слышали про израильтян, как «нацию стартапов», а про Израиль в целом – как про ближневосточную Кремниевую Долину. Все это действительно так. Если в IT происходит что-то важное, оно так или иначе происходит в Израиле. И если раньше крупнейший цифровые компании приходили в Эрец Исраэль за относительно дешевой и очень прокачанной рабочей силой, то теперь во главе угла стоит необходимость находиться в одном из мировых центров прогресса. Чтобы не пропустить ничего важного и, возможно, что-то успеть сделать раньше всех.

Просто прийти постоять могут позволить себе многие. Но даже если у тебя очень, очень много денег, но нет узнаваемого (и признаваемого) имени, мечтать о работе с лучшими даже не приходится. Деньгами в Израиле, где в технопарках просто рябит от известных всему миру логотипов, топовых специалистов всерьез не удивишь. И даже середнячки давно при деле. Пытаться же строить что-то новое с аутсайдерами, наверное, странно.

Есть еще хороший подход — искать бодрую молодежь и учить под себя. Но в Израиле такие поиски начинаются даже не с первого курса университета, а в школах, с 12-13 лет. Ищут все, от IT-компаний разного уровня до израильской армии. ЦАХАЛ остро нуждается в талантливых айтишниках, много занимается со старшими школьниками, и к моменту, когда им исполняется 18, многие уже знают – где будут служить и над чем работать. Отслужив, ребята выходят практически сложившимися профессионалами. Достаточно вспомнить, что именно израильские дембели создали (точнее, частично воспроизвели по памяти) технологию, на основе которой сначала работала система Microsoft Kinect, а теперь – Face ID в новых iPhone. Такая молодежь в рот всем попало не смотрит и менторов не ищет. А начинать со школьников… Долго получится.

В Израиле Яндекс оказался в хорошей компании

Разумеется, Яндекс в Израиле знают. Но не так хорошо, как хотелось бы. Достаточно сказать, что в заголовках местных СМИ компанию называют «Русским Гуглем», что, наверное, не совсем точно и немножко обидно. Но Google, хоть и американский, работает в Израиле уже больше 10 лет и успел стать почти своим.

Яндекс, серьезно присматривающийся сразу к нескольким израильским рынкам, зашел с интересного ракурса. Взяв за основу хорошо отработанную практику из российских реалий, он трансформировал ее так, чтобы заинтересовать израильтян. Работа началась летом и с октября вышла на стратегический простор.

Анализируй это

Кто не знает Школу анализа данных?. Все знают. С 2007 года она стала кузницей профильных кадров не только для самого Яндекса, но и для отечественной IT-отрасли в целом. В течение двух лет в ШАД можно научиться тому, что не рассказывают в университетах, но пользуется большим спросом у работодателей. Причем для прошедших конкурс обучение бесплатно.

В Израиле учиться любят и умеют. Но перенести практики ШАД на Землю Обетованную в первозданном виде было нельзя. «Во-первых, в Израиле очень подозрительное и несерьезное отношение к бесплатным курсам», — рассказывает Константин Килимник, глава программы Y-DATA в Израиле, — «Во-вторых, два года – это многовато для нового образовательного проекта. Здесь мы по длительности и насыщенности пересекались бы с университетскими программами, а для этого нужно прокачать репутацию и полностью адаптировать программу под график занятий и менталитет студентов».

Константин приехал в Израиль в начале двухтысячных годов и получил степени в Тель-Авивском университете и университет имени Бен-Гуриона. До прихода в Яндекс работал в израильских филиалах международных компаний. О том, как взаимодействуют академическая и бизнес-среды в Израиле, он знает не понаслышке.

Константин Килимник

В итоге первая программа Школы анализа данных в Израиле уложилась в 8 месяцев. Цена курса составила 8 тысяч шекелей (около 150 тысяч рублей). Это недорого даже по российским меркам – например, платная форма обучения в московской ШАД обходится в 120 тысяч рублей за семестр (с возможностью получить скидку за ударную учебу). Для Израиля 8000 шекелей – это очень скромно, и в Y-DATA даже не пытаются скрывать, что себестоимость обучения в разы больше.

Набор студентов стартовал летом 2018 года, и из 450 претендентов было отобрано 50. Константин замечает, что, к его удивлению, русскоговорящих среди подававших заявления было не больше четверти. Это вполне соответствует доле выходцев из бывшего СССР и их детей в IT-индустрии Израиля. Студентами хотели стать инженеры, программисты, университетские специалисты в области физики, математики, статистики, биологии. Были и специалисты, получившие специальность во время службы в IT-подразделениях израильской армии. От претендента требовались хорошая подготовка в математических дисциплинах, ярко выраженные аналитические способности, крепкое знакомство с хотя бы одним актуальным языком программирования и свободное владение английским. Последнее позволило убить двух зайцев. Во-первых, привлечь преподавателей из российской ШАД, где не все пока свободно владеют ивритом. Во-вторых, и не все студенты знают иврит достаточно, чтобы свободно оперировать математическими и техническими терминами. В Израиль едут из очень разных стран (например, недавно была большая волна из Франции), и освоение иврита идет не всегда достаточно быстро. Впрочем, и в израильских компаниях даже внутренняя переписка зачастую ведется на английском, не говоря уже о филиалах международных компаний.

Местом занятий был выбран факультет точных наук Тель-Авивского университета. Найти свободные аудитории в его чрезвычайно загруженном корпусе было очень трудно, но это того стоило. Некоторые студенты признаются, что сам факт занятий в университете сильно повысил их интерес к Y-DATA. И место легендарное, и есть уверенность, что проект стоящий. Университет просто не будет сотрудничать с синекурами.

Немного неожиданно, что сам университет изнутри очень похож на своих российских собратьев, построенных в 70-80-х. Студенты в коридорах, конечно, существенно отличаются от московских и новосибирских, но вот иных профессоров можно перепутать с российскими или украинскими. Впрочем, многие из них когда-то ими и были. Команда, преподающая в Y-DATA, состоит из теоретиков и практиков, причем последних, пожалуй, больше. А вообще, наверное, трудно найти программу, где бы собрались люди из университета имени Бен-Гуриона, Высшей школы экономики, Google, университета Хайфы, Яндекса и Amazon. Плюс представители очень разных стартапов – от DeepOncology до Gong.io.

Нир Авив, бэкэнд-разработчик компании Fiverr, стал одним из первых студентов Y-DATA. Он говорит, что в программе его больше всего привлекло гармоничное сочетание академических и бизнесовых компонентов. «Я понял, что здесь меня не просто чему-то научат, но и познакомят с сообществом, уже сейчас серьезно занимающимся машинным обучением и анализом данных в разных отраслях. Такие знакомства даже важнее, чем сферические секреты мастерства в вакууме».

Но зачем?

Программа Y-DATA весьма обширна. Она требует 250 часов личного присутствия и, как минимум, столько же времени на самостоятельную работу. Лучше – больше. Студентов сразу предупреждают, что совмещать учебу с суровой пахотой на основной работе будет непросто. Впрочем, израильские работодатели с большим пониманием относятся к сотрудникам, жаждущим новых знаний. Да они и привычные к отлучкам, потому что почти все мужчины до сорока с лишним лет каждый год на месяц уходят в армию.

На первом этапе студенты освежают в памяти высшую математику в разрезе машинного обучения, а также теорию вероятностей и статистические методы. Также идет прокачка в языке Python – в том объеме, который необходим аналитику данных. Много практики в «чистке» данных, анализе переменных, визуализации и создании объектов, причем как локально, так и в облаке.

Затем, параллельно с теоретическими основами машинного обучения, начинается практическая работа. Много практической работы. Раскрываются все ипостаси – от базовых техник, которые сейчас применяются в любом приличном интернет-магазинчике, до действительно непростых вещей, связанных с deep learning и big data. Сильный уклон в сторону практики во многом и отличает программу Y-DATA от ШАД. В Москве за два года можно успеть многое, а доля только что закончивших вузы и студентов достаточно велика. Здесь же собрались люди, уже попробовавшие на вкус профессиональную жизнь. Им надо другое.

Люди впрягаются в эту историю не ради красивого сертификата (бумажки с печатями в Израиле не в цене), и уж точно не для самоутверждения. В идеале через восемь месяцев школу должен покинуть специалист, который может понять задачи и потребности бизнеса, переложить их на математический язык, выбрать нужные данные, отсеяв кучу цифрового мусора, и найти правильный ответ. Или ответы. Бизнесы бывают очень разные, равно как и люди. Но машинное обучение – в разных ипостасях – проникает везде. Где-то надо анализировать рентгеновские снимки на предмет раковых опухолей, где-то писать ботов, помогающих в работе юристу и банковскому клерку. За восемь месяцев ШАД.. ой, простите, Y-DATA ставит цель научить отделять зерна от плевел и самостоятельно решать задачи. Конечно, сложность последних будет со временем лишь нарастать, но заложенный фундамент позволит не бояться трудностей и строить систему знаний в нужном ключе.

Идут занятия. У доски Глеб Ивашкевич

Первый самостоятельный проект каждый студент выполнит прямо в Y-DATA, вместе с одной из компаний-партнеров. Она поставит задачу, предоставит набор данных для анализа и, понятное дело, оценит результат.

На вопрос – зачем тратить столько времени на оффлайн-курсы, когда есть столько замечательных онлайн-программ, студенты говорят, что живьем получается гораздо лучше. Время, затраченное на дорогу в университет и обратно, с лихвой окупается за счет эффективной обратной связи. Мгновенный обмен мнениями в аудитории, где студенты сами знают немало, дает очень много. К слову, преподаватели признаются, что чувствовать себя всезнающими богами попросту невозможно: вопросы с мест иной раз бывают такими заковыристыми, что приходится хорошо подумать перед ответом. Но тем и интереснее.

По мнению Айры Коэна, главного дата-аналитика компании Anodot и члена консультативного совета Y-DATA, применение машинного обучения на практике требует не изобретения новых алгоритмов, а использования существующих методов в решении новых задач. Поэтому восьмимесячная программа в сочетании с реальным проектом в отрасли – отличный вариант. Также Айра считает, что машинное обучение – дисциплина, которая не очень зависит от отрасли. Где бы не применялись знания, большинство шагов будет повторяться, поэтому накопленный опыт будет всегда идти за своим владельцем в нужные ему сферы.

Дальше, дальше

Константин Килимник рассказывает, что через 4 недели занятий из 50 студентов осталось 47. Один из них, еще с момента собеседования демонстрировавший недюжинные знания в машинном обучении, осознал, что реально интересное для него начнется лишь весной, а ждать ее долго и дорого. Собственно, его об этом предупреждали еще при первой очной встрече, но он все же решил попробовать.

В коридорах факультета

Еще два студента за первые две недели поняли, что им совсем тяжело совмещать учебу с работой. И, когда пришло время оплатить курс, вежливо откланялись. Что же, дело житейское. Бывает. Остальные держатся и демонстрируют уверенность расстаться с Y-DATA только в июле 2019 года.

В апреле 2019-го начнется отбор в новый поток Y-DATA. Килимник говорит, что есть план со временем получить для программы статус академической, и тогда на нее будут распространяться гранты министерства образования Израиля. Но это дело отдаленного будущего. А вот запуск сервиса Яндекс.Такси под брендом Yango случится гораздо раньше – буквально со дня на день. Израильское такси представляет собой очень своеобразный рынок, где сейчас безраздельно правит Gett. Чтобы конкурировать, Яндексу, конечно же, понадобятся свои люди в Израиле. И даже без анализа больших данных ясно – лучшие выпускники Y-DATA получат предложение влиться в команду и позвать с собой толковых друзей.

В Израиле настороженно относятся к чужакам, зато от души помогают тем, кого признали своими. Y-DATA в этом контексте – гораздо больше, чем просто хорошая образовательная программа. Это возможность для большой российской компании создать маленький островок своих в одной из самых технологичных стран мира. И тогда можно будет делать действительно интересные вещи.

Давид Бен-Гурион говорил: «В Израиле, чтобы быть реалистом, нужно верить в чудеса». Так и есть, только любое чудо нуждается в основательной подготовке. Похоже, именно ее мы сейчас и наблюдаем.