«Миллисекунды решают». Как data science помогает угадывать цены на рынке

Будущее хедж-фондов зависит от data science и искусственного интеллекта, но без человека все равно не обойтись, уверен аналитик банка MUFG в Лондоне и выпускник «Школы анализа данных» «Яндекса» Артур Мешковский

Считается, что практически все технологические инновации в области инвестиций появляются именно в хедж-фондах. И это вполне объяснимо: хедж-фонды управляют капиталом инвесторов, чтобы приумножить его с минимальными рисками — именно этим соотношением доходности и рисков они и привлекают клиентов.

Главная цель — компенсировать падение одних активов ростом других, а для ее достижения необходимо использовать хорошо продуманную стратегию и великолепно прогнозировать будущие тренды. И технологические инновации как раз и могут стать инструментом, который сделает эти процессы более точными и эффективными.

Провидцы с искусственным интеллектом

Среди приоритетных технологий для хедж-фондов — искусственный интеллект (artificial intelligence) и машинное обучение (machine learning). Проведенное еще в 2018 году исследование BarclayHedge показало, что более половины игроков рынка используют эти методы для принятия инвестиционных решений, и две трети — для генерации торговых идей и оптимизации портфелей. Причем более половины использовали ИИ на протяжении трех лет, а треть — свыше пяти лет. Мало какая другая отрасль может похвастаться столь ранним использованием ИИ — пожалуй, кроме собственно IT-индустрии.

Такой интерес к искусственному интеллекту обусловлен необходимостью хедж-фондов быстро просчитывать тренды, искать в новостях сигналы о том, что в скором времени цена той или иной акции изменится. И чем точнее будут прогнозы, тем меньшие риски и выше прибыль. Человек не знает будущего, искусственный интеллект же может дать прогноз о том, куда будет двигаться рынок, на основе исторических данных и меняющихся внешних факторов.

Уже есть алгоритмы, которые позволяют агрегировать новости из различных деловых изданий и выявлять сигналы, способные изменить стоимость акции. Это может быть что угодно: от заседаний ФРС США до опубликованных высказываний топ-менеджеров.

Тренировочный полигон

Искусственный интеллект может анализировать гораздо большие объемы данных, чем человек, а скорость обработки информации у него гораздо выше. Чем больше данных проанализировано, тем точнее будет прогноз. Таким образом, ИИ выполняет задачи, которые поставил перед ним аналитик данных (data scientist).

Data scientist изначально строит модель, основываясь на данных. Когда модель создана, она тестируется на предыдущих событиях — этот процесс называется backtesting. К примеру, есть модель, которая позволяет сделать прогноз на завтра при определенном поведении цен на акции. Этот прогноз ложится в основу действий хедж-фонда: именно он показывает, покупать или продавать конкретные акции. Чтобы оценить точность прогноза, в модель вводятся данные прошлых периодов.

Теоретически можно, конечно, строить модели и без таких тестов, решая текущие задачи, но для хедж-фондов риски не менее значимы, чем доходность (мы же помним, что хедж-фонды управляют капиталом инвесторов так, чтобы приумножить его с минимальными рисками). Так что backtesting — оптимальный вариант. На backtesting мы не понесем финансовых потерь, купив акции в соответствии с ошибочным прогнозом, зато проверим, сбудется ли предсказание. Например, можно ввести в систему данные, которые были собраны 10 дней назад, сделать прогноз на день вперед и сравнить с тем, как вели себя цены на акции 9 дней назад, заглянув таким образом в будущее.

И самое важное: предсказания ИИ все равно должны проверяться человеком. Делается ли это в случайном порядке или проверке подвергаются лишь самые неожиданные предсказания, каждый выбирает для себя. Но именно за аналитиком данных остается последнее слово. По крайней мере пока.

Чем занимается data scientist в хедж-фондах?

Задачи, которые в хедж-фондах может решать data science, весьма обширны. Аналитик данных отбирает информацию, категоризирует ее, а между тем факторов влияния может быть огромное множество — макроэкономические и политические события, тренды отрасли, результаты работы отдельной компании, ее конкурентов и прочее. Не зря все говорят про нарастающие объемы big data — data lake и даже data ocean.

После сбора данных можно построить модель регрессии, которая позволит предсказать траекторию движения тренда, или выбрать другой инструмент. Здесь все в руках data scientist: он может использовать МНК (метод наименьших квадратов), нейронную сеть и так далее. И от того, насколько правильно он отберет данные и выберет модель для анализа, зависит успешность конкретного прогноза и, соответственно, бизнеса хедж-фонда в целом.

Важно понимать, что в индустрии хедж-фондов, да и в финансовой отрасли в целом ценят не сложность, а эффективность стратегий. Всегда нужно сначала пробовать самые простые модели и подумать, нужно ли их усложнять. Также важно понимать фундаментальную экономическую подоплеку конкретной идеи. Так что использование искусственного интеллекта не обязательно, но, если есть показатели, которые можно существенно улучшить с помощью машинных методов, пренебрегать технологиями не стоит.

Безусловно, большинство задач, которые решают с помощью искусственного интеллекта, далеко не новы для рынка. К примеру, во время обучения в «Школе анализа данных» «Яндекса» я создал модель для оценки параметров для предсказания волатильности и цены на актив, работающую на основе технологий ИИ и машинного обучения. Модели оценки волатильности  существуют давно и активно используются, но с помощью машинного обучения удалось ускорить процесс на порядок. А, как известно, в мире финансов даже миллисекунды могут сыграть свою роль.

Широко известен пример компании Spread Networks, которая построила прямую линию оптоволоконной связи между Чикагской товарной биржей и центром обработки данных биржи NASDAQ в Нью-Джерси. Это было нужно, чтобы получать данные на доли секунд раньше остальных участников рынка.

Затраты на проект составили $300 млн, причем речь шла об ускорении на десятые доли миллисекунды. На основе этой реальной истории в 2018 году даже был снят фильм «Операция «Колибри», а ранее Майклом Льюисом написана книга «Flash Boys». И хотя эту сеть быстро заменили сети микроволновой связи, позволившие добиться еще более высоких скоростей, этот пример демонстрирует, сколь ценны в мире финансов миллисекунды.

Какие навыки нужны для работы в хедж-фонде?

Все привыкли, что наибольшую ценность на рынке имеют специалисты с кросс-функциональными компетенциями. Хедж-фонды — не исключение. Сотруднику хедж-фонда уже недостаточно знаний исключительно в области экономики.

Сегодня популярна следующая комбинация или образовательный маршрут: технический бакалавриат и затем магистратура в области экономики и финансов. Это не значит, что те, кто выбрал финансовое направление для получения основного образования, уже проиграл. Вовсе нет: сейчас существуют программы по data science уровня магистратуры, где можно обучаться, не имея IT-образования. Базовые навыки data scientist можно приобрести и вне высшего образования, окончив годовые курсы.

Но факт остается фактом: без знаний в области data science многим специалистам финансового рынка уже сегодня обойтись крайне сложно, а в будущем, вероятно, будет и невозможно.

Точка зрения авторов, статьи которых публикуются в разделе «Мнение профи», может не совпадать с мнением редакции.

Оставьте комментарий