Давайте немного поговорим о реальном опыте внедрения модели, которую мы назвали Moonshot. Наша идея заключалась в том, чтобы взять 1000+ колонок данных, Gradient Boosting 2000+ rounds, 1+ трлн записей, разреженных до 100 ГБ, 2 месяца имплементации, 600 ГБ памяти, 10 ТБ 20+ГБ/с дисков, только на GPU, API с обработкой более 100ГБ. Однако, когда прошли две недели, мы поняли, что ошиблись в 10 раз. Мы узнали, чтобы создать модель, которая превзойдет все существующие на текущем рынке, нужно большое количество данных. Из этого я сделал вывод: начинать стоит с чего-то простого, понятного, что это приносит пользу, затем мы постепенно усложнять процесс.
Сейчас в розничном секторе искусственный интеллект практически отсутствует. Наша модель позволяет нам собирать данные из огромного каталога, состоящего примерно из миллиона товаров. Например, мы можем анализировать индексы по интересам и предсказывать прибыльность товаров на Amazon. Это уже работает, и самый простой продукт позволяет заработать от 0.3% до 1% от вложенной суммы в неделю. Мы планируем развивать эту идею дальше и создать биржу, основанную на розничной торговле, подобную фондовой бирже. Однако сейчас чат-боты не могут обработать такое количество товаров, чтобы предсказать результаты.