Клод три. Ребята, смотрите, кто хочет. Очень советую погуглить, посмотреть на разные бенчмарки. Но, в частности, сегодня шла речь на предыдущей панели о том, как можно использовать современные модели в собственной работе. Вот посмотрите, что делают здесь клод. Это мульти модульная версия, модель, которая умеет воспринимать и видео, и изображения, и текст книги. И в данный момент ей было предложено сделать прогнозирование международного экономического состояния, взяв за основу этот график. Так вот, она для начала превратила этот график в табличку. Вот посмотрите, вот это цифры. Их не было на графике, она просто визуально по графику посмотрела, как это график изменялся. Потом она сама написала программу, связанную с некоторым предсказанием, и она пошла, построила график предсказания. На определенный период. Но интересно это. Суть этого текста заключается в том, что это было предсказание попросили сделать из прошлого. То есть, в общем то, мы уже знали, каковы были реальные данные в 20 м году. То есть было предсказано просьба сделать некоторые расчеты в прошлом и сравнить, и они были сравнимы с историческими данными. Отличие было 5%. Сравнение трех моделей Клод. Третье она вышла в трех вариантах опус, сонеты и хайку. Здесь показано на экране. Сейчас она активно проверяется. В общем то, лично нас интересует вот эта строка, связанная с Ризанинг. Это для цифровых сотрудников это наиболее важный момент. Насколько хорошо она принимает решения, когда модели даны сложные, очень длинные, иногда противоречивые инструкции. Так вот, джпт 4 принципе, достигает вполне приемлемого качества ризонинга для целей работы консьерж ресепшене, продавец саппорт пролегал. И некоторые интервью. Но обратите внимание на счет Опус уже значительно превышает джпт четыре по ризонингу. Так что это очень хорошая новость для всех, кто занимается внедрением у себя в организациях или внедрением для других людей сложных интеллектуальных агентов, которых мы называем цифровые сотрудники.
На предыдущих панельных дискуссиях говрили о том, как можно использовать современные модели на базе ИИ в собственной работе. Вот посмотрите, что может делать Claude 3. Это мультимодульная версия, модель, которая умеет воспринимать и видео, и изображения, и текст книги. Ей было предложено сделать прогнозирование международного экономического состояния, взяв за основу график. Так вот, она для начала превратила этот график в табличку, просто визуально по графику посмотрела, как данные изменялись. Потом она построила график предсказания на определенный период. Суть в том, что это было предсказание по прошлым данным, то есть мы уже знали, каковы были реальные данные в 2020 м году. Отличие между реальными данными и данными от Claude 3 было 5%.
Ниже показано сравнение трех моделей Claude 3, она вышла в трех вариантах: Opus, Sonnet, Haiku. Нас интересует строка, связанная с Reasoning over text. Для цифровых сотрудников это наиболее важный показатель: насколько хорошо она принимает решения, когда модели даны сложные, очень длинные, иногда противоречивые инструкции. Так вот, ChatGPT 4 в принципе, достигает вполне приемлемого качества для целей работы консьерж ресепшене, продавец саппорт пролегал. И некоторые интервью. Но обратите внимание на счет Опус уже значительно превышает джпт четыре по ризонингу. Так что это очень хорошая новость для всех, кто занимается внедрением у себя в организациях или внедрением для других людей сложных интеллектуальных агентов, которых мы называем цифровые сотрудники.