Экспертная сеть EXPINET

24.05.2023 17:55

Автор:

Администратор

Beyond the Moat: мощные модели искусственного интеллекта с открытым исходным кодом, готовые к использованию

Модели ChatGPT и GPT-4 в наши дни попадают во все заголовки. Но если вы посмотрите вокруг, то найдете подходящие модели с открытым исходным кодом, которые вы можете запускать самостоятельно, бесплатно, без каких-либо ограничений, с отличной производительностью.

Это было признано в меморандуме «We Have No Moat» от Google, опубликованном ранее в этом месяце, но компьютерная общественность, похоже, не осведомлена о множестве новых и захватывающих моделей искусственного интеллекта, которые выпускаются каждый день, говорят эксперты.

Автор: Алекс Вуди, главный редактор Datanami

Запуск ChatGPT 30 ноября 2022 года, вероятно, войдет в историю как определяющий момент в демократизации искусственного интеллекта. Вам пришлось бы вернуться к презентации Apple iPhone Стивом Джобсом 29 июня 2007 года, чтобы найти сопоставимый момент. Выступление генерального директора OpenAI Сэма Альтмана в Сенате США на прошлой неделе демонстрирует не только огромный потенциал технологии искусственного интеллекта, но и страх перед тем, что будет дальше.

Ажиотаж вокруг ChatGPT также побуждает сообщество машинного обучения и искусственного интеллекта к активным действиям, поскольку технологи ищут способы дополнить каждую когнитивную задачу возможностями искусственного интеллекта. От анализа данных и управления ими до ERP и разработки приложений — каждое приложение получает второго пилота на базе искусственного интеллекта, что повышает возможности человека.

Луис Сезе, профессор компьютерных наук Вашингтонского университета и генеральный директор OctoML, поражен прогрессом не меньше, чем все мы. Он считает, что OpenAI дал толчок нынешнему увлечению искусственным интеллектом.

«То, что происходит прямо сейчас, просто поразительно», — говорит Сезе. «Я чувствую, что ChatGPT замечателен со всех сторон, не только как фантастическая демонстрация технологии, но и как привлечение внимания к этой возможности…Теперь вам не нужно объяснять людям, на что способны все эти модели».

Большие языковые модели (LLM) уже некоторое время находятся в центре внимания, и OpenAI заслуживает похвалы за то, что открыл двери для новых вариантов использования искусственного интеллекта. Но потенциальные пользователи должны быть осторожными и не слишком зацикливаться на мысли, что OpenAI — единственная возможность, когда дело доходит до искусственного интеллекта. На самом деле, есть много других альтернатив GPT-4 и ChatGPT, которые, вероятно, лучше подойдут разработчикам искусственного интеллекта, говорит он.

«Мы видим, что многие клиенты и пользователи начинают использовать OpenAI, а затем понимают: «О, мне действительно нужно именно это», — говорит Сезе. «OpenAI создает потрясающие модели, и этим моделям потребовалось много инвестиций, чтобы достичь того, что они умеют. Но для вариантов использования, которые часто волнуют людей, иногда не нужен такой уровень функциональности».

В некоторых случаях, таких как обобщение текста, использование ChatGPT сродни тому, чтобы «взять Ferrari для того, чтобы поехать за кофе», — говорит Сезе. «Есть много бесплатных машин, которыми можно воспользоваться».

Среди «бесплатных автомобилей», на которых генеральный директор OctoML предлагает пользователям прокатиться, — RedPajama, Vicuna от LMSYS.org и Dolly, предлагаемая Databricks. Что касается изображений, то на ум Сезе приходят Stable Diffusion и Dall-E 2. Модель LLaMa от Meta просочилась в Сеть, и люди опираются на нее. Alpaca от разработчиков Стэнфордского университета создана на основе LLaMa.Hugging Face предоставляет доступ к более чем 13 000 моделям. По словам профессора, их уже существует гораздо больше, и с каждым днем количество увеличивается.

«Темпы прогресса просто бешеные», — говорит Сезе. «Я говорю о серьезных улучшениях, которые происходят. Я не преувеличиваю, что часто на ежедневной основе появляется новая потрясающая модель. Я не думаю, что люди это понимают».

Помимо того, что они бесплатны, у моделей с открытым исходным кодом есть и другие преимущества. Во-первых, пользователи могут запускать их в своей собственной инфраструктуре, что дает им больше контроля. Если у них есть навыки работы с данными, они могут настроить коэффициенты веса и алгоритмы и даже обучить модель работать на их собственных данных. Существует также проблема дополнительного риска запуска модели, обученной на неизвестных данных, за что OpenAI подвергался критике.

Внутренняя записка исследователя Google «We Have No Moat and neither does OpenAl» просочилась на сервер Discord, и ее содержание поддерживает точку зрения Сезе. Сотрудники SemiAnaysis подтвердили, что записка была реальной, а затем опубликовали ее умеренно отредактированную версию.

Согласно SemiAnalysis, там написано:
«Хотя наши модели по-прежнему имеют небольшое преимущество в плане качества, разрыв сокращается поразительно быстро. Модели с открытым исходным кодом работают быстрее, лучше настраиваются, более приватны и более функциональные. Они делают за 100 долларов вещи с 13 миллиардами параметров, а мы отвечаем 10 миллионами долларов за 540 миллиардов параметров. И они делают это за недели, а не за месяцы. Это имеет для нас глубокие последствия».

В документе изложено, что в том, что Google делает с Bard и другими моделями, нет никакого «секретного соуса». Улучшение происходит благодаря сотрудничеству с сообществом, а не смешиванию цифровых зелий в лаборатории Google. И по мере того, как меньшие языковые модели начнут делать то, что раньше можно было делать только с большими языковыми моделями, разрыв будет сокращаться до тех пор, пока не останется никакого преимущества.

Мы стали свидетелями «огромного всплеска» инноваций с тех пор, как в марте в сеть просочилась информация о LLaMa, говорится в исследовании. Сообществу потребовалось около месяца, чтобы начать работу над базовой моделью с вариантами, которые выводили настройку инструкций, квантование, улучшение качества, человеческие оценки, мультимодальность и RLHF (обучение с подкреплением на основе отзывов людей) на новый уровень.

«Самое главное, — пишет исследователь, — они решили проблему масштабирования до такой степени, что любой желающий может попробовать. Многие новые идеи исходят от обычных людей. Барьер для доступа к обучению и экспериментам снизился с общего объема производства крупной исследовательской организации до одного человека, одного вечера и мощного ноутбука».

Другими словами, через ров был переброшен постоянный мост — если ров вообще когда-либо существовал.
«Люди не будут платить за ограниченную модель, когда бесплатные, неограниченные альтернативы сопоставимы по качеству», — написано в документе. «Мы должны подумать о том, где на самом деле наша добавленная стоимость».

Это, конечно, отличная новость для всех — от любителей, которые хотят просто попробовать, до исследователей, которые хотят поэкспериментировать, и корпораций из списка Fortune 100, которые хотят внедрить искусственный интеллект в свои бизнес-процессы.

Одно из самых впечатляющих технологических достижений в новейшей истории теперь свободно доступно любому, у кого есть ноутбук, подключение к Интернету и желание. Барьер для доступа к использованию технологии уже значительно снижен, и дальнейшее снижение почти гарантировано, что вынуждает докторов наук искать еще более масштабные инновации, а остальным позволяет создавать новые приложения и изобретать бизнес заново с помощью того, что уже доступно.

«Люди уделяют много внимания закрытым крупным моделям, таким как OpenAI, Cohere и т.д., и я не думаю, что существует достаточное понимание того, что модели с открытым исходным кодом невероятно эффективны», — говорит Сезе. «Это то, на что, я думаю, люди не обращают достаточного внимания».

Ссылка на источник

Комментарии

Написать комментарий

Нет комментариев. Ваш будет первым!