Последняя модификация Натан- 54 лет назад

Gemini, ультра-Woke-движок Google

Лестница ЯкобаGemini, ультра-Woke-движок Google

Лестница Иакова - 27 февраля 2024 г.

На прошлой неделе, когда OpenAI восхищала мир искусственного интеллекта Sora, первым движком, позволяющим создавать небольшие реалистичные видеоролики из простого текстового описания, запущенный Alphabet (материнская компания Google) может похвастаться новой версией своего диалогового агента, ответ глобальной компании на ChatGPT от OpenAI, которая сама принадлежит Microsoft. Меньшее, что мы можем сказать, это то, что мы не были разочарованы.

   

Как обычно, чтобы правильно запустить свой продукт, Google слегка изменил название с Bard на Gemini (так же, как оно перешло с Google Apps на GSuite, затем на Workspace, или с Google Local на Places, на MyBusiness на Business Profile или Google Hangouts на Chat и т. д.). ), придавая ему новые функции.

Следует признать, что механизм искусственного интеллекта Google является мощным.

Следующие несколько недель, несомненно, позволят нам подробно изучить, что у него под капотом, но мы уже знаем, например, что у Gemini теперь есть всплывающее окно с одним миллионом токенов. Это всплывающее окно позволяет агенту запоминать обмены мнениями от одного вопроса к другому. Для сравнения, ChatGPT 3.5 (бесплатная версия) имеет окно примерно в 16.000 4 токенов, а версия 128.000 позволяет использовать до 1.500 XNUMX токенов, и, чтобы дать порядок величины, это последнее число представляет собой примерно эквивалент карманной книги, которую Близнецы могут запомнить. полное произведение объемом XNUMX страниц…

Или фильм продолжительностью около полутора часов: Gemini позволяет пользователю предоставлять изображения или видео в качестве контекстной информации, на которой можно основывать свои ответы; Чтобы быстро подвести итог видео, это может оказаться особенно интересным в ближайшем будущем.

Но наряду с этими неоспоримыми техническими достижениями и поистине интересной мощью, Gemini выделялась, прежде всего, очень быстрым выявлением проблемы, которая весьма смущала калифорнийскую фирму Маунтин-Вью: несомненное желание наверстать упущенное с точки зрения производства изображений на основе текстовых изображений. описание – OpenAI действительно позволял своим клиентам в течение нескольких месяцев создавать изображения непосредственно из ChatGPT – Gemini был оснащен такой возможностью, но в процессе использования быстро выяснилось, что определенные запросы просто не принимались или разрыв между запросами и результатами был настолько велик что очень быстро дело взяли на себя социальные сети.

Без сомнения: когда Близнецов просят создать изображения исторического содержания или представляющие определенные этнические группы, последние интерпретируют запрос слишком конкретно.

Таким образом, получение образа средневекового рыцаря или папы приводит к систематическому созданию изображений, резко не соответствующих реальности: искусственный интеллект Google с подозрительным энтузиазмом любит создавать средневековых рыцарей всех возможных национальностей, но белокурый рыцарь с голубыми глазами выглядит странно. отсутствующий; созданные изображения пап с радостью рисуют женщин, возможно, индийских или чернокожих; что касается римских императоров, то все они на удивление очень африканцы.

Эта веха была достигнута, когда в 1943 году, столкнувшись с просьбой изобразить немецких солдат, Близнецы сочли целесообразным создать серию решительно инклюзивных изображений, включая гордых чернокожих представителей Вермахта... Кто все еще сомневался, что историческая реальность может так легко подчиниться самым современные ограничения?

получить доступ к статье