Пытаясь уничтожить ChatGPT OpenAI, Google заявляет, что ее новый AI Gemini может рассуждать лучше, чем существующие конкуренты.
В среду компания Google сделала следующий шаг в области искусственного интеллекта (ИИ), запустив проект Gemini — модель ИИ, обученную вести себя по-человечески, что, вероятно, усилит дебаты о потенциальных перспективах и опасностях этой технологии.
Внедрение будет происходить поэтапно: менее сложные версии Gemini под названием «Nano» и «Pro» будут немедленно включены в чат-бот Google Bard с искусственным интеллектом и его смартфон Pixel 8 Pro.
Google обещает, что благодаря поддержке Gemini, Bard станет более интуитивным и лучше справляется с задачами, требующими планирования.
По данным Google, на Pixel 8 Pro Gemini сможет быстро суммировать записи, сделанные на устройстве, и предоставлять автоматические ответы в службах обмена сообщениями, начиная с WhatsApp.
Наибольшие достижения Gemini произойдут не раньше начала следующего года, когда ее модель Ultra будет использоваться для запуска Bard Advanced, усовершенствованной версии чат-бота, которая первоначально будет предлагаться только тестовой аудитории.
Поначалу ИИ будет работать только на английском языке во всем мире, хотя руководители Google заверили журналистов во время брифинга, что технология без проблем в конечном итоге будет диверсифицирована на другие языки.
Основываясь на демонстрации Gemini группе репортеров, Google «Bard Advanced» может быть способен к беспрецедентной многозадачности ИИ, одновременно распознавая и понимая презентации, включающие текст, фотографии и видео.
Gemini также в конечном итоге будет включен в доминирующую поисковую систему Google, хотя сроки этого перехода еще не определены.
«Новая эра» для Google
«Это важная веха в развитии искусственного интеллекта и начало новой эры для нас в Google», — сказал Демис Хассабис, генеральный директор Google DeepMind, подразделения искусственного интеллекта, входящего в состав Gemini.
Навыки этой технологии в решении проблем рекламируются Google как особенно хорошо развитые в математике и физике, что вселяет надежды среди оптимистов в области ИИ на то, что она может привести к научным прорывам, которые улучшат жизнь людей.
Но противоположная сторона дебатов об ИИ обеспокоена тем, что эта технология в конечном итоге затмит человеческий интеллект, что приведет к потере миллионов рабочих мест и, возможно, к еще более деструктивному поведению, например, к распространению дезинформации или запуску ядерного оружия.
«Мы подходим к этой работе смело и ответственно», — написал в своем блоге генеральный директор Google Сундар Пичаи.
«Это означает, что мы должны быть амбициозными в наших исследованиях и использовать возможности, которые принесут огромную пользу людям и обществу, одновременно создавая меры безопасности и работая совместно с правительствами и экспертами над устранением рисков по мере того, как ИИ становится более способным».
Появление Gemini, вероятно, повысит ставку в конкуренции ИИ, которая обострялась в прошлом году, со стартапом OpenAI из Сан-Франциско и давним отраслевым конкурентом Microsoft.
Опираясь на финансовую мощь и вычислительную мощь Microsoft, OpenAI уже углубилась в разработку своей самой совершенной модели искусственного интеллекта, GPT-4, когда в конце прошлого года выпустила бесплатный инструмент ChatGPT.
Этот чат-бот, работающий на искусственном интеллекте, приобрел мировую известность, вызвав ажиотаж вокруг коммерческих обещаний генеративного искусственного интеллекта и вынудив Google вытеснить Bard в ответ.
На волне генеративного искусственного интеллекта
Как только Bard только появился на сцене, в марте OpenAI выпустила GPT-4 и с тех пор создавала новые возможности, предназначенные для потребителей и бизнес-клиентов, включая представленную в ноябре функцию, которая позволяет чат-боту анализировать изображения.
Он конкурирует за бизнес с другими конкурирующими стартапами в области искусственного интеллекта, такими как Anthropic и даже со своим партнером Microsoft, который имеет эксклюзивные права на технологию OpenAI в обмен на миллиарды долларов, вложенные в стартап.
Альянс до сих пор был благом для Microsoft, рыночная стоимость которой в этом году выросла более чем на 50 процентов, в первую очередь из-за веры инвесторов в то, что ИИ превратится в золотую жилу для технологической индустрии.
Материнская компания Google, Alphabet, также находится на той же волне: ее рыночная стоимость выросла более чем на 500 миллиардов долларов (460 миллиардов евро), или примерно на 45 процентов, в этом году. Несмотря на ожидания, связанные с Gemini в последние месяцы, акции Alphabet на торгах в среду немного снизились.
Углубление участия Microsoft в OpenAI в течение прошлого года в сочетании с более агрессивными попытками OpenAI коммерциализировать свои продукты вызвало опасения, что некоммерческая организация отклонилась от своей первоначальной миссии по защите человечества по мере развития технологий.
Эти опасения усилились в прошлом месяце, когда совет директоров OpenAI внезапно уволил генерального директора Сэма Альтмана в споре, вращающемся вокруг нераскрытых вопросов доверия. После негативной реакции, которая угрожала уничтожить компанию и привести к массовому оттоку талантливых инженеров в области искусственного интеллекта в Microsoft, OpenAI вернула Альтмана на пост генерального директора и произвела перестановки в совете директоров.
С выходом GeminiбО OpenAI может попытаться доказать, что его технология остается более умной, чем у Google.
«Я в восторге от того, на что он способен», — сказал о Gemini вице-президент Google DeepMind Эли Коллинз.
На виртуальной пресс-конференции Google отказался поделиться количеством параметров Gemini — одним, но не единственным показателем сложности модели.
В официальном документе, опубликованном в среду, описана наиболее эффективная версия Gemini, превосходящая GPT-4 на экзаменах с несколькими вариантами ответов, математике в начальной школе и других тестах, но признается продолжающаяся борьба с моделями ИИ для достижения навыков рассуждения более высокого уровня.
Некоторые ученые-компьютерщики видят ограничения в том, как много можно сделать с помощью больших языковых моделей, которые работают путем многократного предсказания следующего слова в предложении и склонны к ошибкам, известным как галлюцинации.
«С Gemini мы добились огромного прогресса в том, что называется фактологией. Так что Gemini — наша лучшая модель в этом отношении. Но я бы сказал, что это все еще нерешенная исследовательская проблема», — сказал Коллинз.