14 мая прошла очередная ежегодная онлайн-конференция для разработчиков Google I/O. Глава корпорации Сундар Пичаи и другие топ-менеджеры рассказали о ряде продуктов, релиз которых запланирован уже в этом году, или уже произошел. Сама конференция была, почти целиком, посвящена разработкам в сфере искусственного интеллекта, на что намекала весьма интересная вступительная часть. 

В качестве вступления участникам конференции предложили послушать выступление диджея, использовавшего в своем перформансе возможности сервиса Music FX (создающего музыку по текстовому запросу).

 

Обновления в сервисах 

Глава Google представил экспериментальную ИИ-функцию Ask Photos («Запрос к фотографии») в Google Photo. Она позволяет искать по описанию на фотографиях любые объекты, людей или животных. Конкретных сроков релиза Сундар Пичаи не назвал, сказав только, что Ask Photos станет доступна в “ближайшие месяцы”. 

Функция работает на базе ИИ движка Gemini 1.5 Pro предназначенного для ОС Android, который уже с 15 мая появится в боковой панели Gmail, рядом с другими инструментами, такими как Диск, Таблицы и Презентации. Однако доступ к возможностям Gemini 1.5 Pro получат только платные подписчики какого-либо из сервисов Google. Все остальные получат доступ к ограниченному функционалу только в начале 2025. 

Для десктопной версии браузера Chrome появится отдельная версия движка Gemini Nano. Все эти движки обеспечивают интеграцию инструментов ИИ в разные операционные системы.

 

Новый виртуальный помощник и сервисы для генерации медиа-контента

Голосовой мультимодальный помощник Project Astra способен не только общаться с пользователем, но и оптимизировать ряд процессов. Например, позволит распознать объекты в кадре во время видеоконференции, оптимизирует работу микрофона и снизит задержку для более плавной передачи видеопотока. 

 

Также была представлена новая генеративная ИИ-модель для создания изображений Imagen 3. Она лучше предыдущей версии “понимает” текстовые запросы и позволяет получать более релевантные сгенерированные изображения в итоге. Также улучшилась читабельность наложенного на изображение текста.

Не обошлось и без новинок в генерации видео. Новая модель ИИ Veo является прямым конкурентом Sora от OpenAI и позволяет создавать ролики с разрешением 1080p длительностью до 1 минуты. Для старта генерации необходимо следовать подсказкам мастера используя для уточнения запроса текст, картинки или исходные видеофайлы. 

 

Аппаратные разработки – новые тензорные и ARM-процессоры

Компания Google уже наладила производственный цикл собственных тензорных и ARM-процессоров. Аренда суперкомпьютеров на базе этих процессоров будет доступна пользователям облачных сервисов компании. Они позволят гораздо быстрее обрабатывать информацию и, по словам инженеров, обеспечат удвоенную эффективность в сравнении с существующими на рынке решениями. 

 

Android – новая бета 15 версии уже доступна

 

Разработчики Google улучшили работу инструмента для поиска “Лупа”. Теперь, помимо выдачи прямых результатов поиска, он может генерировать дополнительные подсказки для расширения поиска или предоставлять подробные инструкции помогающие в обучении разным предметам (например математике или физике). 

На демо видео показали как интегрированный в Android ИИ Gemini изучает видео с Youtube и генерирует краткое тезисное изложение важнейшей информации из ролика. Это позволит пользователям экономить время, получая краткую выжимку информации без просмотра видео

Во время анонса представитель Google акцентировал внимание слушателей на интересном моменте – оказывается Gemini полноценно работает только на Android. Возможно в будущем это уменьшит количество брендовых оболочек на базе данной ОС, а количество “чистых” оболочек, наоборот, возрастет. 

Также анонсирован выход Android 15 Beta 2. На момент появления этой статьи на сайте он уже будет доступен для скачивания. 

 


В итоге

Все представленное Google на ежегодной конференции, так или иначе, связано с ИИ, даже новые процессоры. Так что вектор развития компании на ближайший год очевиден.