14 травня відбулася чергова щорічна онлайн-конференція для розробників Google I/O. Глава корпорації Сундар Пічаї та інші топ-менеджери розповіли про низку продуктів, реліз яких заплановано вже цього року, або вже відбувся. Сама конференція була майже цілком присвячена розробкам у сфері штучного інтелекту, на що натякала вельми цікава вступна частина.
У якості вступу учасникам конференції запропонували послухати виступ діджея, котрий використовував у своєму перформансі можливості сервісу Music FX (який створює музику за текстовим запитом).
Оновлення в сервісах
Очільник Google представив експериментальну АІ-функцію Ask Photos ("Запит до фотографії") в Google Photo. Вона дає змогу шукати за описом на світлинах будь-які об'єкти, людей чи тварин. Конкретних термінів релізу Сундар Пічаї не назвав, лише натякнув, що Ask Photos стане доступною в "найближчі місяці".
Функція працює на базі ШІ рушія Gemini 1.5 Pro розробленого для ОС Android, який вже з 15 травня з'явиться в бічній панелі Gmail, поряд з іншими інструментами, такими як Диск, Таблиці та Презентації. Однак доступ до можливостей Gemini 1.5 Pro отримають лише передплатники будь-якого з сервісів Google. Усі інші отримають доступ до обмеженого функціоналу тільки на початку 2025 року.
Для десктопної версії браузера Chrome з'явиться окрема версія рушія Gemini Nano. Усі ці рушії забезпечують інтеграцію інструментів ШІ в різні операційні системи.
Новий віртуальний помічник і сервіси для генерації медіа-контенту
Голосовий мультимодальний помічник Project Astra здатний не тільки спілкуватися з користувачем, а й оптимізувати низку процесів. Наприклад, дасть змогу розпізнати об'єкти в кадрі під час відеоконференції, оптимізує роботу мікрофона і знизить затримку для плавнішої передачі відеопотоку.
Також було презентовано нову генеративну ШІ-модель для створення зображень Imagen 3. Вона краще за попередню версію "розуміє" текстові запити і дає змогу отримувати більш релевантні згенеровані зображення в результаті. Також покращилася читабельність накладеного на зображення тексту.
У царині генерації відео також було представлено новинку. Нова модель ШІ Veo є прямим конкурентом Sora від OpenAI і дає змогу створювати ролики з роздільною здатністю 1080p та тривалістю до 1 хвилини. Для старту генерації необхідно слідувати підказкам майстра, використовуючи для уточнення запиту текст, картинки або вихідні відеофайли.
Апаратні розробки - нові тензорні та ARM-процесори
Компанія Google вже налагодила виробничий цикл власних тензорних і ARM-процесорів. Оренда суперкомп'ютерів на базі цих процесорів буде доступна користувачам хмарних сервісів компанії. Вони дадуть змогу набагато швидше обробляти інформацію і, за словами інженерів, забезпечать подвоєну ефективність, у порівнянні з наявними на ринку рішеннями.
Android – нова бета 15 версія вже доступна
Розробники Google поліпшили роботу інструменту для пошуку "Лупа". Тепер, крім видачі прямих результатів пошуку, він може генерувати додаткові підказки для розширення пошуку або надавати докладні інструкції, що допомагають у навчанні різним предметам (наприклад, математиці чи фізиці).
На демо відео показали як інтегрований в Android ШІ Gemini вивчає відео з Youtube і генерує короткий тезовий виклад найважливішої інформації з ролика. Це дасть змогу користувачам економити час, отримуючи стислий витяг інформації без перегляду відео
Під час анонсу представник Google акцентував увагу слухачів на цікавому моменті – виявляється Gemini повноцінно працює тільки на Android. Можливо в майбутньому це зменшить кількість брендових оболонок на базі даної ОС, а кількість "чистих" оболонок, навпаки, зросте.
Також анонсовано вихід Android 15 Beta 2. На момент появи цієї статті на сайті він уже буде доступний для скачування.
В підсумку
Усе презентоване Google на щорічній конференції так чи інакше пов'язане зі ШІ, навіть нові процесори. Тож вектор розвитку компанії на найближчий рік очевидний.