Google DeepMind зaпускaeт двe нoвыe мoдeли искусствeннoгo интeллeктa, кoтoрыe помогут роботам «выполнять побольше широкий спектр реальных задач, нежели когда-либо ранее». Первая, подина названием Gemini Robotics,   — сие модель «зрение-речь-действие», способная знать толк в чем-нибудь новые ситуации, даже разве она не была получи них обучена.

Gemini Robotics построена получи Gemini 2.0, пишет The Verge. Каста модель достигла прогресса в трех ключевых сферах, которые, соответственно мнению Google DeepMind, важны в (видах создания полезных роботов: собирательность, интерактивность и ловкость.

Кроме потенциал обобщать новые сценарии, Gemini Robotics скорее взаимодействует с людьми и окружающей средой. Возлюбленная также способна выполнять паче точные физические задачи, такие не хуже кого складывание листа бумаги неужто снятие крышки с бутылки.

«Это позволяет нам строить роботов, более дееспособных, больше отзывчивых и устойчивых к изменениям в окружающей среде»,   — говорит Кароля Парада, старший директор и начальник отдела робототехники в Google DeepMind.

Соответственно словам Google DeepMind, Gemini Robotics-ER   — сие усовершенствованная визуальная языковая образчик, способная «понять наш затейный и динамичный мир».

Как объясняет Парада, подчас упаковываете ланч-бокс, а до вами на столе лежат пища, вам нужно знать, идеже что лежит, а также что открыть ланч-бокс, точно взять продукты и куда их подвести. Именно такие соображения должны делать Gemini Robotics-ER.

Эта конверсив разработана для робототехников интересах подключения к имеющимся низкоуровневым контроллерам   — системе, управляющей движениями робота   — а позволяет им использовать новые потенциал, предоставляемые Gemini Robotics-ER.