Minit TechCrunch: Sebuah robot Google memperlihatkan apa yang Gemini boleh lakukan

Google telah menemui cara baru untuk menunjukkan apa yang model AI Gemini boleh lakukan, dengan bantuan daripada sebuah robot.

Ini adalah sebuah robot daripada Bahagian Robot Semua Orang Google, yang telah ditutup tahun lalu. Tetapi nampaknya robot tersebut masih wujud, jadi Google meletakkan corak simpul kuning pada salah satunya kemudian menggunakan Gemini untuk mengajar robot itu bagaimana untuk memberi respons kepada arahan dan menavigasi ruang pejabat DeepMind.

Untuk mencapai ini, Google menggunakan model bahasa penglihatan (VLMs) yang dilatih dengan gambar dan video bersama teks, membolehkan mereka menjawab soalan dan menjalankan tugas yang memerlukan persepsi.

Sebagai contoh, dalam satu video seorang kakitangan Google meminta robot tersebut membawanya ke suatu tempat untuk melukis. Robot tersebut berkata ia memerlukan masa untuk berfikir, kemudian ia membawa kakitangan ke papan putih. Dalam video lain, robot diminta untuk mengikuti arahan pada papan putih, di mana peta menunjukkan arahan untuk sampai ke kawasan Biru. Robot itu mengikuti arahan untuk sampai ke kawasan ujian robotik kemudian mengumumkan, 'Saya telah berjaya mengikuti arahan pada papan putih.'

Tekan main untuk melihat robot beraksi, kemudian beritahu kami apa pendapat anda dalam komen!