Minit TechCrunch: Sebuah robot Google memperlihatkan apa yang Gemini boleh lakukan

Visi Kutub

Sunday, April 20 2025

Google telah menemui cara baru untuk menunjukkan apa yang model AI Gemini boleh lakukan, dengan bantuan daripada sebuah robot.

Ini adalah sebuah robot daripada Bahagian Robot Semua Orang Google, yang telah ditutup tahun lalu. Tetapi nampaknya robot tersebut masih wujud, jadi Google meletakkan corak simpul kuning pada salah satunya kemudian menggunakan Gemini untuk mengajar robot itu bagaimana untuk memberi respons kepada arahan dan menavigasi ruang pejabat DeepMind.

Untuk mencapai ini, Google menggunakan model bahasa penglihatan (VLMs) yang dilatih dengan gambar dan video bersama teks, membolehkan mereka menjawab soalan dan menjalankan tugas yang memerlukan persepsi.

Sebagai contoh, dalam satu video seorang kakitangan Google meminta robot tersebut membawanya ke suatu tempat untuk melukis. Robot tersebut berkata ia memerlukan masa untuk berfikir, kemudian ia membawa kakitangan ke papan putih. Dalam video lain, robot diminta untuk mengikuti arahan pada papan putih, di mana peta menunjukkan arahan untuk sampai ke kawasan Biru. Robot itu mengikuti arahan untuk sampai ke kawasan ujian robotik kemudian mengumumkan, 'Saya telah berjaya mengikuti arahan pada papan putih.'

Tekan main untuk melihat robot beraksi, kemudian beritahu kami apa pendapat anda dalam komen!

Visi Kutub

Minit TechCrunch: Sebuah robot Google memperlihatkan apa yang Gemini boleh lakukan

Recent Posts

'Flow' menang Anugerah Filem Animasi Academy Award, memberikan Latvia Oscar pertamanya

Batalan 'Life by You' merosakkan untung rugi operasi Paradox

Gavi kembali berlatih dengan rakan sepasukannya Barcelona 10 bulan selepas robek ACL

Techstars mengurangkan pekerjaan sebanyak 17%, menghentikan program yang disokong oleh J.P. Morgan

Runtuhnya Bilah, Pelancaran New York dan Kajian New Jersey Menunjukkan Kemajuan Tidak Sekata Tenaga Angin Laut