24. jūnijā Google Deepmind atklāja revolucionāro robotikas modeli Gemini robotiku uz ierīces, atzīmējot pirmo reizi, kad modelis var darboties pilnībā lokāli, nepaļaujoties uz mākoņu savienojumu. Šis vizuālās valodas-darbības (VLA) modelis, kura pamatā ir Gemini 2. 0 arhitektūra, integrē vizuālo atpazīšanu, dabiskās valodas izpratni un darbības ģenerēšanas iespējas, ļaujot robotiem precīzi veikt sarežģītus uzdevumus, piemēram, drēbju salocīšanu, rāvējslēdzēju izskaušanu un pat sasaistīt shoelaces bezsaistes vidē.

Tehnoloģiskais izrāviens: lēciens uz autonomiju no mākoņa līdz malai
Dvīņu robotika uz ierīces iegūst veiktspēju, kas ir salīdzināma ar mākoņa modeļiem uz vietējās aparatūras, izmantojot vieglu dizainu un algoritmu optimizāciju, vienlaikus ievērojami pārspējot citus vietējos risinājumus. Aprīkots ar augsta blīvuma taustes sensoriem un IP67 ūdensnecaurlaidīgu dizainu, tas var darboties ūdenī līdz 1 metra dziļumam 30 minūtes, pielāgojoties sarežģītai videi, piemēram, virtuvēm un vannas istabām. Mobilitātes ziņā pastaigas ātrums ir uzlabojies par 60%, salīdzinot ar iepriekšējo paaudzi, ar līdzsvara precīzu konkurenci profesionālajiem vingrotājiem un atbalstu divkāršu sadarbībai, lai veiktu precīzas darbības, piemēram, rūpniecības montāžu.
Izstrādātāja ekosistēma: pielāgošana ar tikai 50 demonstrācijām
Kā Google pirmais atvērtā vLA modelis, Dvīņu robotika uz ierīces var ātri pielāgoties jauniem scenārijiem ar tikai 50-100 uzdevuma demonstrācijām, piemēram, instrukcijas pabeigšanu "Ievietojiet Rubika kubu dāvanu maisiņā" Apptronik apollo humanoid robotu. Pievienotais Dvīņu robotikas SDK integrē Mujoco Physics simulatoru, ļaujot izstrādātājiem pārbaudīt modeli virtuālā vidē un iegūt piekļuvi, izmantojot "uzticama testera programmu". Šo iniciatīvu nozare uzskata par "robotikas android" ar potenciālu vadīt aparatūras un programmatūras atdalīšanu un zemākas nozares attīstības barjeras.
Pieteikuma scenāriji: vispārināmība no rūpnīcām uz mājām
Rūpniecības nozarē modelis ir pielāgots Franka FR3 divkāršu robotam, kas ļauj veikt tādus uzdevumus kā konveijera lentes montāža un kvalitātes pārbaude. Mājas iestatījumos tas var veikt ikdienas pakalpojumus, piemēram, gatavot un staigāt suni, izmantojot dabiskās valodas mijiedarbību, un pat iepriekš pagatavot brokastis, pamatojoties uz lietotāju grafikiem. Proti, Google ir ieviesis semantiskās drošības pārskatus, izmantojot Gemini Live API un ir iestatījis darbības spēku un ātruma ierobežojumus aparatūras līmenī, lai izveidotu daudzslāņainu drošības aizsardzības sistēmu.

Lai arī tā pašlaik ir izstrādāta, pamatojoties uz Gemini 2. 0, tā galvenā komanda jau ir sākusi integrēt jaunākā Gemini 2.5 veiktspējas uzlabojumus, potenciāli paverot ceļu turpmākiem sasniegumiem daudzpakāpju loģiskās plānošanas spējas. Tā kā lokalizētie AI modeļi kļūst plaši izplatīti, robotikas nozare pāriet no "mākoņa atkarības" uz "Edge Intelligence". Dvīņu robotikas palaišana ierīcē iezīmē jaunu iemiesota intelekta laikmetu, kas ievada liela mēroga lietojumprogrammu.
