A Google új technológiájával képes lesz az emberi testbeszéd leolvasására

2022-03-05 17:182024-03-22 18:55 Rebeka 635 Megtekintés

Mi lenne, ha a tévéd látná, hogy felálltál a kanapéról, ezért automatikusan szüneteltetné a Netflixet, majd folytatná a lejátszást, amikor visszaülsz? Ha lehalkítaná a hangerőt, mikor azt érzékeli, hogy elaludtál a kanapén? Vagy ha amint közel lépsz egy eszközhöz, az megjelenítené a beérkező e-maileidet?

A Google ATAP kutatócsoportja azt vizsgálja, hogy a radarral ellátott számítógépek hogyan reagáljanak az emberi interakciókra.

Kamerák helyett radarok

Futurisztikusan hangzik, és talán egy kicsit tolakodónak is. Egy számítógép, amely minden mozdulatunkat figyeli? Kevésbé tűnik hátborzongatónak, ha megtudjuk, hogy ezeknek a technológiáknak nem kell kamerára támaszkodniuk ahhoz, hogy lássák, hol vagyunk és mit csinálunk. Ehelyett radart használnak. A Google Advanced Technology and Products részlege – ismertebb nevén ATAP, az olyan furcsa projektek mögött álló részleg, mint például az érintés érzékelős farmerdzseki – az elmúlt évet azzal töltötte, hogy feltárja, hogyan használhatják a számítógépek a radart arra, hogy megértsék az igényeinket vagy szándékainkat, és aztán megfelelően reagáljanak rájuk.

Nem ez a Google első kísérlete a radarral

A Google 2015-ben mutatta be a Soli nevű szenzort, amely a radar elektromágneses hullámait képes felhasználni a pontos gesztusok és mozdulatok érzékelésére. Így a felhasználó anélkül tudott szundit nyomni az ébresztőjére vagy szüneteltetni a zenét, hogy fizikailag hozzá kellett volna érnie az okostelefonhoz. Nemrégiben a Nest Hub második generációs intelligens kijelzőjébe radarérzékelőket építettek be, hogy érzékeljék a mellette alvó személy mozgását és légzési mintáit. Az eszköz így képes volt nyomon követni az illető alvását anélkül, hogy egy okosórát kellett volna felcsatolnia.

“Úgy véljük, hogy ahogy a technológia egyre inkább jelen van az életünkben, méltányos, ha arra kérjük azt, hogy vegyen át tőlünk néhány további jelet” – mondja Leonardo Giusti, az ATAP formatervezési vezetője. Bizonyára sokaknak ismerős, ahogyan anyukád emlékeztethet arra, hogy fogj egy esernyőt, mielőtt kilépsz az ajtón. Talán a termosztátod is képes lesz ugyanezt az üzenetet továbbítani, amikor elsétálsz mellette, és rápillantasz – vagy a tévéd lehalkítja a hangerőt, ha azt érzékeli, hogy elaludtál a kanapén.

Radarkutatás

Giusti szerint a kutatások nagy része a proxemikán alapul, vagyis annak tanulmányozásán, hogy az emberek hogyan használják a körülöttük lévő teret a társadalmi interakciók közvetítésére. Ahogy közelebb kerülünk egy másik emberhez, úgy számítunk nagyobb elkötelezettségre és intimitásra. Az ATAP csapata ezt és más társadalmi jeleket használt fel annak megállapítására, hogy az embereknek és az eszközöknek saját elképzeléseik vannak a személyes térről.

A közelség önmagában nem elég. Mi van, ha csak elsétálsz a készülék mellett, de nincs a készülékkel terved, ráadásul más irányba nézel? Ennek megoldására a Soli képes a mozgások és gesztusok nagyobb részleteinek rögzítésére. Például a test tájolása, az útvonal, amelyen esetleg haladsz, és a fejed iránya. Mindezek a tartalmas radarinformációk segítenek jobban megtippelni, hogy valóban interakcióba kezdesz-e az eszközzel, és hogy milyen típusú lehet az interakció.

Ez a továbbfejlesztett érzékelés annak köszönhető, hogy a csapat egy sor koreografált feladatot hajtott végre a saját nappalijában. A fejük fölött elhelyezett kamerák követték a mozgásukat, és valós idejű radarérzékeléssel készültek.

Koreográfián alapul

Bedal, aki táncos háttérrel rendelkezik, azt mondja, hogy a folyamat nagyon hasonlít ahhoz, ahogyan a koreográfusok vesznek egy alapvető mozgásötletet és felfedezik annak variációit. Például azt, hogy a táncos hogyan helyezi át a testsúlyát, vagy hogyan változtatja meg a testhelyzetét és a tájolását. Ezekből a tanulmányokból a csapat formalizált egy sor mozdulatot, amelyeket mind a nonverbális kommunikáció és az eszközökkel való természetes interakciónk ihletett. Például, hogy érkezünk vagy távozunk, elmegyünk mellettük, felé fordulunk vagy tőle elfordulunk, pillantásokat vetünk rájuk.

Mire képesek ezek az eszközök?

Bedal felsorolt néhány példát arra, hogy a számítógépek hogyan reagálnak mozdulatainkra.

Ha egy eszköz érzékeli, hogy közeledsz, fel tudja húzni az érintésvezérlőket; ha közel lépsz egy eszközhöz, az kiemelheti a beérkező e-maileket; ha elhagysz egy szobát, a tévé könyvjelzőt tud tenni arra a helyre, ahol abbahagytad, és onnan folytathatod, amikor visszatérsz. Ha egy eszköz megállapítja, hogy éppen arra jársz, nem fog alacsony prioritású értesítésekkel zavarni. Ha pedig éppen a konyhában követsz egy videós receptet, a készülék szünetet tarthat, amikor elmész a hozzávalókért, és folytathatja, amikor visszalépsz.

“Mi tényleg csak a határait feszegetjük annak, hogy mit tartunk lehetségesnek az ember-számítógép interakcióban” – mondja Bedal.

Még tart a kutatási fázis

A radar felhasználása annak befolyásolására, hogy a számítógépek hogyan reagáljanak ránk, kihívásokkal jár. Például, bár a radar több embert is képes érzékelni egy szobában, ha az alanyok túl közel vannak egymáshoz, az problémát jelenthet. Az érzékelő az embertömeget csak egy amorf foltnak látja, ami megzavarja a döntéshozatalt. Ezen kívül még rengeteg tennivaló van, ezért Bedal (többször is) kiemelte, hogy ez a munka még nagyon is a kutatási fázisban van. Szóval nem, még ne számítsunk rá a következő generációs okos kijelzőnkben.

Ezeknek az eszközöknek egyensúlyt kell teremteniük, amikor olyan cselekvéseket hajtanak végre, amiről azt gondolják, hogy mi akarjuk. Mi van például, ha te azt akarod, hogy a tévé be legyen kapcsolva, miközben a konyhában főzöl? A radar nem érzékelné, hogy valaki nézi a tévét, és ahelyett, hogy bekapcsolva hagyná, szüneteltetné azt. “Meg kell találni a megfelelő egyensúlyt a felhasználói irányítás és az automatizálás között. Könnyednek kell lennie, de figyelembe kell vennünk, hogy a felhasználó mennyi vezérlést vagy konfigurációt szeretne az oldalán” – mondja Bedal.

A radar előnyei a kamerákkal szemben

Az ATAP csapata azért döntött a radar használata mellett, mert ez az egyik legkedvezőbb adatvédelmi módszer a gazdag térbeli adatok gyűjtésére. (Emellett nagyon alacsony késleltetéssel rendelkezik, sötétben is működik, és olyan külső tényezők, mint a hang vagy a hőmérséklet, nem befolyásolják). A kamerával ellentétben a radar nem rögzít és tárol megkülönböztethető képeket a testről, az arcról vagy más azonosító eszközökről. “Ez inkább egy fejlett mozgásérzékelő” – mondja Giusti.

Chris Harrison, az ember-számítógép interakciót tanulmányozó kutató szerint a fogyasztóknak kell majd eldönteniük, hogy meg akarják-e ezt az adatvédelmi kompromisszumot kötni. Elvégre a Google “világelső az adatok pénzzé tételében”, de szerinte a Google kameramentes megközelítése mégis nagyon is a felhasználó és az adatvédelem szempontjait tartja szem előtt.

“Az olyan emberek, mint a társadalomtudósok és a viselkedéskutatók bevonása a számítástechnika területére sokkal kellemesebb és sokkal humánusabb élményeket eredményez.”

A Google ATAP kutatása az egyik része az In the Lab With Google ATAP című új sorozatnak. Ennek új epizódjai a következő hónapokban debütálnak majd a YouTube-csatornán. A jövőbeli epizódok a Google kutatási részlegének más projektjeibe is betekintést nyújtanak majd.

Bitcoin

Ethereum

Altcoinok

Blokklánc