Nem látja a kutyától a macskát a Microsoft

A legújabb garázsprojekt sem tökéletes, bár pontosabb a korábbiaknál. Miért csinál viccet az adatfeldolgozásból a redmondi vállalat?

Azt nagyjából mindenki tudja, hogy kutyával, macskával és hiteles hízelgéssel szinte bármit el lehet adni. A Microsoftnál csavartak egyet a dolgon, ezek lettek azok a garázsprojektek, amelyek a közönséghez szólnak, néhány percig érdekesek, aztán el is lehet feledkezni róluk, mert annyira azért nem izgalmasak vagy bonyolultak, hogy huzamosabb ideig lekössenek bárkit. Nem is ez a céljuk.

Lássuk konkrétan, mivel rukkoltak elő mostanában garázsprojekt címszó alatt: volt életkortippelő, arcszőrzet-értékelő, hasonlóság-ellenőrző (ikertestvér-teszt), a sorból kilógó ébresztőóra, illetve a most szombaton elindított kutyafajta felismerő, ami természetesen emberekkel is működik, mert miért ne.

Ez ugyan nem szép dolog, de rettentően vicces, bizonyos méret alatt a kutya is macska? Ez ugyan nem szép dolog, de rettentően vicces, bizonyos méret alatt a kutya is macska?
Ez ugyan nem szép dolog, de rettentően vicces, bizonyos méret alatt a kutya is macska? A pug helyes válasz [+]

Az ébresztő kivételével a fenti "gegek" mindegyike azonos sémára épül: adott egy microsite, ahova fényképeket tölthetünk fel, tartozik hozzájuk egy közel azonos kezelőfelület, lecsupaszított dizájn, és persze buzzword is kell, a trendeknek megfelelően ez a  big data analízis lett (na meg persze machine learning, intelligent cloud services, artificial intelligence stb). Most abba nem mennék bele, hányszor és milyen mértékben volt képes mellényúlni az életkorral kapcsolatban a rendszer (ez volt az első a sorban), legyen elég annyi, hogy sokszor volt meglehetősen pontatlan. Aztán ahogy jelentek meg az újabb variációk, ahogy gyűlt az adat, a dolgok szép fokozatosan a helyükre kerültek.

A gép igazából nem lát - a három kutyát összemosta, de a képet feldarabolva helyes válaszokat adott A gép igazából nem lát - a három kutyát összemosta, de a képet feldarabolva helyes válaszokat adott A gép igazából nem lát - a három kutyát összemosta, de a képet feldarabolva helyes válaszokat adott
A gép igazából nem lát - a három kutyát összemosta, de a képet feldarabolva helyes válaszokat adott [+]

Most éppen ott tartunk, hogy kutyák fajtáját vizsgáló honlap indult (sőt, ehhez kivételesen iOS alkalmazás is jár, a többi platformon marad a böngésző, ami nagy kár, de erről később), ami a fajtatiszta, sztenderd kiállású kutyákról készült előnyös fotók esetében magabiztosan tippel, keverék (de karakán fajtajegyeket viselő) képek láttán jellemzően jó válaszokat adó, míg a teljesen egyedi megjelenésű négylábúak fényképeivel az esélytelenek nyugalmával induló rendszerről beszélünk. Egy kép, egy válasz. Kivéve, ha azon a fotón több minden is szerepel (galéria!), mert ilyen esetekben pillanatok alatt egyértelművé válik, hogy az algoritmus nem különösebben okos, inkább csak borzasztóan szorgalmas és a lehetőségekhez (na meg a fotók felbontásához) képest alapos, erre is utal a módszer technikai megnevezése, a deep learning.

A jópofizás mellett a Microsoft oxfordi kutatóközpontjában a dolgozók is gyakorolnak ezekkel a projektekkel, illetve arra is jó mindez, hogy az átlagos internetező könnyebben megértse, illetve saját maga tapasztalhassa meg, hogyan működik a "gépi logika" és tanulás. Ebből a szempontból a Fetch végre telitalálat, de ameddig nem próbáltuk, a böngészős változat is tökéletesnek tűnt. A what-dog.net ugyanis bár jóval kevesebbre képes, mint az (egyelőre csak) iPhone-ra elérhető alkalmazás, az alap dolgokat tudja. A képek a honlapról (az állatok pedig jellemzően saját, vagy ismerősi körből érkeztek, és természetesen nem esett bántódásuk), a videó pedig a Microsoft bemutatója az alkalmazásról. Jó szórakozást!

Azóta történt

Előzmények