Képeket elemezve tanítja magát a szoftver

Napi 24 órában elemez képeket az a számítógépes program, melyet úgy írtak meg, hogy bizonyos korlátozott tanulási képességekkel rendelkezzen, és a kutatók abban reménykednek, hogy a szoftver minden egyes nap „okosabb lesz”, és a begyűjtött információk alapján mind több esetben tud majd „azonosítani” általa addig nem ismert tárgyakat is – áll a Carnegie Mellon Egyetem pár napja kiadott sajtóközleményében.

A Védelmi Minisztérium haditengerészeti kutatóintézete (Office of Naval Research – ONR) és a Google által támogatott projekt keretében a Never Ending Image Learner (NEIL) nevű programot júliusban indították el, és azóta több mint hárommillió képet elemzett. A NEIL nagyon sok attribútumot dolgoz fel, ahogy a honlapján is látszik: a tárgyak, helyszínek elemzése során figyeli a színeket, a formát, a textúrát, az anyagot, a megvilágítást stb. Az innováció fő része abban van, hogy a program kapcsolatokat is keres, mégpedig olyanokat, amelyek az emberi gondolkodás számára természetesek: az autók általában az úttesten láthatóak, az épületek nagyrészt függőleges irányban húzódnak, a kacsák nagyon hasonlítanak a libákra, a zebra és tigris egyaránt csíkos stb.

A kutatás vezetője Abhinav Gupta, a Carnegie Mellon robotikai intézetének munkatársa, aki úgy véli, hogy a képek segítségével lehet a legkönnyebben megismertetni egy számítógépes programmal azokat a körülöttünk lévő világról szóló alapinformációkat, melyeket az emberek is elsajátítanak.

Az elmúlt hónapokban a program a hárommillió kép alapján már 1500 féle tárgyat és 1200 típusú helyszínt azonosított, illetve 2500 kapcsolatot „tanult meg”. A kutatás egyik fő célja, hogy létrehozzák a világ legnagyobb vizuális elemeken alapuló tudásbázisát, amelyben a felvett attribútumok és kapcsolatok katalogizálva vannak összegyűjtve. Egy másik motiváció a „tanulni” képes program fejlesztésére az volt, hogy a továbblépéshez nagyon fontos a lehető legtöbb adatot összegyűjteni, a lehető legtöbb képet elemezni, de más projekteknél kiderült, hogy ha mindez emberi közreműködéssel zajlik, akkor roppant lassú a folyamat.

A programot és az eddigi eredményeket a kutatócsoport december 4-én, a Sydney-ben tartandó IEEE konferencián (International Conference on Computer Vision) fogja bemutatni.

Előzmények