Intelligens képelemző rendszert fejleszt a Xerox

Manapság a digitális képek felkutatása szinte kizárólag azok szöveges nevére vagy címkéire való kereséssel történik. Ennek megfelelően a felhasználó keresési találatai között csak olyan fotók jelennek meg, amelyek címében szerepel a megadott kulcsszó. A témájukban egyező, azonban szöveges jellemzésükben hiányos találatok elvesznek, vagyis a kívántnál kevesebb releváns kép akad fenn a találati szűrőn. A Xerox európai kutatóközpontjának, a Xerox Research Centre Europe-nak a szakemberei ezen az alacsonyabb hatásfokú keresési formulán szeretnének javítani azzal, hogy olyan képfelismerő és -elemző alkalmazásokat dolgoznak ki, amelyek kiegészítik a szöveges keresést egy automatikus képfelismerési modullal.

„Az archívumokat kezelő rendszert mintaképek segítségével megtanítjuk arra, hogy felismerje a keresett kép különböző elemeit. Ha például olyan képet keresünk, amelyen egy spánielt sétáltató fiatal lány látható, aki a nyakába húzott kapucnis felsőben az eső áztatta erdőt járja, akkor ezeket az elemeket egyenként, illetve együttesen is értelmezni tudja az erre felkészített rendszer. Azaz, ha egyszerű kereséssel a kutyasétáltatás a megadott kulcsszó, akkor úgyis találatként jelenik meg, és akkor is, ha összetett keresés esetén egyszerre több képjellemzőt adunk meg” – hangsúlyozta a rendszer működése kapcsán Csurka Gabriella, a projekt egyik szakértője. A szakember beszámolója szerint előrehaladott elméleti kutatásokat végeznek a képek esztétikai besorolása érdekében, hogy ez a szempont is keresésre alkalmas kategóriává váljon a jövőben. Ennek révén arra is lehetőség nyílik majd, hogy a képek által keltett érzelmi benyomások és hangulatok megjelenjenek a keresési feltételek közt.

A Xerox most tesztelési fázisba jutott képfelismerő és -elemző megoldása már több ezer képkategóriát – köztük tájakat, tárgyakat, állatokat, de akár absztrakt kategóriákat is, mint „teniszmérkőzés” vagy „esküvő” – képes eredményesen megtanulni mintaképek alapján, így ugyanennyi besorolási szempont alapján válik kereshetővé az adott felvétel. A megoldást szöveges keresőfunkcióval kombinálva gyakorlatilag bármilyen általános kulcsszóra – beleértve például konkrét személyek vagy helyek nevét – rákereshetünk, ami jelentősen javíthatja a keresés eredményét.

A legnagyobb kihívást a projektben az jelenti, hogy a rendszer a mintaképek betáplálása után és azok állandó ismétlő monitorozása alapján kellő pontossággal határozza meg a jellemző elemeket (formákat, színeket, kontrasztokat, személyeket, szöveges tartalmakat, anyagokat vagy a felületek minőségét), és ismerje fel azokat a későbbiekben. Jelenleg az alkalmazás keresési beállításainak finomhangolása zajlik, a rendszer széles körű elterjedése a kutatások befejezését és a sikeres tesztek lezárását követően várható.

A felhasználási területek száma gyakorlatilag végtelen – többek között a közlekedésszervezésben is komoly hasznát lehet venni a képfeldolgozási eljárásoknak: a rendszer segítségével a kamerák például rendszám alapján képesek pillanatok alatt ellenőrizni, hogy jogosultan veszi-e igénybe az ott közlekedő jármű a buszsávot.

  • Kapcsolódó cégek:
  • Xerox

Azóta történt

Előzmények

  • Stratégiai kinevezések a Xeroxnál

    Mostantól alelnöki pozíciót tölt be Mark Costello, szabadalmi- és stratégiai jogtanácsos, Mike Festa, a fúziók és felvásárlások igazgatója és Joe Mancini, az Egyesült Államokban és Kanadában zajló pénzügyi műveletekért felelős vezető.

  • Figyelni fognak ránk a számítógépek

    Jön a kontextusérzékeny vezérlés. Sőt az Intel szerint a jövőben a számítógépek nemcsak a felhasználó mozdulatait, de a szokásait, preferenciáit is figyelembe veszik majd.

  • Megújult, megszépült a Google képkeresője

    Sokkal szebb és használhatóbb lett a szolgáltatás.