2018. május 26., szombat

Gyorskeresés

Útvonal

Hírek » Szoftver rovat

Nagyot léptek előre a Google-nál a gépi fordítás terén

  • (f)
  • (p)
Írta: | | Forrás: IT café

A gépi tanulás lehetőségeit felhasználva egyszerűsítették az élőbeszéd fordítását, és az eddigi eredmények több mint biztatóak.

A Google háza tájáról az utóbbi időben egyre több bejelentés, tájékoztatás, ismertető érkezik, melyek a gépi tanuláshoz, az AI-hez kapcsolódnak – mára is jutott kettő, egy könnyedebb fajsúlyú és egy komolyabb is.

A kulcsszó: mintázatok

Az utóbbival kezdve: a Google-nál sok éve folynak komoly fejlesztések a gépi fordítás tárgykörében. Az már sok éve tapasztalható, hogy az élőbeszéd gépi fordítása a különféle szolgáltatásokban úgy működik, hogy a rendszer először írott szöveget készít az értelmezett beszédből, majd ezt a szöveget egy másik modul lefordítja a kívánt nyelvre írásos formában. A technológia jelen állapotában azonban ennek a módszernek van egy óriási hátránya: ha a beszédfelismerés egy szónál akár egyetlen hangot is tévesen ír át írott karakterre, az már vagy lehetetlenné teszi a fordítást, vagy vaskos félreértelmezéshez vezet (a Skype is tud már ilyet kilenc nyelven, de ott is átírást alkalmaznak).

A gépi tanulás egy speciális fajtájával („deep learning”) foglalkozó kutatók a Google Brain csapatában ezért úgy határoztak, hogy ezt a folyamatot a hibák kiszűrése érdekében lerövidítik, megpróbálják kihagyni az átírási, transzszkripciós fázist. Első lépésként a kialakított rendszerüket sok száz órányi hangfelvétellel tökéletesítették, amikor is spanyol élőbeszédet próbáltak angolra átültetni. E folyamat során a neurális hálózatokkal próbálták modellezni az agyi fordítás működését, mintázatok megfelelését keresték, és különféle rétegeket használtak el erre – azt keresték a tanulni képes rendszert felhasználva, hogy a tesztek során az elhangzó spanyol szöveg mikor felel meg egy adott írott angol szövegnek – vagyis a lényeg, hogy nem karakterek, hangok és írott szöveg, hanem elhangzó mintázatok és írott szöveg hasonlóságát keresik.

Működik

Az első tesztek és finomhangolások után a kezdeti tapasztalatok biztatóak voltak, ugyanis a rendszer rövid idő után jobb hatékonysággal fordított hangzó spanyol szöveget írott angolra, mint a fentebb említett átírásos módszer az erre a célra kialakított BLEU mérés szerint (ez a mérés azt adja meg, hogy a gépi fordítás milyen messze, illetve közel áll ahhoz, ahogy egy professzionális emberi tolmács végezné el a feladatot).

Ha sikerülne tovább tökéletesíteni a módszert, az persze a hétköznapokban is hasznos lenne, de egyelőre korlátozott képességei miatt különösen egyedi esetekben jönne jól – emelték ki szakemberek –, mint például akkor, ha mondjuk katasztrófahelyzetben érkezik segítség egy olyan helyre, ahol egy nagyon kevesek által beszélt nyelv a kommunikációs forma – és általában a ma már kevesek által beszélt nyelvek esetén lehetne igazán hatékonyan alkalmazni.

Játék, de komoly

A másik frissen bejelentett fejlesztés inkább szórakoztató – annak ellenére, hogy e mögött is roppant komoly szoftveres és hardveres fejlesztés áll. A szóban forgó projekt egy mostantól mindenki által használható webes alkalmazás, az AutoDraw alkalmazás formájában jelent meg a nagyközönség előtt, de mögötte a Google-nak dolgozó QuickDraw fejlesztőcsapatának nagy munkája áll, akik grafikus felismeréssel, illetve grafikus gépi tanulással foglalkoznak.

A hétköznapi felhasználó számára ez a program azt nyújtja, hogy az egyszerű rajzolóprogramban felvitt kriksz-krakszokra a szoftver ajánlatokat tesz: mit is akartunk rajzolni. Ez a felhasználó számára nagy segítség lehet rajzoláskor, de sokkal jelentősebb az a begyűjtött rengeteg információ, amit a fejlesztőmérnökök a program tökéletesítésére tudnak felhasználni.

Előzmények

Gyártók, szolgáltatók

Copyright © 2000-2018 PROHARDVER Informatikai Kft.