Tíz új nyelvet ismer a Google online fordítója

A Google a múlt héten tíz új nyelvvel bővítette internetes fordítójának repertoárját. Bár a hozzáadott nyelvek között jó néhány kelet-európai is szerepel, a magyar egyelőre nem. Az újonnan támogatott nyelvek a következők: bolgár, cseh, dán, finn, hindi, horvát, lengyel, norvég, román és svéd.

Az így már 23 nyelven boldoguló Google Translate újdonsága, hogy az elérhető nyelvek közül bármely kettő között tud oda-vissza fordítani – azaz eltörölték az eddigi kötöttségeket. Tehát például kínairól is bármely más nyelvre képes átültetni több-kevesebb pontossággal a beírt szöveget vagy akár teljes weboldalt, ami a pekingi olimpia közeledtével kedves figyelmesség. Ahogy az is, hogy választható egy Detect language (nyelvfelismerés) opció is a forrásnyelv megadására szolgáló legördülő menüben, amely a nem latin betűs források fordításakor jöhet jól.

„Noha a rendszerünk meglehetősen jó, tudjuk, hogy nem tökéletes. A gépi fordítás nehéz ügy, de hozzásegítheti az embereket olyan tartalmak megismeréséhez, melyeket különben nem tudnának elolvasni” – írja a bejelentésről beszámoló blogjában Jeff Chin, a Google Research illetékes projektvezetője.

Az internetvállalat egyébként – mint általában – a fordítók területén sem a bevált módszereket követi. Míg ma a legtöbb ilyen program, alkalmazás grammatikai szabályok és szótárak segítségével dolgozik, a Google az ún. statisztikai módszert használja. Ebben az esetben nincs szükség nyelvészek közreműködésére, csupán már lefordított szövegekből kell egy megfelelően nagy korpuszt összegyűjteni (ami például a soknyelvű Európai Unióban adottnak tekinthető). A forrás- és célnyelven egyaránt adott szövegekből aztán a számítógép kigyűjti a mintákat a későbbi fordításokhoz.

Azóta történt

Előzmények