Új hozzászólás Aktív témák

  • vz12

    tag

    Sziasztok!
    Magyar ékezetes szavak ékezetekre "nem érzékeny" keresésére szeretnék írni egy gyors, hatékony, ezért nem túl bonyolult algoritmust magamnak. A "rendes" ékezetekkel (pl."á", "Á", "é", "É", stb.) nincs is bajom, ezektől már függetleníteni tudtam magam, azonban az "egzotikus", tehát pl. a fordított, karikás, hullámos, vagy hosszú kettős ékezetek gondot okoznak még.
    Például ha a telefonos névjegyzékben keresem a "Jenő"-t, nos azt jó eséllyel NEM találom meg, mert az "ő" betű a kereső sztringben ugye egyféle módon van leírva, a felhasználók pedig a kettős ékezeteket telefontól és szokástól függően hol így írják, hol úgy. Egyébként akkor is gond van, ha "ő"-vel van írva a "Jenő" a névjegyzékben, mert valószínűleg ott más a kódja mint a kereső sztringben (ezt csak a hosszú kettős ékezetes betűknél, tehát az "ő" és "ű" betűknél tapasztaltam). El tudom képzelni, hogy az "egy vesszős" ékezetek esetén is "kreatívkodik" valaki, pl. fordított irányú ékezettel, vagy karikás ékezettel írja az "á" betűt, mert nincs "rendes "á" betűje. Ha a tel.könyvben valaki nem ír ékezeteket (pl. "Jeno"), és én mégis "Jenő"-t, vagy "jeno"-t, vagy "JENO"-t keresek, akkor már megtalálom. :)

    Előre is köszi, ha valakinek van ötlete ennek az érdekes problémának a megoldására.

    Valószínűleg "tökéletes" megoldás nincs, de egy "minél jobb" módszert azért megpróbálnék megalkotni, ami jobb mint az "így jártál" ...

    [ Szerkesztve ]

Új hozzászólás Aktív témák