DNS-elemző algoritmusra épül az új spamszűrő

A New York-i Thomas J. Watson Kutatóintézet két munkatársa, Isidore Rigoutsos és Tien Huynh egy a biológiában használatos módszert alkalmazott spamszűrésre. A Teiresias-algoritmust az IBM kutatói fejlesztették ki, és a DNS-spirálokban és aminosavakban előforduló ismétlődő mintázatok keresésére használták.

Az eljárás módosított, a feng-shuiból vett Chung-Kwei névre keresztelt változatát mintegy 67 ezer spammel látták el, amelyeket egy normál levelekből álló csoporttal hasonlítottak össze, hogy azonosítsák a kéretlen e-mailekre jellemző karakterláncokat. A prototípus jelen állapotában is nagy pontossággal dolgozik: a spamek 96,56 százalékát volt képes kiszűrni, a normál levelek esetében pedig mindössze 6000-ből egyet sorolt be tévesen, azaz spamként. Az eljárás előnye, hogy idővel – a minta gyarapodásával – egyre megbízhatóbban dolgozik, és nem túlságosan erőforrásigényes: egy 2,2 GHz-es Pentium-rendszeren másodpercenként 214 üzenet értékelhető ki.

A Chung-Kweit várhatóan beépítik az IBM Research által fejlesztett SpamGuru szűrőbe, amely része lesz a Lotus Workplace Messaging következő verziójának.

Az eljárás részletes leírása itt olvasható.

Azóta történt

Előzmények