Keresés

Új hozzászólás Aktív témák

  • ddekany

    veterán

    válasz nuke7 #43 üzenetére

    "Pont azt a techinkát használják, ami megmondja, hogy kutya, melltartó vagy Kovács Pisti van-e az adott képen, csak ezt kvázi titkosítják"

    De nem. Sehol nem fér el egy telefonban egy akkora neurális háló, ami érdemi szemantikai leírást tud adni egy képről (sőt, elég korlátosan tudunk úgy általában ilyet csinálni... lásd pl. önvezető autók vergődését a látvány értelmezésében). Illetve mekkora az a hash, hogy ez szerinted beleférne? És ha így is benne lenne túl sok információ, nem küldi el a telefon a neural hash-t a szerverre. Csak azt tudja ellenőrizni a szerver oldal, hogy fekete listázva lett-e olyan neural hash, mint ami a te képedé, de ha erre az a válasz, hogy nem, akkor nem fogja tudni a képed hash-ét sem (mert, Private Set Intersection).

    Mint mondtam, igen, nyilván nem tudhatod, hogy milyen képeket feketelistáztak, azaz nyilván nincs arra technikai/matematikai garancia, hogy csak a CSAM-al foglalkozó hivatalos szervektől kapottakat veszik fel. Vagy hogy holnap nem kopog az állam, hogy heló Tim, ezeket Bástya elvtársat gúnyoló képeket is vegyétek fel. De hát ezzel mégis mit lehetne kezdeni? Vagy nincs kép szűrés, vagy pedig van ez a feszkó, hogy na vajon holnap még mit akarnak detektálni.

    Ha persze az a kérdés, hogy majd a disztropikus jövőben mi lesz... Tippre, nem fognak igyekezni még a látszatot sem fenntartani. Az arra feljogosított szervek megnézhetik mindenedet, kész. De itt még az Apple a jelek szerint épp küzd, gondolom hogy egy kis PR előnye legyen belőle. Persze eléggé fordítva sül el a dolog, mert a kriptorgárfia túl nagy brainfuck, és nem értik a felhasználók. De ismét, ha kell szűrni, akkor mit lehet még tenni?

    [ Szerkesztve ]

  • Ksix

    tag

    válasz nuke7 #43 üzenetére

    Tényleg nem értettem, amit írtál, de próbálkozom, és most már azt hiszem igen, és ennek fényében próbálom én is érthetőbben elmondani, hogy én mire gondoltam.
    A sima hash mindkettőnknek megvan és világos. Amit én szerettem volna megértetni veled, hogy van egy úgynevezett perceptual hash is, amit a sima hashoz hasonló módon a kép bájtjaiból számolnak ki, egyszerű matematikai módszerekkel, mindenféle AI nélkül, teljesen ugyanúgy, mint az md5, sha1 hash-eket. Csak amíg az md5 számítás eredménye olyan, hogy egy bit változtatás az eredeti adatokon új md5 hash-t eredményez, addig ezek a számítások mondjuk a képet fele felbontásra összenyomva, és az így keletkező teljesen új bájtokon végigszámolva pontosan ugyanazt a hash-t fogják adni. Mert így találták ki az algoritmusukat. Tehát nem azért kell a NeuralHash, mert csak értelmzéssel/felismeréssel lehet előállítani egy képre vonatkozó, képmanipulációt tűrő hash-t, ilyet sima matekkal is létre lehet hozni, ahogy az md5-öt. Csak egyszerűen azok a számítások túl lassúak, nagyon terhelnék a telefon, lemerítenék stb. Az AI meg hardveresen gyorsított, egyszerűbb azt betanítani egy csomó képpel és egy csomó hash-hal, hogy ez a kép, ez a hash, hasonló kép, ugyanaz a hash, teljesen más kép, teljesen más hash. (Oké, van itt egy óriási leegyszerűsítés, de az a valóságot nem torzítja.)

    „Pont azt a techinkát használják, ami megmondja, hogy kutya, melltartó vagy Kovács Pisti van-e az adott képen, csak ezt kvázi titkosítják, ez a neural hash.”
    Na ez az, ami totális tévedés, és semennyire sem igaz, és mégis ezt ismételgeti itt mindenki, én meg úgy érzem, hogy hiába is magyarázom, hogy de hát ez nagyon nem így működik, mert úgy tűnik, nincs meg a szükséges AI ismeret hozzá (pedig aztán én sem tudok túl sokat). Úgyhogy most próbálom két különböző hasonlattal is megvilágítani, hogy ez miért tévedés. Az első, a mondatod kifordítása:
    Pont azt a technikát, a számítógépet használják arra, hogy táblázatot lehessen kezelni Excelben, csak ezt kvázi titkosítják, és ez a Fortnite.
    Attól, hogy egy számítógéppel lehet Excelezni, meg Fortnite-ozni, attól még nem lehet Excelben Fortnite-ozni, és a Fortnite-ban sem táblázatkezelni. És nincs olyan paraméter, amit az Excelbe beírva Fortnite lesz belőle, és a Fortnite-nak sincsen titkos billentyűkombinációja az Excellé váláshoz.
    Az AI csak egy üres vászon, semmit nem tud, meg kell tanítani mindenre. Az az AI, amit macskák, melltartók és emberek felismerésére tanítottak, az nem tud NeuralHash-t produkálni, és fordítva, teljesen máshogy van huzalozva, teljesen más a kimenete, teljesen más az egész. Nem lehetséges olyan csodaparaméter, amit átállítva ilyen történhetne, a komplett AI modellt le kellene cserélni ehhez, egy olyanra, ami azt tanulta. A képfelismerő és a NeuralHash AI-ban csak annyi közös, hogy mind a kettő AI, pontosan, ahogy az Excelben és a Fortnite-ban is csak az közös, hogy mind a kettő program.
    Második hasonlat, az ember. Veszünk egyet, és hosszú évek alatt megtanítjuk a teljes történelemre, fejből tud minden eseményt, évszámot stb. Bármilyen történelmi kérdésre azonnal tudja a választ. Aztán adunk neki egy kétismeretlenes egyenletet. Pontosan annyira fogja tudni megmondani az eredményt, mint amennyire a NeuralHash meg tudja mondani, hogy mi van a képen. És hiába rugdosod, viszel be akármilyen paramétert, nem fogja tudni megoldani. (De amíg egy embert meg lehet tanítani több dologra, addig egy AI-t nem igazán, ezért is nem kell tartani attól, hogy öntudatra ébrednek és átveszik a hatalmat. Egy-egy dolgot nagyon jól megtanulnak, de képtelenek a különböző tudást kombinálni.)
    De ez is egy olyan dolog, amit bárki le tud ellenőrizni, hiszen ez az AI modell letölthető, ki lehet próbálni, be lehet tölteni egy modell megjelenítőbe, meg lehet nézni a neurális hálózatot, hogy nincs rejtett paraméter, egyetlen kép bemenete van, tesztelni lehet, hogy mi történik ha vizuálisan hasonló tartalmú képeket kap (ugyanazt a hash-t dobálja ki), és mi lesz, ha mondjuk 8 db vizuálisan teljesen különböző, de macskát tartalmazó képet adunk neki (totálisan különböző hash-okat fog adni). És én erről beszéltem eddig, hogy a NeuralHash generálásba az Apple nem tud észrevétlenül beleavatkozni, mert amint változtat, lecseréli a modellt, rögtön megint meg lehet nézni, hogy mi változott, mit csinál máshogy az AI.

    És értem a perspektívát, így másodszorra, de én sem vontam sosem kétségbe, hogy kizárólag az Apple tudja, hogy valóban csak CSAM hash-ra szűrnek-e, vagy más képek is bekerülnek. Hiszen ez nem csak a dokumentációból derül ki pontosan, hanem az első pillanatban ők is bejelentették, hogy igen, ők gondoskodnak erről, és nem engednek majd később sem a kormányzati nyomásnak. Amit ízlés szerint, vagy elhisz az ember, vagy nem. Mint ahogy azt is valaki vagy elhiszi a Microsoftnak, hogy ők a saját ilyen PhotoDNA algoritmusukat csak a felhőben használják, vagy ellenkezőleg, azt hiszi, hogy kormányzati nyomásra már rég beépítették a Windowsba is, és évek óta kutatják már vele a felhasználók gépeit. Az IT-ben elég sok dolog szól a bizalomról.
    Olyan viszont nem lehet, hogy nem csak az iCloudba feltöltött képeket ellenőrzik, mert vagy az összes kép felmegy, vagy egy sem. A hálózati forgalmat nagyon jól meg lehet figyelni, rögtön lebukna az a telefon, ami kikapcsolt iCloud mellett is küldözget ilyen adatokat.
    „és amúgy a te általad linkelt videóban hangzik el, hogy a perceptual hash-ből rekrálható a kép, ezért titoksítják tovább.”
    Ez totálisan kizárt, lehetetlen, úgyhogy ha tudod, írd már meg az időpontot, hogy mikor hangzik ez, hogy meghallgassam, mit mond valójában. Hacsak nem egyszerű szótévesztés volt. De azért is biztos, hogy nem ezt mondta, mert a második videó pont ennek az ellenkezőjéről szól. Mert azzal, hogy megvan az AI modell, neki lehetett állni a gyenge pontok támadásának, és pont ezt csinálja abban a videóban. Szintén ott a letölthető, kipróbálható kód, ami forced hash collisiont generál, azaz előállít egy olyan képet, ami ugyanazt a NeuralHash-t eredményezi, mint egy emberi szem számára ránézésre teljesen más kép. A második videóban az alsó kutyás kép, és a Titanic kép NeuralHash értéke teljesen ugyanaz. Ha ebből a hash-ből tényleg visszaállítható lenne a kép, akkor melyik jönne vissza, a Titanic, vagy a kutyák? De feltölthetem ide azt is, amivel én kísérletezem, egy kép, meg a vízjelezett változata, ugyanaz a NeuralHash-ük, ha abból vissza lehetne állítani, melyik jönne vissza, a vízjeles, vagy az anélküli?
    Mondjuk az első videó készítésekor még nem találták meg az AI modellt, lehet hogy csak feltételezte az Apple leírása alapján, hogy hogyan fog működni, és azért mondta/gondolta, hogy visszaállítható. Az viszont biztos, hogy a másnapi videójával ezt ő is cáfolja.

Új hozzászólás Aktív témák