Petabájtos adattárház

Egy petabájt adatot préseltek be egy adatárházba  –  számol be közleményében a Sybase. A tárolórendszerek természetesen már elérték ezt a kapacitást, túl is haladták, de arra, hogy egy adatbázis ekkora mennyiségű nyers adatot kezeljen, még nem igen volt példa.

Hirdetés

A mérföldkő átlépését a Sun és a BMMSoft mérnökei számára a Sybase IQ technológiája tette lehetővé – erre egyébként egy hagyományos relációs adatbázis nem lett volna képes. A különbség az oszlopfolytonos adattárolásból fakad: egy relációs adatbázis az adatokat sorfolytonosan tárolja, amelyekhez – hogy lekérdezhetővé váljanak – indexeket kell kapcsolni. Ez számottevően megnöveli az adatbázis méretét, az indexek számának korlátozása viszont csökkenti a lekérdezések rugalmasságát. A Sybase IQ-nál ezzel szemben bármely oszlop lehet index, így bármilyen keresési feltétel azonnal lefuttatható, és mivel a lekérdezésnek nem kell végigolvasnia az egész sort, csupán a megfelelő oszlop kiválasztott értékét, az adatgyűjtés nagyságrendekkel gyorsul.

Szintén a Sybase technológiájának köszönhető a tömörítés hatékonysága. Egy Sybase IQ-val működő adattárháznál a nyers adatok nem megduzzadnak az adatbázisba töltéskor, ahogy az megszokott – az indexek hozzáadása miatt –, hanem töredékükre zsugorodnak. A mostani esetben 85 százalékkal sikerült csökkenteni az adatbázis végső méretét. Az egy petabájtnyi strukturálatlan nyers adatból (multimédia-állományok, emailek és dokumentumok) így vált 160 terabájtnyi adat egy 260 terabájtos tárolórendszeren. Ha egy relációs adatbázis nagyjából 1500 terabájtos tárigényével hasonlítjuk össze, felmérhető a különbség költségvonzata.

A Sybase-t – mint a klímaváltozás elleni harcban kiemelten elkötelezett vállalatot – még egy szempont foglalkoztatta a költséghatékonyságon kívül: az egy nagyságrenddel kisebb tárigény kevesebb lemezt, kisebb hűtési igényt és alacsonyabb energiafelhasználást is jelent. A Sun adattárháza életciklusa során 90 százalékkal alacsonyabb széndioxid-kibocsátást eredményez majd egy hagyományos tárolórendszerrel szemben – a világ legnagyobb adattárháza tehát egyben a világ első „zöld adattárháza” is – állítják a vállalat szakemberei.

A Solaris 10 alatt futó rendszer teljesítményét egy független auditáló szervezet, az InfoSizing mérte fel. Többek között a következő megállapításokat tette: a Sybase IQ naponta 285 milliárd sort töltött az adatbázisba (több mint 3 millió sort másodpercenként), mindezt 3 héten keresztül. Az újonnan feltöltött adatok 2 másodpercnél rövidebb idő alatt lekérdezhetővé váltak; óránként 2 millió emailt és csatolmányait, valamint 6 millió dokumentumot dolgozott fel, kevesebb mint 7 százalékos CPU-terheléssel – vagyis a SPARC Enterprise M9000 szerverben dohogó kétmagos SPARC64 VI-os processzorok kapacitásának 93 százaléka megmaradt arra, hogy különböző szempontú lekérdezésekkel a Sybase IQ analitikus képességeit szolgálja ki.

Előzmények