A dalszerző: mesterséges intelligencia

Az AI egyes szakértők szerint akár már a következő években megjelenhet a zenealkotás mainstream eszközei között.

Ismert előadók a mesterséges intelligencia (AI) és a gépi tanulás technológiáját segítségül hívva készítettek el egy dalt a Telekom Kraft új projektjében.

Csorba Lóci, a Lóci játszik zenekar frontembere dalszövegíróként és zeneszerzőként, a korábban a Telekom Electronic Beats által szervezett zenei tehetségkutató pályázaton sikerrel szereplő Szécsi Böbe pedig producerként jegyzi azt a dalt, amelyet január 10-én az esti órákban mutatott be a Petőfi TV.

Mint a közleményben írják, a zenegenerálás informatikai szempontból igen összetett kihívás, többek között azért, mert egy átlagosan 4 perces hosszúságú, CD-minőségű dal a számítógép számára egy hatalmas és komplex adatmennyiség. Ráadásul a mesterséges intelligencia számára kiindulópontként nem elegendő egyetlen zene: az AI mindig mintákból – adatszettekből – tanul, vagyis sok zeneszám megismerése és elemzése alapján jut el odáig, hogy felismerve az emberi fül számára kellemesen hangzó zene törvényszerűségeit, megpróbálkozhasson az alkotással.

A fejlesztő, Somogyi Viktor a Netwerk Media társtulajdonosa és fejlesztési vezetője is. 2010 óta rengeteg mesterséges intelligencia alapú projekt és vizuális digitalizációs fejlesztés fűződik a nevéhez: „Technológiai szempontból két komoly nehézséget kellett leküzdeni a projektben. Az AI alapú zenegenerálás a generatív modellek elméletén alapszik, vagyis egy meglévő minta alapján készít jövőbeli következtetéseket, előrejelzéseket – ez maga a megalkotott zene. Ha az előrejelzés entrópiája, vagyis rendezetlensége túl nagy, akkor az elkészült zene élvezhetetlenül zajos lesz. Ezért a modell tanulási feladatához hozzáadtunk elvárt műfaji információkat – stilizáltuk a modellt –, csökkentve az entrópiát és a zajt. Emellett az AI modellek futtatása meglehetősen számításikapacitás-igényes: főként a GPU, vagyis a videokártya jelenti a szűk keresztmetszetet, pontosabban ezen erőforrások megfelelő allokációja. A modell futtatásakor olyan virtuális szerver architektúrát kellett építeni, ahol stabilan, hiba nélkül lefutott a modell, de egy-egy verzió futtatása így is több órát vett igénybe. Ha ugyanezt egy komoly gamer-számítógépen tettük volna, egy-egy verzió elkészülte napokban, vagy akár hetekben lett volna mérhető” – fogalmazott a fejlesztő, azt is hozzátéve: meggyőződése, hogy a hús-vér, élő zenészek és az AI kooperációja akár már rövid távon is meg fog valósulni, illetve régi dalok újrafeldolgozásában és továbbírásában is nagyon hangsúlyos lesz az AI szerepe.

Az elkészült dal hamarosan hallható lesz a streaming szolgáltatóknál is (Spotify, Deezer, Apple music).

Azóta történt

Előzmények