Idősorok hasonlóságának alkalmazása kvalitatív trend elemzés céljából
Kulcsszavak:
kvalitatív trendanalízis, epizód-szegmentáció, szekvencia-illesztésAbsztrakt
Az adatbányászati eszközök közül a széles körben alkalmazott statisztikai módszerek mellett egyre népszerűbbek a minőségi adatelemző technikák. Ezek kimenetei általában könnyebben értelmezhetőek a felhasználó számára, de ilyen eredmények eléréséhez ezek az eszközök gyakran az elemzett rendszer a priori ismeretének felhasználását igénylik. Ez a cikk egy olyan technikát mutat be, amely képes felügyelet nélkül összehasonlítani változók idősorát, és amelybe az előzetes ismeretek felhasználhatóak. A módszer két fő lépése a következő: Cheung és Stephanopoulos által kifejlesztett háromszög epizód szegmentáció alapján a trendeket szimbolikus epizódok szekvenciájára bontja, majd ezeket bioinformatikai szekvenciaillesztéssel összehasonlítja. A szekvencia-illesztés ismert módszer a bioinformatikában aminosav-szekvenciák vizsgálatára, amely egy dinamikus programozási mátrixon alapul, melynek elemei transzformációs súlyok. Az optimális illesztése két szekvenciának a minimális transzformációs súlyösszegű illesztés. Az alkalmazott technika súlyok helyett előre definiált pontértékeket maximalizál az optimális illesztés megtalálása érdekében. Az algoritmust kiegészítettük annak érdekében, hogy többdimenziós, zajjal terhelt adatok esetében is hatékonyan működjön, ezért főkomponens elemzést és Gauss-szűrőt alkalmaztunk. A cikkben bemutatásra kerül, hogy a kifejlesztett módszer alkalmas többváltozós idősorok összehasonlítására, osztályozására és minősítésére a trendek közötti hasonlóságon alapulva. Az algoritmust valós polimerizációs technológiai adatokon is teszteltük annak érdekében, hogy megvizsgáljuk, hogyan teljesít, valamint alkalmas-e a többtermékes technológia termékváltásainak elemzésére.