Idősorok hasonlóságának alkalmazása kvalitatív trend elemzés céljából

Szerzők

  • Balaskó Balázs Pannon Egyetem, Folyamatmérnöki Intézeti Tanszék, 8200 Veszprém, Egyetem u. 10.
  • Németh Sándor Pannon Egyetem, Folyamatmérnöki Intézeti Tanszék, 8200 Veszprém, Egyetem u. 10.
  • Abonyi János Pannon Egyetem, Folyamatmérnöki Intézeti Tanszék, 8200 Veszprém, Egyetem u. 10.

Kulcsszavak:

kvalitatív trendanalízis, epizód-szegmentáció, szekvencia-illesztés

Absztrakt

Az adatbányászati eszközök közül a széles körben alkalmazott statisztikai módszerek mellett egyre népszerűbbek a minőségi adatelemző technikák. Ezek kimenetei általában könnyebben értelmezhetőek a felhasználó számára, de ilyen eredmények eléréséhez ezek az eszközök gyakran az elemzett rendszer a priori ismeretének felhasználását igénylik. Ez a cikk egy olyan technikát mutat be, amely képes felügyelet nélkül összehasonlítani változók idősorát, és amelybe az előzetes ismeretek felhasználhatóak. A módszer két fő lépése a következő: Cheung és Stephanopoulos által kifejlesztett háromszög epizód szegmentáció alapján a trendeket szimbolikus epizódok szekvenciájára bontja, majd ezeket bioinformatikai szekvenciaillesztéssel összehasonlítja. A szekvencia-illesztés ismert módszer a bioinformatikában aminosav-szekvenciák vizsgálatára, amely egy dinamikus programozási mátrixon alapul, melynek elemei transzformációs súlyok. Az optimális illesztése két szekvenciának a minimális transzformációs súlyösszegű illesztés. Az alkalmazott technika súlyok helyett előre definiált pontértékeket maximalizál az optimális illesztés megtalálása érdekében. Az algoritmust kiegészítettük annak érdekében, hogy többdimenziós, zajjal terhelt adatok esetében is hatékonyan működjön, ezért főkomponens elemzést és Gauss-szűrőt alkalmaztunk. A cikkben bemutatásra kerül, hogy a kifejlesztett módszer alkalmas többváltozós idősorok összehasonlítására, osztályozására és minősítésére a trendek közötti hasonlóságon alapulva. Az algoritmust valós polimerizációs technológiai adatokon is teszteltük annak érdekében, hogy megvizsgáljuk, hogyan teljesít, valamint alkalmas-e a többtermékes technológia termékváltásainak elemzésére.

Információk a szerzőről

  • Balaskó Balázs, Pannon Egyetem, Folyamatmérnöki Intézeti Tanszék, 8200 Veszprém, Egyetem u. 10.

    levelezőszerző
    balaskob@fmt.uni-pannon.hu

Hivatkozások

Charbonnier, S., Garcia-Beltan, C., Cadet, C., Gentil S. (2005). Trends extraction and analysis for complex system monitoring and decision support. Engineering Applications of Artificial Intelligence, 18(1), 21–36. https://doi.org/10.1016/j.engappai.2004.08.023

Cheung, J. T., Stephanopoulos, G. (1990). Representation of process trends. Part I. A formal representation framework. Computers and Chemical Engineering, 14(4–5), 495–510. https://doi.org/10.1016/0098-1354(90)87023-I

Faloutsos, C., Ranganathan, M., Manolopoulos, Y. (1994). Fast Subsequence Matching in Time-Series Databases. In: Proceedings of the ACM SIGMOD Int’l Conference on Management of Data. May 24–27, Minneapolis, MN. 419–429. https://doi.org/10.1145/191839.191925

Fayyad, U. M., Simoudis, E. (1997). Data mining and knowledge discovery. Tutorial Notes at PADD ’97–1st Int. Conf. Prac. App. KDD & Data Mining, London. https://doi.org/10.1023/A:1009792101442

Itakura, F. (1975). Minimum prediction residual applied to speech recognition. IEEE Transactions on Acoustics, Speech, and Signal Processing, ASSP, 23(1), 67–72. https://doi.org/10.1109/TASSP.1975.1162641

Ku, W., Storer, R. H., Georgakis, C. (1995). Disturbance detection and isolation by dynamic principal component analysis. Chemometrics and Intelligent Laboratory Systems, 30(1), 179–196. https://doi.org/10.1016/0169-7439(95)00076-3

Lin, J., Keogh, E., Patel, P. Lonardi, S. (2002). Finding Motifs in Time Series. In: Proceedings of the 2nd Workshop on Temporal Data Mining, at the 8th ACM SIGKDD International Conference on Knowledge Discovery and Data Mining. Edmonton, Alberta, Canada. Jul. 23–26.

Lin, J., Keogh, E., Lonardi, S., Chiu, B. (2003). A Symbolic Representation of Time Series, with Implications for Streaming Algorithms. In proceedings of the 8th ACM SIGMOD Workshop on Research Issues in Data Mining and Knowledge Discovery. San Diego, CA. Jun. 13. https://doi.org/10.1145/882082.882086

Needleman, S. B, Wunsch, C. D. (1970). A general method applicable to the search for similarities in the amino acid sequence of two proteins. Journal of Molecular Biology, 48(3), 443–453. https://doi.org/10.1016/0022-2836(70)90057-4

Sakoe, H., Chiba, S. (1978). Dynamic programming algorithm optimization for spoken word recognition. IEEE Transactions on Acoustics, Speech, and Signal Processing, 26(1), 43–49. https://doi.org/10.1109/TASSP.1978.1163055

Smith, L. I. (2002). A tutorial on Principal Component Analysis.

Srinivasan, R., Qian, M. S. (2006). Online fault diagnosis and state identification during process transitions using dynamic locus analysis. Chemical Engineering Science, 61(18), 6109–6132. https://doi.org/10.1016/j.ces.2006.05.037

Sundarraman, A., Srinivasan, R. (2003). Monitoring transitions in chemical plants using enhanced trend analysis. Computers and Chemical Engineering, 27(10), 1455–1472. https://doi.org/10.1016/S0098-1354(03)00075-9

Venkatasubramanian, V. (1995). A Syntactic Pattern-recognition Approach for Process Monitoring and Fault Diagnosis. Engineering Applications of Artificial Intelligence, 8(1), 35–51. https://doi.org/10.1016/0952-1976(94)00058-U

Waterman, M. S, Smith, T. F, Beyer W. A. (1976). Some biological sequence metrics. Advanced Mathematics, 20(3), 376–387. https://doi.org/10.1016/0001-8708(76)90202-4

Waterman, M. S. (1984). General methods of sequence comparison, Bulletin of Mathematical Biology, 46. 473–500.

Wong, J. C., McDonald, K. A., Palazoglu, A. (1998). Classification of process trends based on fuzzified symbolic representation and hidden Markov models. Journal of Process Control, 8(5–6), 395–408. https://doi.org/10.1016/S0959-1524(98)00008-0

Letöltések

Megjelent

2007-07-15

Hogyan kell idézni

Balaskó, B., Németh, S., & Abonyi, J. (2007). Idősorok hasonlóságának alkalmazása kvalitatív trend elemzés céljából. Acta Agraria Kaposváriensis, 11(2), 197-209. https://journal.uni-mate.hu/index.php/aak/article/view/1882

Ugyanannak a szerző(k)nek a legtöbbet olvasott cikkei

<< < 1 2