A partícionálás hatása fuzzy asszociatív osztályozók teljesítményére

Szerzők

  • Pach Ferenc Péter Pannon Egyetem, Folyamatmérnöki Tanszék, 8200 Veszprém, Egyetem u. 10.
  • Gyenesei Attila Adatelemző Központ, Unilever Kutatóközpont Vlaardingen, Hollandia
  • Németh Sándor Pannon Egyetem, Folyamatmérnöki Tanszék, 8200 Veszprém, Egyetem u. 10.
  • Árva Péter Pannon Egyetem, Folyamatmérnöki Tanszék, 8200 Veszprém, Egyetem u. 10.
  • Abonyi János Pannon Egyetem, Folyamatmérnöki Tanszék, 8200 Veszprém, Egyetem u. 10.

Kulcsszavak:

fuzzy logika, asszociációs szabály, osztályozás, partícionálás, csoportosítás

Absztrakt

Az osztályozás az egyik legszélesebb körben használt adatbányászati technika. Egy osztályozási feladatnál az egyik legfontosabb tulajdonság az osztályozás pontossága, azonban sok alkalmazási területen rendkívül fontos szempont, hogy az osztályozási eredmény áttekinthető, egyszerűen értelmezhető legyen. A fuzzy szabály alapú osztályozó rendszerek a felhasználók számára könnyen értelmezhető „Ha…Akkor” típusú szabályok formájában tartalmazzák az osztályozáshoz feltárt összefüggéseket. A cikk egy fuzzy asszociációs szabály alapú osztályozási módszert javasol, illetve annak továbbfejlesztési lehetőségeit ismerteti. Mivel az osztályozási teljesítményt a numerikus attribútumok partícionálása jelentősen befolyásolhatja, ezért két eltérő jellegű adatsorra alkalmazva részletesen megvizsgáltunk fuzzy és éles partícionáló módszereket is. Az elvégzett vizsgálatok alapján megállapítható, hogy a fuzzy csoportosítási módszerek alkalmazásával nagyobb osztályozási teljesítmény érhető el.

Információk a szerzőről

  • Abonyi János, Pannon Egyetem, Folyamatmérnöki Tanszék, 8200 Veszprém, Egyetem u. 10.

    levelezőszerző
    abonyij@fmt.uni-pannon.hu

Hivatkozások

Abonyi, J. (2006). Adatbányászat a hatékonyság eszköze, Gyakorlati útmutató kezdőknek és haladóknak, Computerbooks

Agrawal, R., Srikant R. (1994). Fast algorithm for mining association rules in large databases. In: Proceedings of The 20th International Conference on Very Large Data Bases, Santiago, Chile, 487–499.

Agrawal, R., Imielinski T., Swami, A. (1993). Database mining: A performance perspective. IEEE Transactions on Knowledge and Data Engineering, 5(6), 914–925. https://doi.org/10.1109/69.250074

Catlett, J. (1991). Megainduction: machine learning on very large databases, PhD thesis, University of Sydney

Dong, G., Zhang, X., Wong, L., Li, J. (1999). CAEP: classification by aggregating emerging patterns. In: Proceedings of The Second International Conference on Discovery Science (DS '99), Tokyo, Japan, 30–42. https://doi.org/10.1007/3-540-46846-3_4

Dougherty, J., Kohavi R., Sahami, M. (1995). Supervised and Unsupervised Discretization of Continuous Features, In: Proceedings of The Twelfth International Conference on Machine Learning, Tahoe City, CA, USA, 194–202. https://doi.org/10.1016/B978-1-55860-377-6.50032-3

Gath, I., Geva A. B. (1989). Unsupervised optimal fuzzy clustering, IEEE Transactions on Pattern Analysis and Machine Intelligence, 11(7), 773–780. https://doi.org/10.1109/34.192473

Gustafson, D. E., Kessel, W. C. (1979). Fuzzy clustering with fuzzy covariance matrix, In: Proceedings of The IEEE Conference on Decision and Control, San Diego, CA, 761–766. https://doi.org/10.1109/CDC.1978.268028

Liu, B., Hsu, W., Ma, Y. (1998). Integrating classification and association rule mining. In:: Proceedings of The Fourth International Conference on Knowledge Discovery and Data Mining (KDD ‘98), New York City, USA, 80–86.

Liu, B., Ma, Y., Wong C. K. (2000). Improving an Association Rule Based Classifier, In: Proceedings of the 4th European Conference on Principles of Data Mining and Knowledge Discovery, (PKDD 2000), Lyon, France, 504–509. https://doi.org/10.1007/3-540-45372-5_58

Meretakis, D., Wuthrich, B. (1999). Extending Naive Bayes Classifiers Using Long Itemsets, In: Proceedings of the Fifth International Conference on Knowledge Discovery and Data Mining (KDD ’99), San Diego, USA, 165–174. https://doi.org/10.1145/312129.312222

Pach, F. P., Gyenesei, A., Németh, S., Árva, P., Abonyi, J. (2006). Fuzzy Association Rule Mining for the Analysis of Historical Process Data, Acta Agraria Kaposváriensis, szerkesztés alatt

Pach, F. P., Gyenesei, A., Németh, S., Árva, P., Abonyi, J. (2006). Fuzzy Association Rule Mining for Model Structure Identification, Applications of Soft Computing: Recent Trends, Part VI Identification and Forecasting, Springer, 261–271. https://doi.org/10.1007/978-3-540-36266-1_25

Quinlan, J. R. (1986). Induction on decision trees. Machine Learning, 1(1), 81–106. https://doi.org/10.1023/A:1022643204877

Wang, K., Zhou, S., He, Y. (2000). Growing decision tree on support-less association rules. In: Proceedings of the sixth ACM SIGKDD international conference on Knowledge discovery and data mining (KDD’00), Boston, MA, USA, 265–269. https://doi.org/10.1145/347090.347147

Yin, X., Han, J. (2003). CPAR: Classification based on predictive association rules, in Proceedings of the Third SIAM International Conference on Data Mining (SDM’03), San Francisco, CA, USA. https://doi.org/10.1137/1.9781611972733.40

Zimmermann, A., Raedt L. D. (2004). CorClass: Correlated Association Rule Mining for Classification, Discovery Science, 7th International Conference, Padova, Italy, 60–72. https://doi.org/10.1007/978-3-540-30214-8_5

Letöltések

Megjelent

2006-10-15

Hogyan kell idézni

Pach, F. P., Gyenesei, A., Németh, S., Árva, P., & Abonyi, J. (2006). A partícionálás hatása fuzzy asszociatív osztályozók teljesítményére. Acta Agraria Kaposváriensis, 10(3), 109-120. https://journal.uni-mate.hu/index.php/aak/article/view/1830

Ugyanannak a szerző(k)nek a legtöbbet olvasott cikkei

<< < 1 2