Élelmiszer adatbázis szűrése mennyiségi megszorítások alapján logaritmikus indexeléssel
Kulcsszavak:
bitmap, indexelés, egészségügyi profil, IMEE algoritmusAbsztrakt
Ebben a cikkben az IMEE (Index Maszkos Ehetem-E) algoritmust ismertetjük. Az algoritmust az eFilter projekt keretében fejlesztettük ki. A projekt célkitűzése egy olyan informatikai rendszer felállítása, amely egészségügyi adatok alapján szűri az élelmiszerek listáját. Az új algoritmus feladata eldönteni, hogy a felhasználó egy adott élelmiszert megehet-e, vagy sem. Ehhez ismerni kell a felhasználó étkezésre vonatkozó egészségügyi profilját. A profil megszorításokat tartalmaz, ezek alapján kell egy potenciálisan nagy élelmiszer adatbázisból szűrni a megehető tételeket. A cikkben közölt első algoritmus a természetes megközelítésből adódik. Ennek gyorsítására egy indexelési módszert írtunk le, amely a bitmap indexelési technika használatát teszi lehetővé. Bitmap indexet akkor érdemes használni, ha sok rekord van és az indexelt tulajdonság csak kevés értéket vehet fel. A javasolt módszer a megszorításokat alakítja át indexé, úgy, hogy csak minden a logaritmikus skálán lévő értéknél kisebb vagy egyenlő összetevő tartalmú étel lesz indexelve. Sajnos így egy megszorításnál csak megengedőbb vagy szigorúbb feltétel vizsgálható. Az általános alakú N < összetevő tartalom ≤ M megszorításhoz tartozó szigorúbb megszorítás 2^padlás(log2(N)) < összetevő tartalom ≤ 2^padló(log2(M)) tartozik, amit a legnagyobb tartalmazott megszorításnak nevezünk. Az IMEE algoritmusminden ugyanarra az összetevőre vonatkozó megszorítást összevon egy megszorítássá, majd ezekhez kiszámítja a legnagyobb tartalmazott megszorítást. Végül visszaadja azokat az élelmiszereket, amelyek minden megszorításnak eleget tesznek.
Hivatkozások
Chan, C.-Y., Ioannidis, Y. E. (1998): Bitmap index design and evaluation. Proceedings of the SIGMOD ’98 International Conference on Management of Data, 355–366. p. https://doi.org/10.1145/276304.276336
Kusper, G., Radványi, T. (2007): Az EGERFOOD élelmiszerbiztonsági tudásközpont projekt információs rendszerének kialakítása. Networkshop 2007 konferencia, Eger, 8 p.
Kusper, G., Radványi, T. (2008): Az EGERFOOD élelmiszerbiztonsági nyomkövető rendszer – Hogyan modellezzük a cégek munkafolyamatait. Networkshop 2008 konferencia, Dunaújváros, 8 p.
Liptai, K., Kusper, G., Radványi, T. (2007): Cryptographycal protocols in the Egerfood Information System. Annales Mathematicae et Informaticae, 34. 61–70.
Radványi, T. (2004): Examination of the MSSQL server from the user's point view considering data insertion. Acta Academiae Pedagogicae Agriensis, 69–77.
Radványi, T., Kusper, G. (2007): Requirement analysis and a database model for the project EGERFOOD Food Safety Knowledge Center. Invited talk. Proceedings of ICAI-2007, 1. 15–23. p.
Radványi, T., Kusper, G., Kovács, E. (2008a): Adatforgalom és mobilkommunikáció az Egerfood rendszerben. AgriaMédia 2008 konferencia, Kötet I. 100–107. p.
Radványi, T., Kusper, G., Kovács, E. (2008b): Kommunikáció az EGERFOOD élelmiszerbiztonsági projekt információs rendszerében. IF2008 konferencia, CD- kiadvány, ISBN 978-963-473-129-0, 10 p.
Spiegler, I., Maayan, R. (1985): Storage and retrieval considerations of binary data bases. Information Processing and Management: an International Journal, 21(3), 233–254. https://doi.org/10.1016/0306-4573(85)90108-6
Wu, K., Otoo, E. J., Shoshani, A. (2006): Optimizing bitmap indices with efficient compression. ACM Transactions on Database Systems, 31(1), 1–38. https://doi.org/10.1145/1132863.1132864
Letöltések
Megjelent
Folyóirat szám
Rovat
License
Copyright (c) 2011 Kusper Gábor, Márien Szabolcs

This work is licensed under a Creative Commons Attribution-NonCommercial-NoDerivatives 4.0 International License.
