Nouvel article scientifique sur l’usage de BeepBeep en data mining

Un article scientifique décrivant une extension du moteur de traitement des flux d’événements BeepBeep a été accepté pour publication au 22nd International IEEE EDOC Conference, qui se tiendra à Stockholm, en Suède, du 16 au 19 octobre 2018. L’article a été co-écrit par l’étudiante au doctorat du LIF Massiva Roudjane, en compagnie des professeurs du LIF Raphaël Khoury et Sylvain Hallé ainsi que de leur collègue Djamal Rebaïne. EDOC 2018 est la vingt-deuxième conférence d’une série qui constitue le forum clé pour les chercheurs et les praticiens du domaine de l’informatique d’entreprise.

Le document, intitulé Real-Time Data Mining for Event Streams, montre comment calculer des tendances de différents types sur des journaux en temps réel, à l’aide d’un cadre générique appelé “trend distance workflow”. De nombreux calculs courants sur les flux d’événements s’avèrent des cas particuliers de ce flux de travail, en fonction de la manière dont un petit ensemble de paramètres sont définis. Les résultats expérimentaux présentés dans le document indiquent que les écarts par rapport à une tendance de référence peuvent être détectés en temps réel pour des flux produisant jusqu’à plusieurs milliers d’événements par seconde.

L’extension est disponible sur GitHub sous une licence de logiciel libre à l’adresse: https://github.com/liflab/PatTheMiner. BeepBeep lui-même est également disponible en ligne et contient une documentation complète pour les débutants.

Posté dans Research papers