Feature selection in high-dimensional dataset using MapReduce

Reggiani, Claudio; Le Borgne, Yann-Aël; Bontempi, Gianluca

doi:doi/10.1007/978-3-319-76892-2_8

Recherche avancée | Historique de recherche Mon DI-fusion | À propos de DI-fusion | Contact |

Citer

Feature selection in high-dimensional dataset using MapReduce

par Reggiani, Claudio

;Le Borgne, Yann-Aël

;Bontempi, Gianluca

Référence Communications in computer and information science, 823, page (101-115)
Publication Publié, 2018

Article révisé par les pairs

Résumé :

This paper describes a distributed MapReduce implementation of the minimum Redundancy Maximum Relevance algorithm, a popular feature selection method in bioinformatics and network inference problems. The proposed approach handles both tall/narrow and wide/short datasets. We further provide an open source implementation based on Hadoop/Spark, and illustrate its scalability on datasets involving millions of observations or features.

Documents en relation

DI-fusion

Assessment of catastrophic forgetting in continual credit card fraud detection
par Lebichot, Bertrand , Siblini, Wissam , Paldino, Gian Marco , Le Borgne, Yann-Aël , Oblé, Frédéric , Bontempi, Gianluca
Publication 2024-01-01
The role of diversity and ensemble learning in credit card fraud detection
par Paldino, Gian Marco , Lebichot, Bertrand , Le Borgne, Yann-Aël , Siblini, Wissam , Oblé, Frédéric , Boracchi, Giacomo , Bontempi, Gianluca
Publication 2024-03-01
Towards fair machine learning using many-objective feature selection
par Njoku, Uchechukwu U.F. , Abelló, Alberto , Bilalli, Besim , Bontempi, Gianluca
Publication 2025-09
Assessing adversarial attacks in real-world fraud detection
par Lunghi, Daniele , Simitsis, Alkis , Bontempi, Gianluca
Publication 2024-10-01
Improved Algorithms for Ascending Isogeny Volcanoes, and Applications
par Galbraith, Steven S.D. , Gilchrist, Valerie , Robert, Damiens
Publication 2026-01-01

Référencement	Visibilité	Pérennité	Facilité
Les publications encodées constituent la bibliographie académique de l'Université.	Les documents déposés sont indexés par les moteurs de recherche (Google Scholar,…).	Les documents déposés en open-access sont archivés au sein du réseau de préservation SAFE-PLN (www.safepln.org).	Les listes de publications sont compatibles avec le CV-ULB, le FNRS et accessibles sur le web.