29 research outputs found
Classication en présence d'outliers (données aberrantes) avec RMixmod (package de classication par modèles de mélanges)
International audienceLes modèles de mélanges offrent un cadre probabiliste flexible et efficace pour traiter des problématiques de classification supervisée ou non supervisée. L'objectif du projet MIXMOD est de diffuser un ensemble logiciel de classification des données par modèles de mélanges à un large spectre d'utilisateurs via plusieurs composants logiciels. La bibliothèque de calcul mixmodLib (C++) en est la pierre angulaire, résultat d'un travail de 15 ans sur la robustesse et la rapidité de calcul. Le package RMixmod, ensemble de fonctions pour R, interfacé avec mixmodLib (grâce à RCPP) est devenu un outil de référence pour la classidication des données. Intégrant de nombreuses fonctionnalités (algorithmes de type EM, critères de sélection, modèles parcimonieux, stratégies d'initialisation, ...), cet ensemble logiciel permet de traiter des données quantitatives, qualitatives et mixtes, y compris dans des situations complexes. Lorsque le jeu de données contient des individus parasites (c'est-à-dire ayant des valeurs aberrantes, encore appelés outliers) la classification devient alors particulièrement difficile (trouver le bon nombre de classes, affecter le bon label aux vrais individus, ...). Comment traiter un jeu de données avec des outliers ? En présence d'outliers, il peut être tentant d'appliquer un pré-traitement pour nettoyer le jeu de données avant de le soumettre à un logiciel de classification. Mais ces méthodes sont généralement peu ecaces. A l'opposé, on peut considérer que la classification doit s'effectuer sur l'ensemble des individus avec une classe supplémentaire (celle des outliers)
Etude de la robustesse de RMixmod (package de classification par modèles de mélanges) en cas de chevauchement de classes
International audienceLes modèles de mélanges offrent un cadre probabiliste flexible et efficace pour traiter des problématiques de classification supervisée ou non supervisée.L'objectif du projet MIXMOD est de diffuser un ensemble logiciel de classification des données par modèles de mélanges à un large spectre d'utilisateurs via plusieurs composants logiciels. La bibliothèque de calcul mixmodLib (C++) en est la pierre angulaire, résultat d'un travail de près de 15 ans sur la robustesse et la rapidité de calcul. Le package RMixmod, ensemble de fonctions pour R, interfacé avec mixmodLib (grâce à RCPP) est devenu un outil de référence pour la classification des données.Intégrant de nombreuses fonctionnalités (algorithmes de type EM, critères de sélection, modèles parcimonieux, stratégies d'initialisation, ...), cet ensemblelogiciel permet de traiter des données quantitatives, qualitatives et mixtes, y compris dans des situation complexes.L'une des difficultés en classification des données réside dans la capacité à donner des bons résultats en cas de chevauchement entre plusieurs classes : trouver le bon nombre de classes, les bons paramètres et les bonnes affectations des individus à ces classes (labels).L'étude consiste à tester RMixmod sur des jeux de données simulées en contrôlant le degré de chevauchement entre les classes (grâce au package MixSim) sur des données quantitatives
Mixmod - Développement, diffusion, valorisation d’un ensemble logiciel de classification de données quantitatives et qualitatives par modèles de mélanges
International audienceClassification des donnéesMixmod et les modèles de mélnagesComment est développé Mixmod
Le logiciel MIXMOD d'analyse de mélange pour la classification et l'analyse discriminante
National audienceLe logiciel mixmod est dévolu à l'analyse de mélanges de lois de probabilité sur des données multidimensionnelles dans un but d'estimation de densité, de classification ou d'analyse discriminante. Il propose un choix important d'algorithmes pour estimer les paramètres d'un mélange (EM, Classification EM, Stochastic EM). Il est possible de combiner ces algorithmes de multiples façons pour obtenir un maximum local pertinent de la vraisemblance ou de la vraisemblance complétée d'un modèle. Pour des variables quantitatives, mixmod utilise des mélanges de lois normales multidimensionnelles. Il propose ainsi quatorze modèles gaussiens différents selon des hypothèses faites sur les éléments spectraux des matrices de variance des composants. Pour des variables qualitatives, mixmod utilise des mélanges de lois multinomiales multidimensionnelles sous une hypothèse d'indépendance conditionnelle des variables sachant le composant du mélange. Grâce à une reparamétrisation des probabilités multinomiales, il propose cinq modélisations différentes. Par ailleurs, différents critères d'information sont proposés pour choisir un modèle parcimonieux et permettent notamment de choisir un nombre de composants pertinents. L'emploi de l'un ou l'autre de ces critères dépend de l'objectif poursuivi (estimation de densité, classification supervisée ou non). Écrit en C++, mixmod possède des interfaces avec Scilab et Matlab. Le logiciel, sa documentation statistique et son guide d'utilisation sont disponibles à l'adresse suivante : http://www-math.univ-fcomte.fr/mixmod/index.php
Peut-on vraiment calculer avec un ordinateur ?
Séminaire IREM de Franche-ComtéArithmétique flottante : comprendre les enjeux et les causes, proposer des solution
Outils de génération de documentation
International audience1. Introduction2. Comment ça marche ?- Sur quels types de fichiers ?- Pour quelles sorties ?3. Un exemple détaillé : Doxygen- Fiche d’identité- Balises- Exemples- Diagrammes et graphes- Personnalisation des sorties4. Pour aller plus loin ..
MIXMOD : Un ensemble logiciel de classification des données par modèles de mélange
National audienceQu'est-ce que la classification des données ?Avantages (et limites) de l'approche par modèles de mélangesPrésentation de MIXMOD, ensemble logiciel de classification par modèles de mélangesIllustration
MIXMOD, un ensemble logiciel.Pour quelles utilisations et quels utilisateurs ?
International audience1. MIXMOD- Fiche d’identité, fonctionnalités- Illustration2. Développement, diffusion de logiciels- Prototype ou logiciel ?- Génie logiciel- Diffuser : oui mais pour qui ?- Valorisation3. Développement, diffusion de MIXMOD- Quelques outils de génie logiciel utilisés- Des composants logiciels comme vecteur de diffusion- Utilisations de MIXMOD- Valorisation et promotion4. Perspective
Arithmétique sur ordinateur: Calculer juste ou juste calculer ?
National audienceIntroducation à l'arithmétique flottante : enjeux, comprendre les causes et proposer des solution
MixmodLogiciel de classification supervisée et non superviséeVu du côté utilisateurs et développeurs
International audience1.Comment est développé Mixmod ?2 .Principales fonctionnalités3. Comment utiliser Mixmod ?- La situation actuelle (avant Mixmod 3.0)- Les nouveautés et les perspectives- Roadma
