EBookClubs

Read Books & Download eBooks Full Online

EBookClubs

Read Books & Download eBooks Full Online

Book Contraintes et fouille de donn  es

Download or read book Contraintes et fouille de donn es written by Teddy Turmeaux and published by . This book was released on 2004 with total page 134 pages. Available in PDF, EPUB and Kindle. Book excerpt: La fouille de données est un domaine de recherche actif, visant à découvrir des connaissances implicites dans des bases de données. Nous étudions ici l'intérêt de formalismes issus de la logique du premier ordre pour la fouille de données. En particulier, nous examinons l'intérêt des contraintes, vues comme des formules du premier ordre et interprétées sur un domaine particulier. Un point important de tout formalisme utilisé en ECD est la définition d'une relation de généralité qui permet de structurer l'espace des motifs, et de faciliter ainsi la recherche de motifs intéressants. Nous nous intéressons tout d'abord aux bases de données contraintes qui étendent à la fois les bases de données relationnelles, déductives et spatiales, et qui permettent la définition d'ensembles infinis grâce à la notion de tuples généralisés. Nous étudions ensuite le formalisme des clauses contraintes utilisées en Programmation Logique avec Contraintes. Nous reprenons la définition classique de généralité entre clauses contraintes et nous déterminons dans ce cadre le moindre généralisé, le moindre spécialisé et des opérateurs de raffinement. Nous montrons comment les calculer en pratique sur plusieurs domaines de contraintes spécifiques. Enfin nous introduisons un nouveau motif: les règles caractéristiques. Ces règles sont la combinaison d'un chemin quantifié et d'une contrainte et permettent de capturer la notion de lien entre entités et de contraintes sur ces entités. Nous montrons l'intérêt de telles règles dans le cadre de bases de données géographiques, notamment sur des données géologiques fournies par le Bureau de Recherche Géologique et Minières.

Book Fouille de donn  es par contraintes

Download or read book Fouille de donn es par contraintes written by Abdelhamid Boudane and published by . This book was released on 2018 with total page 0 pages. Available in PDF, EPUB and Kindle. Book excerpt: Dans cette thèse, nous abordons les problèmes bien connus de clustering et de fouille de règles d'association. Notre première contribution introduit un nouveau cadre de clustering, où les objets complexes sont décrits par des formules propositionnelles. Premièrement, nous adaptons les deux fameux algorithmes de clustering, à savoir, le k-means et l'algorithme hiérarchique ascendant, pour traiter ce type d'objets complexes. Deuxièmement, nous introduisons un nouvel algorithme hiérarchique descendant pour le clustering des objets représentés explicitement par des ensembles de modèles. Enfin, nous proposons un encodage basé sur la satisfiabilité propositionnelle du problème de clustering des formules propositionnelles sans avoir besoin d'une représentation explicite de leurs modèles. Dans une seconde contribution, nous proposons une nouvelle approche basée sur la satisfiabilité pour extraire les règles d'association en une seule étape. La tâche est modélisée comme une formule propositionnelle dont les modèles correspondent aux règles à extraire. Pour montrer la flexibilité de notre cadre, nous abordons également d'autres variantes, à savoir, l'extraction des règles d'association fermées, minimales non redondantes, les plus générales et les indirectes. Les expérimentations sur de nombreux jeux de données montrent que sur la majorité des tâches de fouille de règles d'association considérées, notre approche déclarative réalise de meilleures performances que les méthodes spécialisées.

Book Recherche d information

    Book Details:
  • Author : Massih-Reza Amini
  • Publisher : Editions Eyrolles
  • Release : 2013-04-18
  • ISBN : 2212191855
  • Pages : 255 pages

Download or read book Recherche d information written by Massih-Reza Amini and published by Editions Eyrolles. This book was released on 2013-04-18 with total page 255 pages. Available in PDF, EPUB and Kindle. Book excerpt: Le premier ouvrage francophone sur les algorithmes qui sous-tendent les technologies de big data et les moteurs de recherche ! Depuis quelques années, de nouveaux modèles et algorithmes sont mis au point pour traiter des données de plus en plus volumineuses et diverses. Cet ouvrage présente les fondements scientifiques des tâches les plus répandues en recherche d'information (RI), tâches également liées au data mining, au décisionnel et plus généralement à l'exploitation de big data. Il propose un exposé cohérent des algorithmes classiques développés dans ce domaine, abordable à des lecteurs qui cherchent à connaître le mécanisme des outils quotidiens d'Internet. Le lecteur approfondira les concepts d'indexation, de compression, de recherche sur le Web, de classification et de catégorisation, et pourra prolonger cette étude avec les exercices corrigés proposés en fin de chapitre. Ce livre s'adresse tant aux chercheurs et ingénieurs qui travaillent dans le domaine de l'accès à l'information et employés de PME qui utilisent en profondeur les outils du webmarketing, qu'aux étudiants de Licence, Master, doctorants ou en écoles d'ingénieurs, qui souhaitent un ouvrage de référence sur la recherche d'information.

Book Extraction de motifs s  quentiels sous contraintes dans des donn  es contenant des r  p  titions cons  cutives

Download or read book Extraction de motifs s quentiels sous contraintes dans des donn es contenant des r p titions cons cutives written by Marion Leleu (Ingénieur).) and published by . This book was released on 2004 with total page 136 pages. Available in PDF, EPUB and Kindle. Book excerpt: Un axe de recherche typique du data mining, et qui nous concerne dans cette thèse, est la recherche de régularités dans des bases de séquences (e.g., séquences d'achats, de navigation, d'ADN). De nombreux algorithmes ont été proposés pour traiter l'extraction de motifs séquentiels satisfaisant des contraintes variées. Parmi ceux existants, certains exploitent une représentation en mémoire des positions des motifs (listes d'occurences), ce qui permet de réduire les coûts liés aux accès disque lors de l'exécution d'un processus. Cependant, leurs performances peuvent être grandement améliorées lorsque ces données comportent des répétitions consécutives, c'est-à-dire, en quelque sorte, une redondance de certaines informations dans le temps. Par exemple, un client peut acheter plusieurs fois le même article lors d'achats successifs, la même erreur peut se reproduire plusieurs fois d'affilé sur un réseau informatique, ou encore, comme c'est le cas dans notre contexte d'application (traitement de données financières où l'évolution de produits boursiers est représentée par des séquences d'évènements), lorsque les séquences sont construites à partir de données quantitatives discrétisées. Dans cette thèse, nous tentons d'apporter des solutions efficaces au problème de l'extraction, contrainte ou non, de motifs séquentiels, dans le cas de données contenant des répétitions consécutives. Celles-ci s'appuient sur une généralisation des listes d'occurences et proposent de condenser les informations qu'elles contiennent, sans perte pour les extractions. Cette nouvelle représentation a donné lieu aux développements d'extracteurs de motifs séquentiels, GoSpade (traitement de la seule contrainte de fréquence minimum) et GoSpec (traitement de contraintes temporelles), particulièrement bien adaptés à la présence de répétitions consécutives dans les données. Les algorithmes correspondants ont respectivement fait l'objet d'une démonstration de justesse et de complétude afin d'assurer la correction des résultats qu'ils retournent. De plus, il a été montré, par des expérimentations sur des jeux de données réelles et synthétiques, que ces extracteurs présentaient une nette amélioration des performances en présence de répétitions consécutives. Les gains obtenus, en terme d'espace mémoire et de temps d'exécution, permettent de travailler sur des volumes de données plus importants et à des seuils de fréquence plus faibles, dans des temps raisonnables. Enfin, une application dans le domaine des marchés financiers, visant à construire une représentation synthétique de différentes tendances boursières sous forme de motifs séquentiels caractéristiques, a été effectuée. Nous avons pu montrer que des motifs fréquents constituant une tendance contiennent une information qui est bien spécifique de la tendance représentée.

Book Des donn  es aux connaissances

Download or read book Des donn es aux connaissances written by Saïd Jabbour and published by . This book was released on 2018 with total page 87 pages. Available in PDF, EPUB and Kindle. Book excerpt: Ce document présente une synthèse de mes travaux de recherche à la frontière de plusieurs domaines incluant l’Intelligence Artificielle (IA), la fouille de données, les graphes et les systèmes d’information. Ils peuvent être caractérisés par les mots clés suivants : raisonnement par contraintes, représentation des connaissances, modélisation des raisonnements, fouille de motifs sous contraintes, clustering, détection de communautés, compression de données et composition de services web. Nous commençons par un aperçu de nos contributions algorithmiques à la résolution du problème de la satisfiabilité propositionnelle incluant l'apprentissage de clauses, les solveurs SAT parallèle de type portfolio, l'énumération de modèles et d’impliquants premiers et les transformations de contraintes de cardinalité (conditionnelles) sous forme normale conjonctive. La seconde partie aborde la problématique de la fouille de données et du clustering. De nombreuses contributions sont présentées. Ces contributions portent sur les approches déclaratives pour différentes tâches de fouille de données : la fouille des itemsets fréquents et de leurs diverses formes condensées, l’extraction de règles d’association et de ses nombreuses variantes, la fouille de motifs séquentiels, l’énumération des Top-k motifs modulo une relation de préférence, la fouille de motifs sous incertitudes, approches parallèles par décomposition et le clustering symbolique de formules propositionnelles. Pour mettre en lumière les fertilisations croisées entre IA symbolique et fouilles de données nous montrons d’une part comment le concept de symétries largement exploré en SAT/CP est étendu à la fouille des motifs ensemblistes et d’autre part comment la fouille de données peut être exploitée pour compresser des formules booléennes et des contraintes CSP exprimées en extension. La troisième partie traite de nos contributions à la détection de communautés et à la compression de grands graphes en exploitant les contraintes pseudo-booléennes et la logique mathématique. La quatrième partie se focalise sur le raisonnement en présence d’incohérence et à la théorie de l’argumentation. Nous avons proposé différentes méthodes pour la quantification de conflits dans les bases de connaissances et également pour le raisonnement en présence d'incohérence et d'incertitude dans les ontologies. Cette synthèse se termine par nos contributions à la composition des services web, en proposant diverses modélisations en logique propositionnelle.

Book Contribution    la fouille de donn  es

Download or read book Contribution la fouille de donn es written by Olivier Couturier and published by . This book was released on 2005 with total page 136 pages. Available in PDF, EPUB and Kindle. Book excerpt: Au regard du nombre croissant des grandes bases de données, déterminer la façon dont sont organisées les données, les interpréter et en extraire des informations utiles est un problème difficile et ouvert. En effet, à l'heure actuelle, notre capacité à collecter et stocker les données de tout type, outrepasse nos possibilités d'analyse, de synthèse et d'extraction de connaissances dans les données. Notre travail se situe au niveau de la recherche de règles d'association qui constitue une tâche de fouille de données. Cette dernière présente des résultats qui permettent aux experts de facilement interpréter les règles une à une. Les méthodes de génération sont combinatoires et engendrent un nombre élevé de règles qui sont difficilement exploitables. Plusieurs approches de réduction de ce nombre ont été proposées comme l'usage de mesures de qualité, le filtrage syntaxique par contraintes, la compression par les bases représentatives ou génériques. Cependant, ces approches n'intègrent pas l'expert dans le déroulement du processus limitant ainsi l'aspect interactif du processus. En effet, l'expert ne sait pas toujours initialement quelle connaissance il souhaite obtenir. Nous analysons l'activité cognitive de l'expert dans différents processus de recherche de règles d'association et nous montrons que dans ces approches, l'expert n'intervient pas durant les tâches du processus. Pour accroître cette interactivité avec l'expert, il est nécessaire que celui-ci soit au coeur du processus afin de répondre à l'un des objectifs de l'ECD. Nous nous basons sur les systèmes orientés-tâches, qui se focalisent sur les différentes tâches que l'expert doit réaliser, et proposons l'algorithme SHARK qui est une approche hybride basée sur l'utilisation d'une recherche hiérarchique s'appuyant sur une taxinomie d'attributs et d'une approche anthropocentrée de manière à inclure l'expert dans le processus. Nous couplons ainsi la connaissance explicite fournie par l'algorithme et la connaissance tacite de l'expert. L'utilisation d'une interface graphique adaptée s'avère donc nécessaire pour que l'expert puisse interagir de manière optimale avec le processus. L'efficacité de cet algorithme a été montrée sur un problème réel de marketing faisant intervenir des experts du monde bancaire. En outre, la fouille de données visuelle présente un intérêt non négligeable puisque l'esprit humain peut traiter une plus grande quantité d'informations de manière visuelle. Comme des quantités très importantes de règles sont générées, la fouille de données visuelle s'avère être une étape incontournable pour améliorer encore notre approche. Nous présentons un état de l'art des principales techniques de visualisation de règles d'association. Parmi ces représentations, nous nous focalisons sur les représentations de type matrice 3D présentant la particularité de générer des occlusions. Une occlusion est un chevauchement d'objets dans un environnement 3D rendant certains de ces objets pas ou peu visibles. Après avoir défini formellement le problème d'occlusions, nous montrons qu'il s'agit d'un problème d'optimisation qui est de trouver le meilleur ordre possible des itemsets sur les deux axes pour limiter les occlusions. Nous proposons une heuristique permettant de réduire significativement les occlusions générées. Les résultats que nous avons obtenus sont présentés et discutés.

Book Extraction de Connaissances a Partir de Donnees

Download or read book Extraction de Connaissances a Partir de Donnees written by and published by Ed. Techniques Ingénieur. This book was released on with total page 24 pages. Available in PDF, EPUB and Kindle. Book excerpt:

Book D  couverte de motifs n aires utilisant la programmation par contraintes

Download or read book D couverte de motifs n aires utilisant la programmation par contraintes written by Mehdi Khiari and published by . This book was released on 2014 with total page 0 pages. Available in PDF, EPUB and Kindle. Book excerpt: La fouille de données et la Programmation Par Contraintes (PPC) sont deux domaines de l'informatique qui ont eu, jusqu'à très récemment, des destins séparés. Cette thèse est l'une des toutes premières à s'intéresser aux liens entre la fouille de données et la PPC, et notamment aux apports de cette dernière à l'extraction de motifs sous contraintes. Différentes méthodes génériques pour la découverte de motifs locaux ont été proposées. Mais, ces méthodes ne prennent pas en onsidération le fait que l'intérêt d'un motif dépend souvent d'autres motifs. Un tel motif est appelé motif n-aire. Très peu de travaux concernant l'extraction de motifs n-aires ont été menés et les méthodes développées sont toutes ad hoc. Cette thèse propose un cadre unifié pour modéliser et résoudre les contraintes n-aires en fouille de données. Tout d'abord, l'extraction de motifs n-aires est modélisée sous forme de problème de satisfaction de contraintes (CSP). Puis, un langage de requêtes à base de contraintes de haut niveau est proposé. Ce langage permet d'exprimer une large panoplie de contraintes n-aires. Plusieurs méthodes de résolution sont développées et comparées. Les apports principaux de ce cadre sont sa déclarativité et sa généricité. Il s'agit du premier cadre générique et flexible permettant la modélisation et la résolution de contraintes n-aires en fouille de données.

Book Contribution m  thodologique    la fouille de donn  es complexes

Download or read book Contribution m thodologique la fouille de donn es complexes written by Jérémie Clech and published by . This book was released on 2004 with total page 185 pages. Available in PDF, EPUB and Kindle. Book excerpt: Au cours de cette thèse, nous abordons la problématique de l'extraction de connaissances à partir de données complexes. Notre motivation est issue de l'accroissement du besoin de traiter de telles données, du principalement à l'explosion des technologies de l'information véhiculant une forte diffusion de documents complexes. La fouille de données complexes se propose de fournir un modèle d'analyse permettant d'intégrer de larges variétés de données, structurées ou non, locales ou distantes. Le point de vue retenu est de dire que face à une tâche d'extraction des connaissances, l'utilisateur doit être libéré des contraintes liées à l'organisation, le codage, le format, la représentation des données. Il doit accéder au contenu. Nous reprenons les étapes du processus d'extraction de connaissances afin de traiter dans un cadre général ces données fortement hétérogènes. L'aboutissement du processus étant l'exploitation de ces données, nous proposons ici un environnement d'exploration visuelle reposant à la fois sur une représentation globale du corpus, sur une contextualisation d'un individu particulier et sur la visualisation à proprement parlée des documents. En outre, nous adaptons l'architecture des systèmes de recherch d'information à ce type de données. Nous avons proposé un système de recherche basé sur l'exploitation de la contextualisation d'un document et un autre sur un processus de fouille de données dans le but de prendre en compte la perception de l'utilisateur vis à vis de la requête posée en fonction de son jugement face aux documents retournés par le système. Enfin, nous décrivons des applications concrètes liées à l'exploitation de données complexes.

Book La qualit   et la gouvernance des donn  es   au service de la performance des entreprises

Download or read book La qualit et la gouvernance des donn es au service de la performance des entreprises written by BERTI-EQUILLE Laure and published by Lavoisier. This book was released on 2012-09-14 with total page 402 pages. Available in PDF, EPUB and Kindle. Book excerpt: La bonne qualité des données est aujourd'hui la clé de voûte de toute organisation. La gestion et l'amélioration de cette qualité sont des tâches coûteuses et difficiles, mais néanmoins incontournables. Cet ouvrage propose une étude des différents outils et démarches qui assistent les spécialistes de la qualité et de la gouvernance des données. À travers les expériences de la communauté francophone animée par l'association ExQI (Excellence Qualité, Information), il présente, avec pédagogie et pragmatisme, un panorama des concepts-clés de la gestion de la qualité des données et leurs déclinaisons dans les entreprises (Business Intelligence, Data QualityManagement, Key Performance Indicator, Model Driven Engineering, Master Data Management, etc.). Des solutions théoriques et techniques performantes sont détaillées et de nombreux retours d'expérience permettent d'illustrer les bonnes pratiques à adopter. Mêlant contributions industrielles et académiques, cet ouvrage est un outil de référence en langue française sur la qualité et la gouvernance des données en entreprise.

Book Quality Measures in Data Mining

Download or read book Quality Measures in Data Mining written by Fabrice Guillet and published by Springer Science & Business Media. This book was released on 2007-01-08 with total page 319 pages. Available in PDF, EPUB and Kindle. Book excerpt: This book presents recent advances in quality measures in data mining.

Book Extraction des motifs contraints dans des donn  es bruit  es

Download or read book Extraction des motifs contraints dans des donn es bruit es written by Karima Mouhoubi and published by . This book was released on 2013 with total page 188 pages. Available in PDF, EPUB and Kindle. Book excerpt: Nous abordons dans cette thèse le problème difficile de l'extraction de motifs contraints dans des données booléennes bruitées. La fouille de motifs ensemblistes contraints dans des matrices binaires consiste à rechercher des rectanges de 1 dans une matrice de données à valeurs dans {0,1} qui satisfont un ensemble de contraintes (fréquence, aire, etc.). Cependant, dans des applications réelles les données sont souvent bruitées. Un des effets du bruit est de "pulvériser" un motif pertinent en un ensemble de sous-motifs recouvrants et peu pertinents, entraînant une explosion du nombre de résultats. Nous avons proposé dans cette thèse des approches heuristiques originales qui combinent des algorithmes de fouilles de données et des algorithmes de graphes. Ces méthodes sont fondées sur des algorithmes de flot maximal/coupe minimale pour rechercher des sous graphes denses maximaux qui peuvent se recouvrir dans un graphe biparti pondéré et augmenté associé à la matrice des données. Notre dernière contribution consiste en une approche semi-supervisée qui exploite des connaisssances (sur l'une des dimensions ou les deux simultanément) exprimées sous forme de classifications pour guider le processus d'extraction. Cette orientation est assurée par un mécanisme d'adaptation des poids lors de l'extraction itérative des sous graphes denses. Aucune contrainte n'est imposée sur les classifications et peuvent être incomplètes. Pour évaluer la pertinence et exploiter les résultats extraits par nos approches, différents tests ont été réalisés sur des données synthétiques, ainsi que sur des données réelles isssues d'applications bioinformatiques de levure et humaines.

Book Fouilles de donn  es complexes   avanc  es r  centes

Download or read book Fouilles de donn es complexes avanc es r centes written by Omar Boussaïd and published by . This book was released on 2010-02-01 with total page pages. Available in PDF, EPUB and Kindle. Book excerpt: Le nouveau défi de la fouille est de prendre en compte simultanément la totalité des données disponibles sur une entité. Dès lors, une question émerge : comment combiner des informations de nature différente et les rattacher à une même unité sémantique ? De fait les données complexes possèdent des spécificités qui doivent être prises en compte pour proposer des stratégies de data mining efficaces sur des objets correspondant chacun à un ensemble de données de nature différente. Outre le cas classique de descripteurs numériques ou catégoriels, on a notamment le cas de données texte, image ou audio vidéo ; évolutives et distribuées fortement liées à des connaissances externes : la fouille intelligente des données s'appuie sur la prise en compte des connaissances externes, dites du domaine, celle-ci pouvant se faire par le biais d'une ontologie. En 2007, suite au travaux du Groupe de travail Fouille de Données complexes au sein de l'Association Extraction et Gestion des Connaissance dont un des buts est de fédérer des chercheurs en fouille de données confrontés aux limites des approches et des outils classiques, un premier recueil d'articles sur la fouille de données complexes a permis d'aborder des problèmes liés entre autres à la fouille des images ou de textes. Ce premier recueil visait à catalyser les échanges entre les différents chercheurs avec l'objectif : d'identifier et de définir ce qu'est la fouille de données complexes, de recenser les verrous à la fois méthodologiques et technologiques, de proposer des approches et des outils informatiques, d'expérimenter ces résultats dans des domaines comme la santé. Devant le succès de ce premier tome, nous proposons ici une nouvelle réunion de contributions qui devrait permettre de nouveaux croisements entre des chercheurs couvrant des domaines différents de la fouille de données complexes.

Book Fouille de donn  es par extraction de motifs graduels

Download or read book Fouille de donn es par extraction de motifs graduels written by Amal Oudni and published by . This book was released on 2014 with total page 0 pages. Available in PDF, EPUB and Kindle. Book excerpt: Les travaux de cette thèse s'inscrivent dans le cadre de l'extraction de connaissances et de la fouille de données appliquée à des bases de données numériques ou floues afin d'extraire des résumés linguistiques sous la forme de motifs graduels exprimant des corrélations de co-variations des valeurs des attributs, de la forme « plus la température augmente, plus la pression augmente ». Notre objectif est de les contextualiser et de les enrichir en proposant différents types de compléments d'information afin d'augmenter leur qualité et leur apporter une meilleure interprétation. Nous proposons quatre formes de nouveaux motifs : nous avons tout d'abord étudié les motifs dits « renforcés », qui effectuent, dans le cas de données floues, une contextualisation par intégration d'attributs complémentaires, ajoutant des clauses introduites linguistiquement par l'expression « d'autant plus que ». Ils peuvent être illustrés par l'exemple « plus la température diminue, plus le volume de l'air diminue, d'autant plus que sa densité augmente ». Ce renforcement est interprété comme validité accrue des motifs graduels. Nous nous sommes également intéressées à la transposition de la notion de renforcement aux règles d'association classiques en discutant de leurs interprétations possibles et nous montrons leur apport limité. Nous proposons ensuite de traiter le problème des motifs graduels contradictoires rencontré par exemple lors de l'extraction simultanée des deux motifs « plus la température augmente, plus l'humidité augmente » et « plus la température augmente, plus l'humidité diminue ». Pour gérer ces contradictions, nous proposons une définition contrainte du support d'un motif graduel, qui, en particulier, ne dépend pas uniquement du motif considéré, mais aussi de ses contradicteurs potentiels. Nous proposons également deux méthodes d'extraction, respectivement basées sur un filtrage a posteriori et sur l'intégration de la contrainte du nouveau support dans le processus de génération. Nous introduisons également les motifs graduels caractérisés, définis par l'ajout d'une clause linguistiquement introduite par l'expression « surtout si » comme par exemple « plus la température diminue, plus l'humidité diminue, surtout si la température varie dans [0, 10] °C » : la clause additionnelle précise des plages de valeurs sur lesquelles la validité des motifs est accrue. Nous formalisons la qualité de cet enrichissement comme un compromis entre deux contraintes imposées à l'intervalle identifié, portant sur sa taille et sa validité, ainsi qu'une extension tenant compte de la densité des données.Nous proposons une méthode d'extraction automatique basée sur des outils de morphologie mathématique et la définition d'un filtre approprié et transcription.

Book Techniques d optimisation pour la fouille de donn  es

Download or read book Techniques d optimisation pour la fouille de donn es written by Dominique Francisci and published by . This book was released on 2004 with total page 160 pages. Available in PDF, EPUB and Kindle. Book excerpt: Les technologies numériques ont engendré depuis peu, des volumes de données importants, qui peuvent receler des informations utiles. Ceci a donné naissance à l'extraction de connaissances à partir des données qui désigne le processus d'extraction d'informations implicites, précédemment inconnues et potentiellement utiles enfouies dans les données. La fouille de données comprend cinq phases dont la principale est l'extraction de modèles. Nous nous intéressons aux connaisances exprimées sous la forme de règles de dépendance et à la qualité de ces règles. Une règle de dépendance est une implication conditionnelle entre ensembles d'attributs. Les algorithmes standard ont pour but de rechercher les meilleurs modèles. Derrière ces processus se cache en fait une véritable problématique d'optimisation. Nous considérons la recherche des règles de dépendance les plus intéressantes comme étant un problème d'optimisation dans lequel la qualité d'une règle est quantifiée par des mesures. Ainsi, il convient d'étudier les espaces de recherche induits par les mesures ainsi que les algorithmes de recherche dans ces espaces. Il ressort que la plupart des mesures observées présentent des propriétés différentes suivant le jeu de données. Une approche analytique n'est donc pas envisageable dans fixer certains paramères. Nous observons les variations relatives de mesures évaluées simultanément ; certaines d'entre elles sont antagonistes ce qui ne permet pas d'obtenir "la" meilleure règle ; il faut alors considérer un ensemble de compromis satisfaisants. Nous apportons des solutions par le biais des algorithmes génétiques.

Book Besoins informationnels et extraction d information    Vers une conscience artificielle

Download or read book Besoins informationnels et extraction d information Vers une conscience artificielle written by TURENNE Nicolas and published by Lavoisier. This book was released on 2013-02-01 with total page 290 pages. Available in PDF, EPUB and Kindle. Book excerpt: Cet ouvrage réconcilie la philosophie, la biologie, la sociologie et les sciences cognitives grâce à un dénominateur commun, la conscience. Il en présente un aspect particulier, le concept d’auto-motivation de champ d’activité en tant que moteur biologique d’un état de conscience, et dont l’informatique systémique permet de révéler l’existence. Si la conscience est mal définie, un cadre réduit permet d’en donner une définition plus précise, observable malgré toute la complexité psychologique, sociale et technique de l’individu. Ces observations sont de deux natures : une nature d’activité principale et une nature cognitivo-linguistique, modulées par des facteurs de contrôle intrinsèques et extrinsèques. L’argument exposé consiste à présenter un état de conscience relatif à la notion de besoin informationnel instinctif, donc physiologique, et dont les traces porteuses sur les supports physiques (revues, abonnements, etc.) ou numériques (sms, web, etc.), sont analysables par l’extraction de connaissances.

Book Int  gration de connaissances expertes dans le processus de fouille de donn  es pour l extraction d informations pertinentes

Download or read book Int gration de connaissances expertes dans le processus de fouille de donn es pour l extraction d informations pertinentes written by Laurent Brisson and published by . This book was released on 2006 with total page 174 pages. Available in PDF, EPUB and Kindle. Book excerpt: L’extraction automatique de connaissances à partir des données peut être considérée comme la découverte d’informations enfouies dans de très grands volumes de données. Les approches actuelles, pour évaluer la pertinence des informations extraites, se distinguent en deux catégories : les approches objectives qui mettent en œuvre des mesures d’intérêt afin d’évaluer les propriétés statistiques des modèles extraits et les approches subjectives qui confrontent les modèles extraits à des connaissances exprimées sur le domaine et nécessitent généralement l’interrogation d’experts. Toutefois, le choix de modèles pertinents en regard de la connaissance métier d’un expert reste un problème ouvert et l’absence de formalisme dans l’expression des connaissances nuit à la mise au point de techniques automatiques de confrontation des modèles permettant d’exploiter toute la richesse sémantique des connaissances expertes. L’approche KEOPS que nous proposons dans ce mémoire répond à cette problématique en proposant une méthodologie qui intègre les connaissances des experts d’un domaine tout au long du processus de fouille. Un système d’information dirigé par une ontologie (ODID) joue un rôle central dans le système KEOPS en permettant d’organiser rationnellement non seulement la préparation des données mais aussi la sélection et l’interprétation des modèles générés. Une mesure d’intérêt est proposée afin de prendre en compte les centres d’intérêt et le niveau de connaissance des experts. Le choix des modèles les plus pertinents se base sur une évaluation à la fois objective pour évaluer la précision des motifs et subjective pour évaluer l’intérêt des modèles pour les experts du domaine. Enfin, l’approche KEOPS facilite la définition de stratégies pour améliorer le processus de fouille de données dans le temps en fonction des résultats observés. Les différents apports de l’approche KEOPS favorisent l’automatisation du processus de fouille de données dans le temps en fonction des résultats observés. Les différents apports de l’approche KEOPS favorisent l’automatisation du processus de fouille de données, et ainsi, une dynamique d’apprentissage peut être initiée pour obtenir un processus de fouille particulièrement bien adapté au domaine étudié. KEOPS a été mise en œuvre dans le cadre de l’étude de la gestion des relations avec les allocataires au sein des Caisses d’Allocations Familiales. L’objectif de cette étude a été d’analyser la relation de service rendu aux allocataires afin de fournir aux décideurs des connaissances précises, pertinentes et utilises pour l’amélioration de ce service.