EBookClubs

Read Books & Download eBooks Full Online

EBookClubs

Read Books & Download eBooks Full Online

Book Recherche d une repr  sentation des donn  es efficace pour la fouille des grandes bases de donn  es

Download or read book Recherche d une repr sentation des donn es efficace pour la fouille des grandes bases de donn es written by Marc Boullé and published by . This book was released on 2007 with total page 311 pages. Available in PDF, EPUB and Kindle. Book excerpt: The data preparation step of of the data mining process represents 80% of the problem and is both time consuming and critical for the quality of the modeling. In this thesis, our purpose is to design an evaluation criterion of data representations, in order to automate data preparation. To overcome this problem, we introduce a non parametric family of density estimation models, named data grid models. Each variable is partitioned in intervals or in groups of values according to whether it is numerical or categorical, and the whole data space is partitioned into a grid of cells resulting from the cross-product of the univariate partitions. When then consider density estimation models where the density is assumed constant per data grid cell. Because of their high expressiveness, data grid models are hard to regularize and to optimize. We exploit a model selection technique based on a bayesian approach and obtain an exact analytic criterion for the posterior probability of data grid models. We introduce combinatorial optimization algorithms which leverage the properties of our evaluation criterion and the sparseness of data in large dimension. These algorithms have a guaranteed algorithmic complexity, which is super-linear with the sample size. We evaluate data grid models in numerous tasks of data analysis, for supervised classification, regression, clustering or coclustering. The results demonstrate the validity of the approach, that allows to automatically and efficiently detect fine-grained and reliable information useful for the data preparation step.

Book Evaluation de la qualit   de la repr  sentation en fouille de donn  es

Download or read book Evaluation de la qualit de la repr sentation en fouille de donn es written by Fabrice Muhlenbach and published by . This book was released on 2002 with total page 171 pages. Available in PDF, EPUB and Kindle. Book excerpt: L'extraction de connaissances à partir de données (ECD) cherche à produire de nouvelles connaissances utilisables en tirant parti des grandes bases de données. Avant de procéder à la phase de fouille de données, étapes phare de l'ECD, pour pouvoir opérer un apprentissage automatique, un ensemble de questions et de problèmes se posent : comment avoir a priori une idée de la manière dont les étiquettes de la variable à apprendre peuvent être séparées en fonction des variables prédictives ? comment traiter les bases pour lesquelles nous savons que des étiquettes sont fausses ? comment transformer des variables prédictives continues en variables discrètes en tenant compte globalement des informations de la variable à prédire ? Nous proposons diverses réponses à ces problèmes. Ces solutions exploitent les propriétés d'outils géométriques : les graphes de voisinage. Le voisinage entre des individus projetés dans un espace à p dimensions nous fournit un moyen de caractériser la ressemblance entre les exemples à apprendre. A partir de ceci, nous élaborons un test statistique basé sur le poids des arêtes qu'il faut retirer dans un graphe de voisinage pour n'avoir que des sous-graphes d'une seul étiquette, ce qui nous informe de la séparabilité a priori des classes. Nous prolongeons ces réflexions dans le cadre de la détection d'individus dont l'étiquette est douteuse : nous proposons une stratégie de suppression et de réétiquetage d'exemples douteux dans l'échantillon d'apprentissage afin d'augmenter la qualité des modèles prédictifs exploitant cet échantillon de données. Ces travaux sont étendus au cas particulier où la variable à prédire est numérique : nous présentons un test de structure pour la prédiction d'une telle variable. Enfin, nous présenton une méthode de discrétisation supervisée polythétique qui repose sur les graphes de voisinage et montrons ses performances en l'employant avec une méthode d'apprentissage supervisé que nous avons développée.

Book Contribution    la fouille de donn  es

Download or read book Contribution la fouille de donn es written by Olivier Couturier and published by . This book was released on 2005 with total page 136 pages. Available in PDF, EPUB and Kindle. Book excerpt: Au regard du nombre croissant des grandes bases de données, déterminer la façon dont sont organisées les données, les interpréter et en extraire des informations utiles est un problème difficile et ouvert. En effet, à l'heure actuelle, notre capacité à collecter et stocker les données de tout type, outrepasse nos possibilités d'analyse, de synthèse et d'extraction de connaissances dans les données. Notre travail se situe au niveau de la recherche de règles d'association qui constitue une tâche de fouille de données. Cette dernière présente des résultats qui permettent aux experts de facilement interpréter les règles une à une. Les méthodes de génération sont combinatoires et engendrent un nombre élevé de règles qui sont difficilement exploitables. Plusieurs approches de réduction de ce nombre ont été proposées comme l'usage de mesures de qualité, le filtrage syntaxique par contraintes, la compression par les bases représentatives ou génériques. Cependant, ces approches n'intègrent pas l'expert dans le déroulement du processus limitant ainsi l'aspect interactif du processus. En effet, l'expert ne sait pas toujours initialement quelle connaissance il souhaite obtenir. Nous analysons l'activité cognitive de l'expert dans différents processus de recherche de règles d'association et nous montrons que dans ces approches, l'expert n'intervient pas durant les tâches du processus. Pour accroître cette interactivité avec l'expert, il est nécessaire que celui-ci soit au coeur du processus afin de répondre à l'un des objectifs de l'ECD. Nous nous basons sur les systèmes orientés-tâches, qui se focalisent sur les différentes tâches que l'expert doit réaliser, et proposons l'algorithme SHARK qui est une approche hybride basée sur l'utilisation d'une recherche hiérarchique s'appuyant sur une taxinomie d'attributs et d'une approche anthropocentrée de manière à inclure l'expert dans le processus. Nous couplons ainsi la connaissance explicite fournie par l'algorithme et la connaissance tacite de l'expert. L'utilisation d'une interface graphique adaptée s'avère donc nécessaire pour que l'expert puisse interagir de manière optimale avec le processus. L'efficacité de cet algorithme a été montrée sur un problème réel de marketing faisant intervenir des experts du monde bancaire. En outre, la fouille de données visuelle présente un intérêt non négligeable puisque l'esprit humain peut traiter une plus grande quantité d'informations de manière visuelle. Comme des quantités très importantes de règles sont générées, la fouille de données visuelle s'avère être une étape incontournable pour améliorer encore notre approche. Nous présentons un état de l'art des principales techniques de visualisation de règles d'association. Parmi ces représentations, nous nous focalisons sur les représentations de type matrice 3D présentant la particularité de générer des occlusions. Une occlusion est un chevauchement d'objets dans un environnement 3D rendant certains de ces objets pas ou peu visibles. Après avoir défini formellement le problème d'occlusions, nous montrons qu'il s'agit d'un problème d'optimisation qui est de trouver le meilleur ordre possible des itemsets sur les deux axes pour limiter les occlusions. Nous proposons une heuristique permettant de réduire significativement les occlusions générées. Les résultats que nous avons obtenus sont présentés et discutés.

Book SQL

Download or read book SQL written by Frédéric Brouard and published by Pearson Education France. This book was released on 2008 with total page 258 pages. Available in PDF, EPUB and Kindle. Book excerpt: Manuel destiné aux étudiants des premier et second cycles universitaires et aux professionnels de la gestion de bases de données. En neuf chapitres accompagnés d'exercices de révision avec corrigé: Bases de données et SQL; Définition des données; Création des objets; Recherche de l'information dans une table; Extraction multitabulaire; Mise à jour des données; Transactions et SQL procédural; Sécurité; Informations de schéma. Les principales modifications apportées à cette deuxième édition de l'ouvrage sont: l'ajout des règles de Codd; le report des exercices sur le CD-ROM, le livre imprimé ne contenant que la théorie. [SDM].

Book Techniques de fouille de donn  es

Download or read book Techniques de fouille de donn es written by Aouiche-K and published by Omn.Univ.Europ.. This book was released on 2018-02-28 with total page 268 pages. Available in PDF, EPUB and Kindle. Book excerpt: Avec le d veloppement des bases de donn es en g n ral et des entrep ts de donn es en particulier, il est devenu tr s important de r duire les t ches d'administration des syst mes de gestion de base de donn es. Les syst mes auto-administratifs ont pour objectif de s'administrer et de s'adapter eux-m mes, automatiquement, sans perte ou m me avec un gain de performance. L'id e d'utiliser des techniques de fouille de donn es pour extraire des connaissances utiles partir des donn es stock es pour leur administration est une approche tr s prometteuse, notamment dans le domaine des entrep ts de donn es, o les requ tes sont tr s h t rog nes et ne peuvent pas tre interpr t es facilement. L'objectif de cette th se est d' tudier les techniques d'auto-administration des entrep ts de donn es, principalement des techniques d'optimisation des performances, comme l'indexation et la mat rialisation de vues, et de rechercher une mani re d'extraire des donn es elles-m mes des connaissances utilisables pour appliquer ces techniques.

Book Fouille de Donn  es Pour la D  rivation de Bases de R  gles D Association

Download or read book Fouille de Donn es Pour la D rivation de Bases de R gles D Association written by Tarek Hamrouni and published by Omniscriptum. This book was released on 2011-05 with total page 124 pages. Available in PDF, EPUB and Kindle. Book excerpt: Les quantit s de donn es collect es, dans divers domaines d'application de l'informatique, ont suscit le besoin d'analyse et d'interpr tation. Dans ce cadre, la fouille de donn es est un domaine qui offre des solutions int ressantes. Ce m moire s'int resse l'extraction de r gles d'association, une des techniques les plus utilis es dans la fouille de donn es. Dans ce cadre, nous proposons un nouvel algorithme appel Prince pour la g n ration de bases g n riques de r gles d'association. Cet algorithme effectue une exploration par niveau de l'espace de recherche. Sa principale originalit est qu'il est le seul construire la relation d'ordre partiel dans l'objectif d'extraire les bases g n riques de r gles. Pour r duire le co t de cette construction, la relation d'ordre est maintenue entre l'ensemble des g n rateurs minimaux des itemsets ferm s fr quents et non plus entre les itemsets ferm s fr quents. Une structure, appel e treillis des g n rateurs minimaux, est alors construite partir de laquelle la d rivation des bases g n riques devient imm diate. Les exp rimentations r alis es sur diff rents contextes ont montr l'efficacit de l'approche propos e.

Book Contraintes et fouille de donn  es

Download or read book Contraintes et fouille de donn es written by Teddy Turmeaux and published by . This book was released on 2004 with total page 134 pages. Available in PDF, EPUB and Kindle. Book excerpt: La fouille de données est un domaine de recherche actif, visant à découvrir des connaissances implicites dans des bases de données. Nous étudions ici l'intérêt de formalismes issus de la logique du premier ordre pour la fouille de données. En particulier, nous examinons l'intérêt des contraintes, vues comme des formules du premier ordre et interprétées sur un domaine particulier. Un point important de tout formalisme utilisé en ECD est la définition d'une relation de généralité qui permet de structurer l'espace des motifs, et de faciliter ainsi la recherche de motifs intéressants. Nous nous intéressons tout d'abord aux bases de données contraintes qui étendent à la fois les bases de données relationnelles, déductives et spatiales, et qui permettent la définition d'ensembles infinis grâce à la notion de tuples généralisés. Nous étudions ensuite le formalisme des clauses contraintes utilisées en Programmation Logique avec Contraintes. Nous reprenons la définition classique de généralité entre clauses contraintes et nous déterminons dans ce cadre le moindre généralisé, le moindre spécialisé et des opérateurs de raffinement. Nous montrons comment les calculer en pratique sur plusieurs domaines de contraintes spécifiques. Enfin nous introduisons un nouveau motif: les règles caractéristiques. Ces règles sont la combinaison d'un chemin quantifié et d'une contrainte et permettent de capturer la notion de lien entre entités et de contraintes sur ces entités. Nous montrons l'intérêt de telles règles dans le cadre de bases de données géographiques, notamment sur des données géologiques fournies par le Bureau de Recherche Géologique et Minières.

Book Recherche de motifs fr  quents pour l extraction de r  gles d association et de caract  risation

Download or read book Recherche de motifs fr quents pour l extraction de r gles d association et de caract risation written by Ansaf Salleb and published by . This book was released on 2003 with total page 195 pages. Available in PDF, EPUB and Kindle. Book excerpt: La fouille de données est un domaine de recherche en plein essor visant à extraire des connaissances à partir de grandes quantités de données. Dans cette thèse, nous nous intéressons à l'extraction de motifs fréquents dans les bases de données. Cette étape à la fois importante et coûteuse, est commune à plusieurs tâches de fouille de données. Parmi celles-ci, nous avons étudié la recherche de règles d'association et la recherche de règles de caractérisation, fondées l'une comme l'autre sur la recherche de motifs fréquents. D'une part, nous nous sommes intéressés à l'extraction de motifs fréquents dans des bases dites transactionnelles. Ces bases se présentent comme des multi-ensembles de transactions, où chaque transaction est constituée d'un ensemble d'items, appelé itemset. Nous proposons dans ce cadre une approche booléenne pour la recherche des itemsets fréquents. L'idée est de représenter une base de transactions par une fonction à variables booléennes et à valeurs entières. L'étude menée a non seulement montré l'efficacité de l'approche pour représenter et charger les bases de transactions denses en mémoire, mais aussi l'intérêt de l'utilisation de ce format condensé pour l'extraction des itemsets fréquents maximaux. D'autre part, l'extraction des motifs fréquents dans des bases de données représentant des objets et leurs relations, comme par exemple les bases de données relationnelles et géographiques, est un problème non trivial, étant donné la complexité de l'espace de recherche. Ceci nous a poussé à orienter nos recherches vers d'autres types de règles plus ciblées telles que les règles de caractérisation. Nous proposons un cadre général pour la caractérisation d'un ensemble d'objets, appelé ensemble 'cible', en nous basant non seulement sur leurs propriétés propres mais aussi sur les propriétés de tous les objets qui leur sont liés directement ou indirectement.

Book Adaptive Stream Mining

Download or read book Adaptive Stream Mining written by Albert Bifet and published by IOS Press. This book was released on 2010 with total page 224 pages. Available in PDF, EPUB and Kindle. Book excerpt: This book is a significant contribution to the subject of mining time-changing data streams and addresses the design of learning algorithms for this purpose. It introduces new contributions on several different aspects of the problem, identifying research opportunities and increasing the scope for applications. It also includes an in-depth study of stream mining and a theoretical analysis of proposed methods and algorithms. The first section is concerned with the use of an adaptive sliding window algorithm (ADWIN). Since this has rigorous performance guarantees, using it in place of counters or accumulators, it offers the possibility of extending such guarantees to learning and mining algorithms not initially designed for drifting data. Testing with several methods, including Naïve Bayes, clustering, decision trees and ensemble methods, is discussed as well. The second part of the book describes a formal study of connected acyclic graphs, or 'trees', from the point of view of closure-based mining, presenting efficient algorithms for subtree testing and for mining ordered and unordered frequent closed trees. Lastly, a general methodology to identify closed patterns in a data stream is outlined. This is applied to develop an incremental method, a sliding-window based method, and a method that mines closed trees adaptively from data streams. These are used to introduce classification methods for tree data streams.

Book Terra 2008

    Book Details:
  • Author : Leslie Rainer
  • Publisher : Getty Publications
  • Release : 2011-06-14
  • ISBN : 1606060430
  • Pages : 438 pages

Download or read book Terra 2008 written by Leslie Rainer and published by Getty Publications. This book was released on 2011-06-14 with total page 438 pages. Available in PDF, EPUB and Kindle. Book excerpt: Earthen architecture constitutes one of the most diverse forms of cultural heritage and one of the most challenging to preserve. It dates from all periods and is found on all continents but is particularly prevalent in Africa, where it has been a building tradition for centuries. Sites range from ancestral cities in Mali to the palaces of Abomey in Benin, from monuments and mosques in Iran and Buddhist temples on the Silk Road to Spanish missions in California. This volume's sixty-four papers address such themes as earthen architecture in Mali, the conservation of living sites, local knowledge systems and intangible aspects, seismic and other natural forces, the conservation and management of archaeological sites, research advances, and training.

Book Get Out the Vote

    Book Details:
  • Author : Donald P. Green
  • Publisher : Brookings Institution Press
  • Release : 2008-09-01
  • ISBN : 081573266X
  • Pages : 239 pages

Download or read book Get Out the Vote written by Donald P. Green and published by Brookings Institution Press. This book was released on 2008-09-01 with total page 239 pages. Available in PDF, EPUB and Kindle. Book excerpt: The first edition of Get Out the Vote! broke ground by introducing a new scientific approach to the challenge of voter mobilization and profoundly influenced how campaigns operate. In this expanded and updated edition, the authors incorporate data from more than one hundred new studies, which shed new light on the cost-effectiveness and efficiency of various campaign tactics, including door-to-door canvassing, e-mail, direct mail, and telephone calls. Two new chapters focus on the effectiveness of mass media campaigns and events such as candidate forums and Election Day festivals. Available in time for the core of the 2008 presidential campaign, this practical guide on voter mobilization is sure to be an important resource for consultants, candidates, and grassroots organizations. Praise for the first edition: "Donald P. Green and Alan S. Gerber have studied turnout for years. Their findings, based on dozens of controlled experiments done as part of actual campaigns, are summarized in a slim and readable new book called Get Out the Vote!, which is bound to become a bible for politicians and activists of all stripes." —Alan B. Kreuger, in the New York Times "Get Out the Vote! shatters conventional wisdom about GOTV." —Hal Malchow in Campaigns & Elections "Green and Gerber's recent book represents important innovations in the study of turnout."—Political Science Review "Green and Gerber have provided a valuable resource for grassroots campaigns across the spectrum."—National Journal

Book The Victory Lab

Download or read book The Victory Lab written by Sasha Issenberg and published by Crown. This book was released on 2013-09-17 with total page 402 pages. Available in PDF, EPUB and Kindle. Book excerpt: UPDATED FOR THE 2016 ELECTION The book Politico calls “Moneyball for politics” shows how cutting-edge social science and analytics are reshaping the modern political campaign. Renegade thinkers are crashing the gates of a venerable American institution, shoving aside its so-called wise men and replacing them with a radical new data-driven order. We’ve seen it in sports, and now in The Victory Lab, journalist Sasha Issenberg tells the hidden story of the analytical revolution upending the way political campaigns are run in the 21st century. The Victory Lab follows the academics and maverick operatives rocking the war room and re-engineering a high-stakes industry previously run on little more than gut instinct and outdated assumptions. Armed with research from behavioural psychology and randomized experiments that treat voters as unwitting guinea pigs, the smartest campaigns now believe they know who you will vote for even before you do. Issenberg tracks these fascinating techniques—which include cutting edge persuasion experiments, innovative ways to mobilize voters, heavily researched electioneering methods—and shows how our most important figures, such as Barack Obama and Mitt Romney, are putting them to use with surprising skill and alacrity. Provocative, clear-eyed and energetically reported, The Victory Lab offers iconoclastic insights into political marketing, human decision-making, and the increasing power of analytics.

Book Water   Heritage

Download or read book Water Heritage written by Willem Willems and published by . This book was released on 2017-01-15 with total page 434 pages. Available in PDF, EPUB and Kindle. Book excerpt: Water is vital for life, and its availability has been a concern for mankind throughout the ages. Its presence has always been ascertained in a variety of ways and the development of human society everywhere is connected with various forms of water management. Man also needed to manage water to find protection from its dangers and the need for that is increasing. In the coming decades, the impact of climate change is expected to intensify floods and droughts, affect groundwater resources, raise sea levels, increase pollution and enhance the frequency and magnitude of disasters. Societies around the world are challenged to adapt to these threats to ensure water security, economic prosperity and environmental and cultural sustainability. This book deals with the heritage of water management and the use that was made of water, as well as the impact of water management on heritage. An example of the former may be an ancient irrigation system in the Filipines or in the Middle East that still functions today, while the latter may reflect the importance of maintaining groundwater levels for the preservation of organic remains on archaeological sites or of wooden piles underneath standing buildings. In either case the papers in this book reflect the dynamic nature of water, and hence the equally dynamic relation between water management and heritage. This publication follows up on a Heritage and Water conference in Amsterdam, the first of its kind. Its main purpose is to credibly present the importance and value of heritage and historical experience for water and sustainable development, and vice versa, present the importance of water management for the protection of heritage. It presents evolving insights and concepts about Water and about Heritage from a variety of disciplines, policy and public perspectives illustrated with cases studies and aims to connect decision makers with experts such as engineers, archaeologists, historians, geographers, ecologist and landscape architects

Book Predicting Structured Data

    Book Details:
  • Author : Neural Information Processing Systems Foundation
  • Publisher : MIT Press
  • Release : 2007
  • ISBN : 0262026171
  • Pages : 361 pages

Download or read book Predicting Structured Data written by Neural Information Processing Systems Foundation and published by MIT Press. This book was released on 2007 with total page 361 pages. Available in PDF, EPUB and Kindle. Book excerpt: State-of-the-art algorithms and theory in a novel domain of machine learning, prediction when the output has structure.

Book Enterprise Information Systems

Download or read book Enterprise Information Systems written by Slimane Hammoudi and published by Springer. This book was released on 2019-07-27 with total page 425 pages. Available in PDF, EPUB and Kindle. Book excerpt: This book constitutes extended, revised and selected papers from the 20th International Conference on Enterprise Information Systems, ICEIS 2018, held in Funchal, Madeira, Portugal, in March 2018. The 19 papers presented in this volume were carefully reviewed and selected for inclusion in this book from a total of 242 submissions. They deal with topics such as data science and databases; ontologies; social networks; knowledge management; software development; human-computer interaction, and multimedia.

Book Lectures on Ideology and Utopia

Download or read book Lectures on Ideology and Utopia written by Paul Ricœur and published by . This book was released on 1986 with total page 353 pages. Available in PDF, EPUB and Kindle. Book excerpt: Essays cover Marx, Karl Mannheim, Max Weber, Clifford Geertz, Louis Althusser, Jurgen Habermas, Henri de Saint-Simon, and Charles Fourier