EBookClubs

Read Books & Download eBooks Full Online

EBookClubs

Read Books & Download eBooks Full Online

Book Un mod  le de recherche d information bas   sur les graphes et les similarit  s structurelles pour l am  lioration du processus de recherche d information

Download or read book Un mod le de recherche d information bas sur les graphes et les similarit s structurelles pour l am lioration du processus de recherche d information written by Yaël Champclaux and published by . This book was released on 2009 with total page 162 pages. Available in PDF, EPUB and Kindle. Book excerpt: Cette thèse d'informatique s'inscrit dans le domaine de la recherche d'information (RI). Elle a pour objet la création d'un modèle de recherche utilisant les graphes pour en exploiter la structure pour la détection de similarités entre les documents textuels d'une collection donnée et une requête utilisateur en vue d'améliorer le processus de recherche d'information Ces similarités sont dites " structurelles " et nous montrons qu'elles apportent un gain d'information bénéfique par rapport aux seules similarités directes. Le rapport de thèse est structuré en cinq chapitres. Le premier chapitre présente un état de l'art sur la comparaison et les notions connexes que sont la distance et la similarité. Le deuxième chapitre présente les concepts clés de la RI, notamment l'indexation des documents, leur comparaison, et l'évaluation des classements retournés. Le troisième chapitre est consacré à la théorie des graphes et introduit les notations et notions liées à la représentation par graphe. Le quatrième chapitre présente pas à pas la construction de notre modèle pour la RI, puis, le cinquième chapitre décrit son application dans différents cas de figure, ainsi que son évaluation sur différentes collections et sa comparaison à d'autres approches.

Book Mod  le d int  gration d un syst  me de recherche d informations et d un syst  me hyperm  dia bas   sur le formalisme des graphes conceptuels

Download or read book Mod le d int gration d un syst me de recherche d informations et d un syst me hyperm dia bas sur le formalisme des graphes conceptuels written by Ammar Kheirbek and published by . This book was released on 1995 with total page 221 pages. Available in PDF, EPUB and Kindle. Book excerpt: Le but de notre travail est de définir un modèle de recherche d'informations, intégrant les deux modes d'accès que sont la formulation de requêtes (approche systèmes de recherche d'information) et la navigation (approche systèmes hypermédia). La motivation de cette étude repose sur la constatation que ces deux approches sont fortement complémentaires, les avantages de l'une compensant largement les limitations de l'autre. Classiquement, les modèles de recherche d'informations et d'hypermédia établissent une distinction entre les aspects structure des informations et les aspects représentation des connaissances. Cette distinction est, d'une part, de nature à limiter les possibilités de ces systèmes, et est un obstacle à l'intégration de ces deux modèles d'autre part. La base de notre approche d'intégration consiste tout d'abord à unifier ces deux types d'informations: une sémantique est attachée aux structures, et cette sémantique doit être explicitée et utilisée dans le processus d'accès à l'information, au même titre que les connaissances attachées au contenu de l'information. La définition formelle proposée du modèle intégré est largement fondée sur le formalisme des graphes conceptuels qui a été retenu pour représenter toutes les connaissances du système et pour réaliser les différentes opérations d'interrogation et de navigation propres aux deux approches. Une conclusion intéressante de cette démarche d'intégration est qu'elle conduit également à améliorer les deux modèles composants, par rapport à l'état de l'art. Une expérimentation du modèle proposé a conduit à la réalisation d'un prototype fondé sur O2 (SGBD Orienté Objet) et l'interface MOSAIC de WWW (World Wide Web), et les tests ont utilisé le corpus du système RIME (Recherche d'Informations MEdicales)

Book M  trologie des graphes de terrain  application    la construction de ressources lexicales et    la recherche d information

Download or read book M trologie des graphes de terrain application la construction de ressources lexicales et la recherche d information written by Emmanuel Navarro and published by . This book was released on 2013 with total page 0 pages. Available in PDF, EPUB and Kindle. Book excerpt: Cette thèse s'organise en deux parties : une première partie s'intéresse aux mesures de similarité entre sommets d'un graphe, une seconde aux méthodes de clustering de graphe biparti. Une nouvelle mesure de similarité entre sommets basée sur des marches aléatoires en temps courts est introduite. Cette méthode a l'avantage, en particulier, d'être insensible à la densité du graphe. Il est ensuite proposé un large état de l'art des similarités entre sommets, ainsi qu'une comparaison expérimentale de ces différentes mesures. Cette première partie se poursuit par la proposition d'une méthode robuste de comparaison de graphes partageant le même ensemble de sommets. Cette mesure est mise en application pour comparer et fusionner des graphes de synonymie. Enfin une application d'aide à la construction de ressources lexicales est présentée. Elle consiste à proposer de nouvelles relations de synonymie à partir de l'ensemble des relations de synonymie déjà existantes. Dans une seconde partie, un parallèle entre l'analyse formelle de concepts et le clustering de graphe biparti est établi. Ce parallèle conduit à l'étude d'un cas particulier pour lequel une partition d'un des groupes de sommets d'un graphe biparti peut-être déterminée alors qu'il n'existe pas de partitionnement correspondant sur l'autre type de sommets. Une méthode simple qui répond à ce problème est proposée et évaluée. Enfin Kodex, un système de classification automatique des résultats d'une recherche d'information est présenté. Ce système est une application en RI des méthodes de clustering vues précédemment. Une évaluation sur une collection de deux millions de pages web montre les avantages de l'approche et permet en outre de mieux comprendre certaines différences entre méthodes de clustering.

Book Personalized Information Retrieval and Adaptation to User s Context

Download or read book Personalized Information Retrieval and Adaptation to User s Context written by Hassan Naderi and published by . This book was released on 2008 with total page 212 pages. Available in PDF, EPUB and Kindle. Book excerpt: Les informations disponibles sur l'Internet se développent à un rythme tel que bientôt les méthodes de recherche textuelle utilisant la fréquence des termes ne seront plus suffisantes. Un courant de pensée est consacré à la personnalisation de la recherche, à savoir prendre en compte des traits spécifiques et le contexte de l'utilisateur pour répondre à sa requête. Nous pensons que le profil, la communauté, et le contexte de l'utilisateur sont les trois concepts essentiels à envisager pour faire face au problème de la croissance du World Wide Web. La thèse étudie la combinaison de ces trois courants de pensée. Dans la première partie de cette thèse, nous développons un système de recherche d'information personnalisé et collaboratif (appelé PERCIRS), qui utilise les deux premiers concepts (le profil et la communauté). PERCIRS crée une liste classée de documents pertinents, pour la requête q de l'utilisateur U. Cette classification se fait sur la base des documents sélectionnés pour les requêtes semblables à q par les utilisateurs au profil similaire à celui de U. Le choix de la méthode de recherche d'utilisateurs similaires joue un rôle important dans l'efficacité de PER-CIRS. À cette fin, nous avons proposé trois catégories de formules pour calculer la similarité entre deux profils d'utilisateurs: formule fondée sur l'égalité, formule fondée sur la similarité et enfin une formule fondée sur les graphes. Afin de trouver la catégorie optimale, nous avons proposé deux mécanismes d'évaluation: fondés sur les concepts de la catégorisation et de la classification. Ces deux mécanismes s'appuient sur les formules de calcul de profil utilisateur fondées sur les graphes. PERCIRS étant un système de recherche d'information (SRI) personnalisé (en raison de la prise en compte des profils d'utilisateur), il ne peut pas être évalué par des mécanismes d'évaluation tels que Cranfield (par exemple TREC). Par conséquent, dans cette thèse, nous proposons un nouveau mécanisme qui permet de l'évaluer en même temps que les autres SRI classiques tels que BM25 - Okapi. Dans la deuxième partie de ce travail de thèse,, le contexte de l'utilisateur est utilisé pour adapter, aux préférences de l'utilisateur, un document trouvé par PERCIRS. Nous proposons d'adapter physiquement et sémantiquement un document selon le profil de l'utilisateur et selon le profil de contexte. Un mécanisme est également proposé pour naviguer dans des documents adaptés en fonction des préférences de l'utilisateur.

Book Les supports de vocabulaires pour les syst  mes de recherche d   information orient  s pr  cision   application aux graphes pour la recherche d   information m  dicale

Download or read book Les supports de vocabulaires pour les syst mes de recherche d information orient s pr cision application aux graphes pour la recherche d information m dicale written by Loïc Maisonnasse and published by . This book was released on 2008 with total page 220 pages. Available in PDF, EPUB and Kindle. Book excerpt: Cette thèse propose un cadre général pour développer des modèles orientés précision en recherche d’information (RI). Ce cadre s'appuie sur la notion de supports de vocabulaires pour modéliser l’expressivité des représentations utilisées en RI. Peu de cadres de modélisation sont disponibles dans ce domaine. Nous proposons un tel cadre axé sur la modélisation de l’expressivité et qui permet de choisir ou de comparer des modèles sur ce critère. Dans ce cadre nous nous orientons vers l’utilisation de représentations expressives du texte. Nous proposons deux modèles utilisant des représentations d’expressivité forte à base de graphes. Si ces deux modèles se ressemblent au niveau de l’expressivité, ils s’opposent sur leur modèle sous-jacent. Nous implémentons l’un des modèles par un modèle dérivé des graphes conceptuels et l’autre par un modèle original dérivé des modèles de langue de RI. Pour l'application de ces modèles sur du texte, nous proposons un processus en deux étapes basé sur des traitements de la langue qui favorise la couverture du document. La première étape, dépendante du domaine d’application, produit une représentation intermédiaire des documents où chaque phrase est représentée par un graphe. La deuxième étape crée les représentations finales des documents à partir de la représentation intermédiaire. Nous appliquons finalement nos modèles sur le domaine médical à l'aide du méta-thésaurus UMLS et en proposant plusieurs méthodes pour construire la représentation intermédiaire. L’efficacité de nos modèles est prouvée par des expérimentations sur la campagne d’évaluation CLEF médicale qui permet de tester nos modèles dans un cadre réel.

Book Un mod  le logique de recherche d informations appliqu   au formalisme des graphes conceptuels

Download or read book Un mod le logique de recherche d informations appliqu au formalisme des graphes conceptuels written by Jean-Pierre Chevallet and published by . This book was released on 1992 with total page 202 pages. Available in PDF, EPUB and Kindle. Book excerpt: Que ce soit pour la maintenance de programmes, la réutilisation de codes ou simplement pour l'utilisation de gros logiciels comme les systèmes d'exploitation, un utilisateur est conformé à un problème qui apparaît comme appartenant au domaine de la Recherche d'Informations: trouver le module, les procédures ou les commandes qui réalisent une certaine fonctionnalité. Pour permettre cette recherche, il est nécessaire de décrire chaque composant dans un formalisme suffisamment complexe pour exprimer avec précision leur fonctionnalité, mais permettant également des évaluations de distance sémantique entre une requête et un document. Nous présentons pour cela un Système de Recherche d'Informations orienté vers la précision des réponses, et utilisant pour l'indexation un formalisme de graphe inspiré des Graphes Conceptuels de Sowa. La mesure de la correspondance sémantique est décrite par un Modèle Logique, en terme d'une logique modale floue du premier ordre. Nous présentons également un mécanisme d'optimisation de la recherche, basé sur des signatures de graphe

Book Extraction et manipulation d information structur  e sous la forme de graphe    partir de sources de donn  es existantes

Download or read book Extraction et manipulation d information structur e sous la forme de graphe partir de sources de donn es existantes written by Alejandro Gutierrez and published by . This book was released on 1997 with total page 630 pages. Available in PDF, EPUB and Kindle. Book excerpt: Des applications techniques telles que la gestion des réseaux routiers et électriques nécessitent de manipuler un grand volume d'information structurée sous la forme de graphe. Des problèmes typiques portent sur des parcours de chemins (par exemple, calcul du plus court chemin, du chemin avec la capacité maximale, du nombre de sous-composants d'un composant). Trois aspects principaux rendent difficile l'utilisation des algorithmes classiques pour résoudre ces problèmes a savoir, la taille des réseaux, la complexité de la structure des réseaux et la diversité des sources de données. Dans cette thèse, nous proposons un cadre base sur la notion de vue de graphe qui permet la définition des opérations de graphes et s'adapte à leur diversité de représentations. Une vue de graphe définit un graphe spécifique à partir des données stockées dans des sources différentes. La définition d'une vue de graphe consiste à établir une correspondance entre les éléments d'un graphe et les données sous-jacentes par l'intermédiaire de fonctions qui spécifient les éléments du graphe et la façon par laquelle le graphe peut être parcouru. Des opérateurs de dérivation sont proposes pour définir des nouvelles vues de graphes à partir de celles existantes. Ces opérateurs permettent la composition, dans une seule vue de graphe, de graphes contenant des étiquettes différentes de nœuds et des arcs et issus d'implémentations différentes. Des opérations de graphes telles que les parcours de chemins peuvent entre appliquées sur des vues de graphe de base et dérivées. La spécialisation d'un mécanisme de vue au problème spécifique de gestion de graphes, nous permet de proposer des stratégies adaptées au traitement des opérations de parcours de chemins. Nous validons le cadre proposé en supportant l'opération de fermeture transitive généralisée qui permet de résoudre une variété des problèmes de parcours de chemins. Une évaluation analytique des stratégies a été accomplie, nous permettant d'identifier les paramètres principaux qui influencent le comportement des stratégies pour le traitement de cette opération. Les résultats de cette évaluation ont été partiellement valides par un prototype qui implémente les idées principales du cadre proposé

Book Un mod  le d indexation relationnel pour les graphes conceptuels fond   sur une interpr  tation logique

Download or read book Un mod le d indexation relationnel pour les graphes conceptuels fond sur une interpr tation logique written by Iadh Ounis and published by . This book was released on 1998 with total page 302 pages. Available in PDF, EPUB and Kindle. Book excerpt: L'idée d'établir des relations entre des objets et de les représenter dans la base de connaissances d'un système informatique est le propre de toute approche en Intelligence Artificielle. Cependant, la plupart des formalismes de représentation de connaissances n'exploitent pas toute la richesse de la sémantique de ces relations, ni le comportement qui leur est associé. En recherche d'informations, les traitements de ces relations ne sont guère mieux élaborés et l'impact de leur prise en compte lors de la phase de correspondance n'a jamais été établi, même s'il reste vrai que de nombreuses approches tiennent compte de leur présence dans le document et tentent ainsi de les représenter lors du processus d'indexation. Pourtant la recherche de documents structurés ou complexes exige plus que jamais, outre un langage d'indexation robuste et expressif, la prise en charge de la sémantique des relations ainsi que leurs propriétés. À travers une étude des nouvelles exigences auxquelles la recherche d'informations d'aujourd'hui doit répondre, nous proposons un modèle d'indexation relationnel pour les documents. L'approche consiste à considérer qu'un terme d'indexation est fondé sur des concepts complexes où les connecteurs sémantiques sont vus comme des opérateurs, ou des relations permettant de construire des expressions nouvelles représentant des concepts nouveaux ou des situations nouvelles. Le modèle proposé ne se contente pas de représenter les relations, mais permet aussi d'offrir un cadre général précisant les principes généraux de manipulation de ces relations et la prise en compte de leurs propriétés dans un processus de recherche fondé sur une approche logique. Le modèle proposé comporte deux composantes: le langage de représentation des informations, permettant une approche d'indexation relationnelle, et les règles de dérivation qui, reprenant ce langage, permettent de diriger le processus de correspondance. Nous utilisons la théorie des situations comme langage de représentation et un système de dérivation de pertinence, reposant sur une axiomatisation de la notion de correspondance entre les documents et la requête pour la prise en compte des relations. Une caractéristique intéressante de ce modèle est qu'il conduit à étendre certains formalismes de représentation de connaissances par des notions utiles en recherche d'informations. Les limitations de la famille des logiques terminologiques, utilisée par ailleurs comme base formelle de l'approche d'indexation relationnelle proposée, peuvent ainsi être surmontées. Cependant, la complexité des traitements associés à cette famille de logiques empêche de les utiliser comme un modèle opérationnel. Nous proposons alors le formalisme des graphes conceptuels comme un bon compromis entre la complexité des démonstrateurs de théorèmes et la simplicité des approches algébriques. Ce formalisme est alors vu, à travers une interprétation logique adéquate, comme une implantation d'une logique terminologique étendue et du modèle d'indexation. Notre approche a été implantée sur une plate-forme de gestion de graphes conceptuels, réalisée sur le système de gestion de base de données à objets O2. Le prototype RELIEF résultant de notre expérimentation a été testé sur une collection d'images et a démontré l'applicabilité et le bien-fondé de notre approche

Book Indexation et interrogation de chemins de lecture en contexte pour la recherche d information structur  e sur le Web

Download or read book Indexation et interrogation de chemins de lecture en contexte pour la recherche d information structur e sur le Web written by Mathias Géry (auteur en informatique).) and published by . This book was released on 2004 with total page 0 pages. Available in PDF, EPUB and Kindle. Book excerpt: L'explosion du Web représente un nouveau défi pour la recherche d'information (RI). La plupart des systèmes actuels d'accès à l'information sont basés sur des modèles classiques, qui ont été développés pour des documents textuels, atomiques et indépendants et qui ne sont pas adaptés au Web. La structure du Web est un aspect essentiel de la description de l'information. Les travaux qui utilisent cette structure pour la RI simplifient le modèle du Web en un graphe orienté, dont les noeuds sont des pages HTML et les arcs sont des liens hypertextes, sans tenir compte du type des liens. L'objectif de ce travail est de prendre en compte l'impact des liens à la phase d'indexation et la phase d'interrogation d'un système de Recherche d'Information Structurée (SRIS). Le modèle de RI proposé est fondé sur un modèle d'HyperDocument en contexte (HDOCC) considérant quatre facettes de la description d'information sur le Web : le contenu, la structure hiérarchique, la lecture linéaire/déambulatoire et le contexte. U hyperdocument est modélisé par un contenu au sens des documents structurés, un ensemble de chemins de lecture et un contexte (espace d'information accessible et espace d'information référençant). Un processus d'indexation spécifique est proposé pour chaque facette. L'évaluation de notre système SmartWeb montre l'intérêt de l'information accessible combinée avec le contenu. Puis, à l'aide de collections de test structurées construites automatiquement, nous montrons l'intérêt d'une indexation au niveau des documents stucturés et des chemins de lecture. Le modèle est également implanté dans un SRIS complet, montrant ainsi la faisabilité de notre approche dans sa globalité et sur le Web. En particulier, le typage des liens est à la fois un des aspects les plus importants du modèle et une difficulté majeure de sa mise en oeuvre : nous montrons qu'il est possible d'extraire une structure hiérarchique du Web et d'identifier différentes granularités d'information.

Book Mod  lisation ontologique pour la recherche d information

Download or read book Mod lisation ontologique pour la recherche d information written by Samia Iltache and published by . This book was released on 2018 with total page 0 pages. Available in PDF, EPUB and Kindle. Book excerpt: L'expansion du web et le développement des technologies de l'information ont contribué à la prolifération des documents numériques en ligne. Cette disponibilité de l'information présente l'avantage de rendre la connaissance accessible à tous mais soulève de nombreux problèmes quant à l'accès à l'information pertinente, répondant à un besoin utilisateur. Un premier problème est lié à l'extraction de l'information utile parmi celle qui est disponible. Un second problème concerne l'appropriation de ces connaissances qui parfois, se traduit par du plagiat. L'objectif de cette thèse est le développement d'un modèle permettant de mieux caractériser les documents afin d'en faciliter l'accès mais aussi de détecter ceux présentant un risque de plagiat. Ce modèle s'appuie sur des ontologies de domaine pour la classification des documents et pour le calcul de la similarité des documents appartenant à un même domaine. Nous nous intéressons plus spécifiquement aux articles scientifiques, et notamment à leurs résumés, textes courts et relativement structurés. Il s'agit dès lors de déterminer comment évaluer la proximité/similarité sémantique de deux articles à travers l'examen de leurs résumés respectifs. Considérant qu'une ontologie de domaine regroupe les connaissances relatives à un domaine scientifique donné, notre processus est basé sur deux actions :(i) Une classification automatique des documents dans un domaine choisi parmi plusieurs domaines candidats. Cette classification détermine le sens d'un document à partir du contexte global dans lequel s'inscrit son contenu. (ii) Une comparaison des textes réalisée sur la base de la construction de ce que nous appelons le périmètre sémantique de chaque résumé et sur un enrichissement mutuel effectué lors de la comparaison des graphes des résumés. La comparaison sémantique des résumés s'appuie sur une segmentation de leur contenu respectif en zones, unités documentaires, reflétant leur structure logique.

Book Recherche par similarit   dans les grandes bases de donn  es multim  dia

Download or read book Recherche par similarit dans les grandes bases de donn es multim dia written by Imane Daoudi and published by . This book was released on 2009 with total page 146 pages. Available in PDF, EPUB and Kindle. Book excerpt: L’émergence des données numériques multimédia ne cesse d’augmenter. l’accès, le partage, le stockage et la recherche de ces données sont devenues des besoins réels et les problématiques sont nombreuses et variées. Afin de rendre cette masse d’information facilement exploitable pour tout utilisateur, il est nécessaire de disposer de techniques d’indexation et de recherche rapides et efficaces. Mes travaux de thèse s’inscrivent dans le domaine des données multimédia et plus précisément des images fixes. L’objectif principal est de développer une méthode performante d’indexation et de recherche des k plus proches voisins (kppv) qui soit adaptée à la recherche d’image par le contenu et aux propriétés des descripteurs d’images (grand volume, grande dimension, hétérogénéité, etc.). il s’agit d’une part, d’apporter des réponses aux problèmes de passage à l’échelle et de la malédiction de la dimension et d’autre part de traiter les problèmes de mesure de similarité qui se posent, et qui sont liés à la nature des données manipulées. Notre première proposition consiste en l’utilisation d’une structure d’indexation multidimensionnelle basée sur l’approximation ou filtrage, par une amélioration de la méthode RA-Blocks. Elle repose sur un algorithme de découpage de l’espace de données qui améliore notablement la capacité de stockage de l’index ainsi que le temps de la recherche. Dans un deuxième temps, nous proposons une méthode d’indexation multidimensionnelle adaptée à des données hétérogènes (couleur, texture, forme). Notre méthode combine une technique non linéaire de la réduction de la dimension à une structure d’indexation multidimensionnelle basée sur l’approche approximation. Cette combinaison permet de répondre à travers, un formaliste unique, aux différents verrous que nous nous sommes fixés de lever.

Book Approches par les graphes pour l aide    la s  lection  l analyse et la visualisation des connaissances

Download or read book Approches par les graphes pour l aide la s lection l analyse et la visualisation des connaissances written by Quoc Dinh Truong and published by . This book was released on 2008 with total page 163 pages. Available in PDF, EPUB and Kindle. Book excerpt: L’Extraction de Connaissances à partir de Données est un processus qui s’inscrit dans une démarche d’aide à la décision : les données utiles sont d’abord sélectionnées parmi les données disponibles avant d'être transformées en information dont on va extraire une connaissance utile. Cependant, l'intelligibilité et l’utilisabilité des connaissances extraites dépendent essentiellement de la manière utilisée pour les restituer. Les travaux de recherche présentés dans cette thèse s'inscrivent dans cette problématique et s’intéressent à l’utilisation de la théorie de graphes comme outils de modélisation, restitution et de résolution de problèmes. Ces travaux s’articulent autour de la recherche d’information pour la sélection et le filtrage des données brutes utilisées pour l'extraction de connaissances, leur analyse et la visualisation des connaissances qui aident à la représentation des connaissances extraites ainsi qu’à leur découverte.

Book Recherche d entit  s nomm  es complexes sur le web

Download or read book Recherche d entit s nomm es complexes sur le web written by Armel Fotsoh Tawaofaing and published by . This book was released on 2018 with total page 0 pages. Available in PDF, EPUB and Kindle. Book excerpt: Les récents développements des nouvelles technologies de l'information et de la communication font du Web une véritable mine d'information. Cependant, les pages Web sont très peu structurées. Par conséquent, il est difficile pour une machine de les traiter automatiquement pour en extraire des informations pertinentes pour une tâche ciblée. C'est pourquoi les travaux de recherche s'inscrivant dans la thématique de l'Extraction d'Information dans les pages web sont en forte croissance. Aussi, l'interrogation de ces informations, généralement structurées et stockées dans des index pour répondre à des besoins d'information précis correspond à la Recherche d'Information (RI). Notre travail de thèse se situe à la croisée de ces deux thématiques. Notre objectif principal est de concevoir et de mettre en œuvre des stratégies permettant de scruter le web pour extraire des Entités Nommées (EN) complexes (EN composées de plusieurs propriétés pouvant être du texte ou d'autres EN) de type entreprise ou de type événement, par exemple. Nous proposons ensuite des services d'indexation et d'interrogation pour répondre à des besoins d'informations. Ces travaux ont été réalisés au sein de l'équipe T2I du LIUPPA, et font suite à une commande de l'entreprise Cogniteev, dont le cœur de métier est centré sur l'analyse du contenu du Web. Les problématiques visées sont, d'une part, l'extraction d'EN complexes sur le Web et, d'autre part, l'indexation et la recherche d'information intégrant ces EN complexes. Notre première contribution porte sur l'extraction d'EN complexes dans des textes. Pour cette contribution, nous prenons en compte plusieurs problèmes, notamment le contexte bruité caractérisant certaines propriétés (pour un événement par exemple, la page web correspondante peut contenir deux dates : la date de l'événement et celle de mise en vente des billets). Pour ce problème en particulier, nous introduisons un module de détection de blocs qui permet de focaliser l'extraction des propriétés sur des blocs de texte pertinents. Nos expérimentations montrent une nette amélioration des performances due à cette approche. Nous nous sommes également intéressés à l'extraction des adresses, où la principale difficulté découle du fait qu'aucun standard ne se soit réellement imposé comme modèle de référence. Nous proposons donc un modèle étendu et une approche d'extraction basée sur des patrons et des ressources libres.Notre deuxième contribution porte sur le calcul de similarité entre EN complexes. Dans l'état de l'art, ce calcul se fait généralement en deux étapes : (i) une première calcule les similarités entre propriétés et (ii) une deuxième agrège les scores obtenus pour le calcul de la similarité globale. En ce qui concerne cette première étape, nous proposons une fonction de calcul de similarité entre EN spatiale, l'une représentée par un point et l'autre par un polygone. Elle complète l'état de l'art. Notons que nos principales propositions se situent au niveau de la deuxième étape. Ainsi, nous proposons trois techniques pour l'agrégation des scores intermédiaires. Les deux premières sont basées sur la somme pondérée des scores intermédiaires (combinaison linéaire et régression logistique). La troisième exploite les arbres de décisions pour agréger les scores intermédiaires. Enfin, nous proposons une dernière approche basée sur le clustering et le modèle vectoriel de Salton pour le calcul de similarité entre EN complexes. Son originalité vient du fait qu'elle ne nécessite pas de passer par le calcul de scores de similarités intermédiaires.

Book Contribution    la d  finition de mod  les de recherche d information flexibles bas  s sur les CP Nets

Download or read book Contribution la d finition de mod les de recherche d information flexibles bas s sur les CP Nets written by Fatiha Boubekeur-Amirouche and published by . This book was released on 2008 with total page 202 pages. Available in PDF, EPUB and Kindle. Book excerpt: Ce travail de thèse traite deux principaux problèmes en recherche d'information : la pondération des requêtes et l'indexation sémantique des documents. Notre contribution globale consiste en la définition d'un modèle théorique de RI basé sur les CP-Nets. Le formalisme CP-Net est utilisé d'une part, pour la représentation graphique de requêtes flexibles exprimant des préférences qualitatives, et pour la pondération automatique de telles requêtes. D'autre part, le formalisme CP-Net est utilisé comme langage d'indexation graphique pour représenter les concepts descriptifs d'un document et les relations correspondantes, d'une manière relativement compacte. Les concepts sont identifiés par projection du document sur WordNet. Les relations entre concepts sont découvertes au moyen des règles d'association sémantiques. Un mécanisme d'évaluation des requêtes basé sur l'appariement de graphes CP-Nets est aussi proposé..

Book Category Specificity in Brain and Mind

Download or read book Category Specificity in Brain and Mind written by Emer Forde and published by Psychology Press. This book was released on 2005-07-22 with total page 481 pages. Available in PDF, EPUB and Kindle. Book excerpt: This book aims to provide converging evidence as to how knowledge about different categories is represented in the brain, and how this knowledge develops.

Book Geomarketing

    Book Details:
  • Author : Gérard Cliquet
  • Publisher : John Wiley & Sons
  • Release : 2013-03-04
  • ISBN : 1118614143
  • Pages : 236 pages

Download or read book Geomarketing written by Gérard Cliquet and published by John Wiley & Sons. This book was released on 2013-03-04 with total page 236 pages. Available in PDF, EPUB and Kindle. Book excerpt: This title describes the state of the art in all areas of spatial marketing, discussing the various constituents which make up the geography of markets. Demand varies according to location and can be measured according to revenue, the number of households, spending patterns and lifestyles. Supply is also dependent on position, because prices, services, products and available shops rely on location, while the difference between supply and demand is the rationale for the role of the trader. The book also covers the way geographic techniques help to solve marketing problems and contains chapters written by contributors with extensive experience in this field; given that it is crucial for companies to direct their marketing correctly at their target audience, this will be indispensable reading for those involved in this area.

Book Graphics Recognition  Algorithms and Applications

Download or read book Graphics Recognition Algorithms and Applications written by Dorothea Blostein and published by Springer. This book was released on 2014-10-08 with total page 370 pages. Available in PDF, EPUB and Kindle. Book excerpt: This book presents refereed and revised papers presented at GREC 2001, the 4th IAPR International Workshop on Graphics Recognition, which took place in Kingston, Ontario, Canada in September 2001. Graphics recognition is a branch of document image analysis that focuses on the recognition of two-dimensional notations such as engineering drawings, maps, mathematical notation, music notation, tables, and chemical structure diagrams. Due to the growing demand for both o?-line and on-line document recognition systems, the ?eld of graphics recognition has an excitingand promisingfuture. The GREC workshops provide an opportunity for researchers at all levels of experience to share insights into graphics recognition methods. The workshops enjoy strongparticipation from researchers in both industry and academia. They are sponsored by IAPR TC-10, the Technical Committee on Graphics Recog- tion within the International Association for Pattern Recognition. Edited v- umes from the previous three workshops in this series are available as Lecture Notes in Computer Science, Vols. 1072, 1389, and 1941. After the GREC 2001 workshop, authors were invited to submit enhanced versions of their papers for review. Every paper was evaluated by three reviewers. We are grateful to both authors and reviewers for their careful work during this review process. Many of the papers that appear in this volume were thoroughly revised and improved, in response to reviewers’ suggestions.