EBookClubs

Read Books & Download eBooks Full Online

EBookClubs

Read Books & Download eBooks Full Online

Book   tude de L apprentissage Et de la G  n  ralisation Des R  seaux Profonds en Classification D images

Download or read book tude de L apprentissage Et de la G n ralisation Des R seaux Profonds en Classification D images written by Michaël Blot and published by . This book was released on 2018 with total page 0 pages. Available in PDF, EPUB and Kindle. Book excerpt: Artificial intelligence is experiencing a resurgence in recent years. This is due to the growing ability to collect and store a considerable amount of digitized data. These huge databases allow machine learning algorithms to respond to certain tasks through supervised learning. Among the digitized data, images remain predominant in the modern environment. Huge datasets have been created. moreover, the image classification has allowed the development of previously neglected models, deep neural networks or deep learning. This family of algorithms demonstrates a great facility to learn perfectly datasets, even very large. Their ability to generalize remains largely misunderstood, but the networks of convolutions are today the undisputed state of the art. From a research and application point of view of deep learning, the demands will be more and more demanding, requiring to make an effort to bring the performances of the neuron networks to the maximum of their capacities. This is the purpose of our research, whose contributions are presented in this thesis. We first looked at the issue of training and considered accelerating it through distributed methods. We then studied the architectures in order to improve them without increasing their complexity. Finally, we particularly study the regularization of network training. We studied a regularization criterion based on information theory that we deployed in two different ways.

Book APPRENTISSAGE ET GENERALISATION PAR DES RESEAUX DE NEURONES

Download or read book APPRENTISSAGE ET GENERALISATION PAR DES RESEAUX DE NEURONES written by Juan-Manuel Torres Moreno and published by . This book was released on 1997 with total page 147 pages. Available in PDF, EPUB and Kindle. Book excerpt: LA CLASSIFICATION EST L'ATTRIBUTION D'UNE CLASSE SPECIFIQUE A UN OBJET DONNE. CETTE ATTRIBUTION A BESOIN D'UN CERTAIN DEGRE D'ABSTRACTION POUR POUVOIR EXTRAIRE DES GENERALITES A PARTIR DES EXEMPLES DONT ON DISPOSE. POUR UNE MACHINE, LA CLASSIFICATION DE VISAGES, DE DONNEES MEDICALES, DE FORMES, SONT TOUTES DES TACHES ASSEZ DIFFICILES. PAR EXEMPLE, DANS LE CAS DE LA RECONNAISSANCE DE CARACTERES MANUSCRITS, IL EST DIFFICILE D'ENONCER UNE DESCRIPTION GENERALE QUI TIENNE COMPTE DE TOUTES LES VARIATIONS PARTICULIERES DE CHAQUE CARACTERE. UNE AUTRE APPROCHE QUI PEUT ETRE UTILISEE POUR CETTE TACHE EST CELLE DE L'APPRENTISSAGE. AINSI, LE CRITERE POUR DECIDER SI UNE IMAGE CORRESPOND OU NON A UNE LETTRE SINGLE HIGH-REVERSED-9 QUOTATION MARKARIGHT SINGLE QUOTATION MARK CONSISTE A COMPARER SI CETTE IMAGE EST (SUFFISAMMENT SIMILAIRE) A DES SINGLE HIGH-REVERSED-9 QUOTATION MARKARIGHT SINGLE QUOTATION MARK VUS AUPARAVANT. DE CE POINT DE VUE, ON NE CALCULE PAS LA CLASSIFICATION DE CARACTERES : ELLE DOIT ETRE APPRISE A PARTIR D'EXEMPLES. LE BUT DE CETTE THESE EST DE PRESENTER DE NOUVELLES HEURISTIQUES POUR GENERER, D'UNE MANIERE CONSTRUCTIVE, DES RESEAUX DE NEURONES POUR LA CLASSIFICATION. ELLES PERMETTENT DE GENERER DES RESEAUX A UNE SEULE COUCHE CACHEE COMPLETEMENT CONNECTEE AUX UNITES D'ENTREE, ET UN NEURONE DE SORTIE CONNECTE AUX UNITES CACHEES. LES NEURONES CACHES ET DE SORTIE SONT DES UNITES BINAIRES, POUVANT FAIRE SOIT DES SEPARATIONS LINEAIRES, SOIT DES SEPARATIONS SPHERIQUES. CES HEURISTIQUES SONT COUPLEES AVEC DES ALGORITHMES D'APPRENTISSAGE POUR LA PERCEPTRON, MINIMERROR-L POUR LES SEPARATIONS LINEAIRES ET MINIMERROR-S POUR LES SEPARATIONS SPHERIQUES. TROIS NOUVEAUX ALGORITHMES CONSTRUCTIFS, QUI DIFFERENT SUIVANT LE TYPE DE NEURONES CACHES ET AUSSI SUIVANT LA DEFINITION DES CIBLES QUE CEUX-CI DOIVENT APPRENDRE ON ETE DEVELOPPES. PENDANT LE PROCESSUS D'APPRENTISSAGE, DES NEURONES CACHES ENTRAINES POUR APPRENDRE CES CIBLES VONT DIMINUER LE NOMBRE D'ERREURS DE CLASSIFICATION DU NEURONE DE SORTIE. LES RESEAUX AINSI BATIS ONT GENERALEMENT MOINS DE PARAMETRES (POIDS) ET GENERALISENT MIEUX QUE LES RESEAUX ENTRAINES AVEC D'AUTRES ALGORITHMES.

Book Apprentissage et g  n  ralisation par des r  seaux de neurones

Download or read book Apprentissage et g n ralisation par des r seaux de neurones written by Juan-Manuel Torres-Moreno and published by . This book was released on 2009 with total page 0 pages. Available in PDF, EPUB and Kindle. Book excerpt: La classification est l'attribution d'une classe spécifique à un objet donné. Cette attribution a besoin d'un certain degré d'abstraction pour pouvoir extraire des généralités à partir des exemples dont on dispose. Pour une machine, la classification de visages, de données médicales, de formes, sont toutes des tâches assez difficiles. Par exemple, dans le cas de la reconnaissance de caractères manuscrits, il est difficile d'énoncer une description générale qui tienne compte de toutes les variations particulières de chaque caractère. Une autre approche qui peut être utilisée pour cette tâche est celle de l'apprentissage. Ainsi, le critère pour décider si une image correspond ou non à une lettre 'A' consiste à comparer si cette image est (suffisamment similaire} à des 'a' vus auparavant. De ce point de vue, on ne calcule pas la classification de caractères : elle doit être apprise à partir d'exemples. Ces dernières années, de nouvelles techniques neuronales d'apprentissage ont été développées. Cet apprentissage avec des réseaux de neurones se fait actuellement en suivant deux approches : certains algorithmes comme la Rétropropagation du Gradient ont besoin d'introduire a priori le nombre et la connectivité des unités cachées et déterminer les poids des connexions par minimisation d'un coût. Le réseau ainsi obtenu est éventuellement élagué. Avec une approche constructive on apprend en même temps le nombre d'unités et les poids, dans le cadre d'une architecture fixée, commençant généralement avec une seule unité. Le but de cette thèse est de présenter de nouvelles heuristiques pour générer, d'une manière constructive, des réseaux de neurones pour la classification. Elles permettent de générer des réseaux à une seule couche cachée complètement connectée aux unités d'entrée, et un neurone de sortie connecté aux unités cachées. Les neurones cachés et de sortie sont des unités binaires, pouvant faire soit des séparations linéaires, soit des séparations sphériques. Ces heuristiques sont couplées avec des algorithmes d'apprentissage pour le perceptron, Minimerror-L pour les séparations linéaires et Minimerror-S pour les séparations sphériques. Trois nouveaux algorithmes constructifs, qui différent suivant le type de neurones cachés et aussi suivant la définition des cibles que ceux-ci doivent apprendre on été développés. Pendant le processus d'apprentissage, des neurones cachés entraînés pour apprendre ces cibles vont diminuer le nombre d'erreurs de classification du neurone de sortie. Les réseaux ainsi bâtis ont généralement moins de paramètres (poids) et généralisent mieux que les réseaux entraînés avec d'autres algorithmes.

Book Knowledge Transfer for Image Understanding

Download or read book Knowledge Transfer for Image Understanding written by Praveen Kulkarni and published by . This book was released on 2017 with total page pages. Available in PDF, EPUB and Kindle. Book excerpt: Le Transfert de Connaissance (Knowledge Transfer or Transfer Learning) est une solution prometteuse au difficile problème de l'apprentissage des réseaux profonds au moyen de bases d'apprentissage de petite taille, en présence d'une grande variabilité visuelle intra-classe. Dans ce travail, nous reprenons ce paradigme, dans le but d'étendre les capacités des CNN les plus récents au problème de la classification. Dans un premier temps, nous proposons plusieurs techniques permettant, lors de l'apprentissage et de la prédiction, une réduction des ressources nécessaires - une limitation connue des CNN. (i) En utilisant une méthode hybride combinant des techniques classiques comme des Bag-Of-Words (BoW) avec des CNN. (iv) En introduisant une nouvelle méthode d'agrégation intégrée à une structure de type CNN ainsi qu'un modèle non-linéaire s'appuyant sur des parties de l'image. La contribution clé est, finalement, une technique capable d'isoler les régions des images utiles pour une représentation locale. De plus, nous proposons une méthode nouvelle pour apprendre une représentation structurée des coefficients des réseaux de neurones. Nous présentons des résultats sur des jeux de données difficiles, ainsi que des comparaisons avec des méthodes concurrentes récentes. Nous prouvons que les méthodes proposées s'étendent à d'autres tâches de reconnaissance visuelles comme la classification d'objets, de scènes ou d'actions.

Book Le Deep Learning pour le traitement d   images

Download or read book Le Deep Learning pour le traitement d images written by Daphne Wallach and published by ENI. This book was released on 2024-01-10 with total page 0 pages. Available in PDF, EPUB and Kindle. Book excerpt:

Book Contributions to Large scale Learning for Image Classification

Download or read book Contributions to Large scale Learning for Image Classification written by Zeynep Akata and published by . This book was released on 2014 with total page 0 pages. Available in PDF, EPUB and Kindle. Book excerpt: Building algorithms that classify images on a large scale is an essential task due to the difficulty in searching massive amount of unlabeled visual data available on the Internet. We aim at classifying images based on their content to simplify the manageability of such large-scale collections. Large-scale image classification is a difficult problem as datasets are large with respect to both the number of images and the number of classes. Some of these classes are fine grained and they may not contain any labeled representatives. In this thesis, we use state-of-the-art image representations and focus on efficient learning methods. Our contributions are (1) a benchmark of learning algorithms for large scale image classification, and (2) a novel learning algorithm based on label embedding for learning with scarce training data. Firstly, we propose a benchmark of learning algorithms for large scale image classification in the fully supervised setting. It compares several objective functions for learning linear classifiers such as one-vs-rest, multiclass, ranking and weighted average ranking using the stochastic gradient descent optimization. The output of this benchmark is a set of recommendations for large-scale learning. We experimentally show that, online learning is well suited for large-scale image classification. With simple data rebalancing, One-vs-Rest performs better than all other methods. Moreover, in online learning, using a small enough step size with respect to the learning rate is sufficient for state-of-the-art performance. Finally, regularization through early stopping results in fast training and a good generalization performance. Secondly, when dealing with thousands of classes, it is difficult to collect sufficient labeled training data for each class. For some classes we might not even have a single training example. We propose a novel algorithm for this zero-shot learning scenario. Our algorithm uses side information, such as attributes to embed classes in a Euclidean space. We also introduce a function to measure the compatibility between an image and a label. The parameters of this function are learned using a ranking objective. Our algorithm outperforms the state-of-the-art for zero-shot learning. It is flexible and can accommodate other sources of side information such as hierarchies. It also allows for a smooth transition from zero-shot to few-shots learning.

Book METHODES NEURONALES POUR LA SEGMENTATION D IMAGES DE TELEDETECTION ET L APPRENTISSAGE DE CONCEPTS

Download or read book METHODES NEURONALES POUR LA SEGMENTATION D IMAGES DE TELEDETECTION ET L APPRENTISSAGE DE CONCEPTS written by Jean-Pierre Novak and published by . This book was released on 2000 with total page 229 pages. Available in PDF, EPUB and Kindle. Book excerpt: L'UTILISATION DES METHODES D'APPRENTISSAGE AUTOMATIQUE AVEC LES JEUX DE DONNEES COMPLEXES ET VOLUMINEUX DES IMAGES DE TELEDETECTION EST SOUVENT DELICATE, EN PARTICULIER AVEC LES IMAGES DE ZONES URBAINES QUI CONTIENNENT DES TAUX IMPORTANTS DE PIXELS MIXTES. LA CLASSIFICATION PIXEL PAR PIXEL DE CES IMAGES GENERE DES CLASSES SPECTRALES MIXTES QUI NE SONT PAS TOUJOURS INTERESSANTES. D'AUTRE PART, LA COMPLEXITE DE CES DONNEES REND DIFFICILE L'APPRENTISSAGE SUPERVISE DES CLASSIFICATIONS EFFECTUEES PAR UN EXPERT. CETTE THESE PROPOSE DEUX METHODES D'APPRENTISSAGE BIEN ADAPTEES A CES JEUX DE DONNEES COMPLEXES. LA PREMIERE ENTRE DANS LA CATEGORIE DES METHODES D'APPRENTISSAGE NON SUPERVISE. ELLE A POUR OBJECTIF DE CLASSIFIER ET DE SEGMENTER LES IMAGES DE TELEDETECTION EN REGIONS ET DE DEPASSER LE NIVEAU DES PIXELS. ELLE UTILISE DES INFORMATIONS SPATIALES EN PLUS DES INFORMATIONS SPECTRALES AFIN DE CONSTRUIRE PAR AGREGATION DES REGIONS ET DE LES CLASSIFIER. LA SECONDE METHODE ENTRE DANS LA CATEGORIE DES METHODES D'APPRENTISSAGE NEURONAL SUPERVISE. ELLE A POUR OBJECTIF DE REPRODUIRE LES CLASSIFICATIONS DE L'EXPERT SUR DES DONNEES D'APPRENTISSAGE COMPLEXES ET DE LES GENERALISER SUR DES DONNEES NON VUES DURANT L'APPRENTISSAGE. ELLE UTILISE UNE REPRESENTATION INTERNE DES CONNAISSANCES SOUS LA FORME DE NEURONES DE TYPE HYPERCONVEXE ET UN ALGORITHME D'APPRENTISSAGE EFFICACE.

Book Mesure de l int  grit   d une image

Download or read book Mesure de l int grit d une image written by Boubacar Diallo and published by . This book was released on 2020 with total page 0 pages. Available in PDF, EPUB and Kindle. Book excerpt: Les images numériques sont devenues un outil de communication visuel puissant et efficace pour transmettre des messages, diffuser des idées et prouver des faits. L'apparition du smartphone avec une grande diversité de marques et de modèles facilite la création de nouveaux contenus visuels et leur diffusion dans les réseaux sociaux et les plateformes de partage d'images. Liés à ce phénomène de création et publication d'images et aidés par la disponibilité et la facilité d'utilisation des logiciels de manipulation d'images, de nombreux problèmes sont apparus allant de la diffusion de contenu illégal à la violation du droit d'auteur. La fiabilité des images numériques est remise en cause que ce soit pour de simples utilisateurs ou pour des professionnels experts tels que les tribunaux et les enquêteurs de police. Le phénomène des « fake news » est un exemple bien connu et répandu d'utilisation malveillante d'images numériques sur les réseaux.De nombreux chercheurs du domaine de la cybersécurité des images ont relevé les défis scientifiques liés aux manipulations des images. De nombreuses méthodes aux performances intéressantes ont été développées basées sur le traitement automatique des images et plus récemment l'adoption de l'apprentissage profond. Malgré la diversité des techniques proposées, certaines ne fonctionnent que pour certaines conditions spécifiques et restent vulnérables à des attaques malveillantes relativement simples. En effet, les images collectées sur Internet imposent de nombreuses contraintes aux algorithmes remettant en question de nombreuses techniques de vérification d'intégrité existantes. Il existe deux particularités principales à prendre en compte pour la détection d'une falsification : l'une est le manque d'informations sur l'acquisition de l'image d'origine, l'autre est la forte probabilité de transformations automatiques liées au partage de l'image telles que la compression avec pertes ou le redimensionnement.Dans cette thèse, nous sommes confrontés à plusieurs de ces défis liés à la cybersécurité des images notamment l'identification de modèles de caméra et la détection de falsification d'images. Après avoir passé en revue l'état de l'art du domaine, nous proposons une première méthode basée sur les données pour l'identification de modèles de caméra. Nous utilisons les techniques d'apprentissage profond basées sur les réseaux de neurones convolutifs (CNN) et développons une stratégie d'apprentissage prenant en compte la qualité des données d'entrée par rapport à la transformation appliquée. Une famille de réseaux CNN a été conçue pour apprendre les caractéristiques du modèle de caméra directement à partir d'une collection d'images subissant les mêmes transformations que celles couramment utilisées sur Internet. Notre intérêt s'est porté sur la compression avec pertes pour nos expérimentations, car c'est le type de post-traitement le plus utilisé sur Internet. L'approche proposée fournit donc une solution robuste face à la compression pour l'identification de modèles de caméra. Les performances obtenues par notre approche de détection de modèles de caméra sont également utilisées et adaptées pour la détection et la localisation de falsification d'images. Les performances obtenues soulignent la robustesse de nos propositions pour la classification de modèles de caméra et la détection de falsification d'images.

Book Application de m  thodes d apprentissage profond pour images avec structure additionnelle    diff  rents contextes

Download or read book Application de m thodes d apprentissage profond pour images avec structure additionnelle diff rents contextes written by Laurent Alsène-Racicot and published by . This book was released on 2023 with total page 0 pages. Available in PDF, EPUB and Kindle. Book excerpt: Les méthodes d'apprentissage profond connaissent une croissance fulgurante. Une explication de ce phénomène est l'essor de la puissance de calcul combiné à l'accessibilité de données en grande quantité. Néanmoins, plusieurs applications de la vie réelle présentent des difficultés: la disponibilité et la qualité des données peuvent être faibles, l'étiquetage des données peut être ardu, etc. Dans ce mémoire, nous examinons deux contextes : celui des données limitées et celui du modèle économique CATS. Pour pallier les difficultés rencontrées dans ces contextes, nous utilisons des modèles d'apprentissage profond pour images avec structure additionnelle. Dans un premier temps, nous examinons les réseaux de scattering et étudions leur version paramétrée sur des petits jeux de données. Dans un second temps, nous adaptons les modèles de diffusion afin de proposer une alternative aux modèles à base d'agents qui sont complexes à construire et à optimiser. Nous vérifions empiriquement la faisabilité de cette démarche en modélisant le marché de l'emploi du modèle CATS. Nous constatons tout d'abord que les réseaux de scattering paramétrés sont performants sur des jeux de données de classification pour des petits échantillons de données. Nous démontrons que les réseaux de scattering paramétrés performent mieux que ceux non paramétrés, c'est-à-dire les réseaux de scattering traditionnels. En effet, nous constatons que des banques de filtres adaptés aux jeux de données permettent d'améliorer l'apprentissage. En outre, nous observons que les filtres appris se différencient selon les jeux de données. Nous vérifions également la propriété de robustesse aux petites déformations lisses expérimentalement. Ensuite, nous confirmons que les modèles de diffusion peuvent être adaptés pour modéliser le marché de l'emploi du modèle CATS dans une approche d'apprentissage profond. Nous vérifions ce fait pour deux architectures de réseau de neurones différentes. De plus, nous constatons que les performances sont maintenues pour différents scénarios impliquant l'apprentissage avec une ou plusieurs séries temporelles issues de CATS, lesquelles peuvent être tirées à partir d'hyperparamètres standards ou de perturbations de ceux-ci.

Book Apprentissage et exploitation de repr  sentations s  mantiques pour la classification et la recherche d images

Download or read book Apprentissage et exploitation de repr sentations s mantiques pour la classification et la recherche d images written by Maxime Bucher and published by . This book was released on 2018 with total page 166 pages. Available in PDF, EPUB and Kindle. Book excerpt: Dans cette thèse nous étudions différentes questions relatives à la mise en pratique de modèles d'apprentissage profond. En effet malgré les avancées prometteuses de ces algorithmes en vision par ordinateur, leur emploi dans certains cas d'usage réels reste difficile. Une première difficulté est, pour des tâches de classification d'images, de rassembler pour des milliers de catégories suffisamment de données d'entraînement pour chacune des classes. C'est pourquoi nous proposons deux nouvelles approches adaptées à ce scénario d'apprentissage, appelé “classification zero-shot”.L'utilisation d'information sémantique pour modéliser les classes permet de définir les modèles par description, par opposition à une modélisation à partir d'un ensemble d'exemples, et rend possible la modélisation sans donnée de référence. L'idée fondamentale du premier chapitre est d'obtenir une distribution d'attributs optimale grâce à l'apprentissage d'une métrique, capable à la fois de sélectionner et de transformer la distribution des données originales. Dans le chapitre suivant, contrairement aux approches standards de la littérature qui reposent sur l'apprentissage d'un espace d'intégration commun, nous proposons de générer des caractéristiques visuelles à partir d'un générateur conditionnel. Une fois générés ces exemples artificiels peuvent être utilisés conjointement avec des données réelles pour l'apprentissage d'un classifieur discriminant. Dans une seconde partie de ce manuscrit, nous abordons la question de l'intelligibilité des calculs pour les tâches de vision par ordinateur. En raison des nombreuses et complexes transformations des algorithmes profonds, il est difficile pour un utilisateur d'interpréter le résultat retourné. Notre proposition est d'introduire un “goulot d'étranglement sémantique” dans le processus de traitement. La représentation de l'image est exprimée entièrement en langage naturel, tout en conservant l'efficacité des représentations numériques. L'intelligibilité de la représentation permet à un utilisateur d'examiner sur quelle base l'inférence a été réalisée et ainsi d'accepter ou de rejeter la décision suivant sa connaissance et son expérience humaine.

Book R  solution variable et information privil  gi  e pour la reconnaissance d images

Download or read book R solution variable et information privil gi e pour la reconnaissance d images written by Marion Chevalier and published by . This book was released on 2016 with total page 0 pages. Available in PDF, EPUB and Kindle. Book excerpt: La classification des images revêt un intérêt majeur dans de nombreuses tâches de reconnaissance visuelle, en particulier pour la reconnaissance de véhicules au sol via les systèmes aéroportés, où les images traitées sont de faible résolution du fait de la large distance entre le porteur et la scène observée. Durant l'apprentissage, des données complémentaires peuvent être disponibles, qu'il s'agisse de connaissances sur les conditions de prise de vue ou de la version haute-résolution des images. Dans nos travaux, on s'intéresse au problème de la reconnaissance d'images faiblement résolues en prenant en compte des informations complémentaires pendant l'apprentissage. On montre d'abord l'intérêt des réseaux convolutionnels profonds pour la reconnaissance d'images faiblement résolues, en proposant notamment une architecture apprise sur les données. D'autre part, on s'appuie sur le cadre de l'apprentissage avec information privilégiée pour bénéficier des données d'entraînement complémentaires, ici les versions haute-résolution des images. Nous proposons deux méthodes d'intégration de l'information privilégiée dans l'apprentissage des réseaux de neurones. Notre premier modèle s'appuie sur ces données complémentaires pour calculer un niveau de difficulté absolue, attribuant un poids important aux images les plus facilement reconnaissables. Notre deuxième modèle introduit une contrainte de similitude entre les modèles appris sur chaque type de données. On valide expérimentalement nos deux modèles dans plusieurs cas d'application, notamment dans un contexte orienté grain-fin et sur une base de données contenant du bruit d'annotation.

Book Analyse d images par m  thode de Deep Learning appliqu  e au contexte routier en conditions m  t  orologiques d  grad  es

Download or read book Analyse d images par m thode de Deep Learning appliqu e au contexte routier en conditions m t orologiques d grad es written by Khouloud Dahmane and published by . This book was released on 2020 with total page 0 pages. Available in PDF, EPUB and Kindle. Book excerpt: De nos jours, les systèmes de vision sont de plus en plus utilisés dans le contexte routier. Ils permettent ainsi d'assurer la sécurité et faciliter la mobilité. Ces systèmes de vision sont généralement affectés par la dégradation des conditions météorologiques en présence de brouillard ou de pluie forte, phénomènes limitant la visibilité et réduisant ainsi la qualité des images. Afin d'optimiser les performances des systèmes de vision, il est nécessaire de disposer d'un système de détection fiable de ces conditions météorologiques défavorables.Il existe des capteurs météorologiques dédiés à la mesure physique, mais ils sont coûteux. Ce problème peut être résolu en utilisant les caméras qui sont déjà installées sur les routes. Ces dernières peuvent remplir simultanément deux fonctions : l'acquisition d'images pour les applications de surveillance et la mesure physique des conditions météorologiques au lieu des capteurs dédiés. Suite au grand succès des réseaux de neurones convolutifs (CNN) dans la classification et la reconnaissance d'images, nous avons utilisé une méthode d'apprentissage profond pour étudier le problème de la classification météorologique. L'objectif de notre étude est de chercher dans un premier temps à mettre au point un classifieur du temps, qui permet de discriminer entre temps « normal », brouillard et pluie. Dans un deuxième temps, une fois la classe connue, nous cherchons à développer un modèle de mesure de la distance de visibilité météorologique du brouillard. Rappelons que l'utilisation des CNN exige l'utilisation de bases de données d'apprentissage et de test. Pour cela, deux bases de données ont été utilisées, "Cerema-AWP database" (https://ceremadlcfmds.wixsite.com/cerema-databases), et la base "Cerema-AWH database", en cours d'acquisition depuis 2017 sur le site de la Fageole sur l'autoroute A75. Chaque image des deux bases est labellisée automatiquement grâce aux données météorologiques relevées sur le site permettant de caractériser diverses gammes de pluie et de brouillard. La base Cerema-AWH, qui a été mise en place dans le cadre de nos travaux, contient cinq sous-bases : conditions normales de jour, brouillard fort, brouillard faible, pluie forte et pluie faible. Les intensités de pluie varient de 0 mm/h à 70 mm/h et les visibilités météorologiques de brouillard varient entre 50m et 1800m. Parmi les réseaux de neurones connus et qui ont montré leur performance dans le domaine de la reconnaissance et la classification, nous pouvons citer LeNet, ResNet-152, Inception-v4 et DenseNet-121. Nous avons appliqué ces réseaux dans notre système de classification des conditions météorologiques dégradées. En premier lieu, une étude justificative de l'usage des réseaux de neurones convolutifs est effectuée. Elle étudie la nature de la donnée d'entrée et les hyperparamètres optimaux qu'il faut utiliser pour aboutir aux meilleurs résultats. Ensuite, une analyse des différentes composantes d'un réseau de neurones est menée en construisant une architecture instrumentale de réseau de neurones. La classification des conditions météorologiques avec les réseaux de neurones profonds a atteint un score de 83% pour une classification de cinq classes et 99% pour une classification de trois classes.Ensuite, une analyse sur les données d'entrée et de sortie a été faite permettant d'étudier l'impact du changement de scènes et celui du nombre de données d'entrée et du nombre de classes météorologiques sur le résultat de classification.Enfin, une méthode de transfert de bases de données a été appliquée. Cette méthode permet d'étudier la portabilité du système de classification des conditions météorologiques d'un site à un autre. Un score de classification de 63% a été obtenu en faisant un transfert entre une base publique et la base Cerema-AWH. (...).

Book SEGMENTATION D IMAGES COULEUR PAR MORPHOLOGIE MATHEMATIQUE ET CLASSIFICATION DE DONNEES PAR RESEAUX DE NEURONES

Download or read book SEGMENTATION D IMAGES COULEUR PAR MORPHOLOGIE MATHEMATIQUE ET CLASSIFICATION DE DONNEES PAR RESEAUX DE NEURONES written by OLIVIER.. LEZORAY and published by . This book was released on 2000 with total page 194 pages. Available in PDF, EPUB and Kindle. Book excerpt: DANS CE TRAVAIL, NOUS AVONS ETUDIE LES DIFFERENTES ETAPES UTILES A L'ELABORATION D'UN SYSTEME DE VISION PAR ORDINATEUR : LA SEGMENTATION D'IMAGES, LA CARACTERISATION D'OBJETS ET LA CLASSIFICATION DE DONNEES. NOUS AVONS DEVELOPPE DES TECHNIQUES ORIGINALES SUFFISAMMENT GENERALES PERMETTANT DE REALISER CHACUNE DE CES ETAPES. NOUS EXPOSERONS TOUT D'ABORD UNE METHODE DE SEGMENTATION D'IMAGES COULEUR DE MICROSCOPIE BASEE SUR UNE LIGNE DE PARTAGE DES EAUX UTILISANT DES INFORMATIONS LOCALES ET GLOBALES. AFIN DE POUVOIR ADAPTER LES POINTS CRITIQUES DE LA METHODE, NOUS AVONS DEFINI UNE STRATEGIE D'OPTIMISATION QUI PERMET DE DEFINIR LA FACON DE LES ABORDER ET DE LES OPTIMISER. NOUS NOUS SOMMES PLUS PARTICULIEREMENT INTERESSES AU CHOIX DE L'ESPACE COULEUR ET A L'OBTENTION DE MARQUEURS. EN PARTICULIER, NOUS AVONS DEFINI UNE STRATEGIE DE CHOIX DE L'ESPACE COULEUR BASEE SUR UNE MESURE DU CONTRASTE COULEUR A PARTIR D'INFORMATIONS A PRIORI. NOUS DETAILLONS ENSUITE UNE ARCHITECTURE DE RESEAUX DE NEURONES. SON PRINCIPE CONSISTE A SIMPLIFIER LA TACHE DU CLASSIFIEUR EN DIVISANT LE PROBLEME A RESOUDRE. L'ARCHITECTURE QUE NOUS AVONS DEFINIE PERMET DE SIMPLIFIER LA RECONNAISSANCE DES DONNEES, D'AMELIORER L'APPRENTISSAGE, DE SIMPLIFIER LA STRUCTURE DES RESEAUX DE NEURONES UTILISES MAIS PRINCIPALEMENT D'AUGMENTER LE TAUX DE RECONNAISSANCE DU CLASSIFIEUR. NOUS AVONS ILLUSTRE CES PROPRIETES PAR DES EXPERIMENTATIONS SUR DIFFERENTES BASES DE DONNEES. ENFIN, NOUS PRESENTONS L'ELABORATION D'UN SYSTEME D'AIDE AU SCREENING PAR LE TRI INFORMATIQUE CELLULAIRE. CE SYSTEME REALISE LA SYNTHESE DES METHODES PROPOSEES DANS LES DEUX PREMIERES PARTIES. IL EST TOTALEMENT AUTONOME ET PERMET LA RECONNAISSANCE DES CELLULES DE FACON TRES FIABLE (94.5% DES CELLULES ANORMALES ET 99% DES CELLULES NORMALES).

Book Contributions    L apprentissage Grande   chelle Pour la Classification D images

Download or read book Contributions L apprentissage Grande chelle Pour la Classification D images written by Zeynep Akata and published by . This book was released on 2014 with total page 0 pages. Available in PDF, EPUB and Kindle. Book excerpt: Building algorithms that classify images on a large scale is an essential task due to the difficulty in searching massive amount of unlabeled visual data available on the Internet. We aim at classifying images based on their content to simplify the manageability of such large-scale collections. Large-scale image classification is a difficult problem as datasets are large with respect to both the number of images and the number of classes. Some of these classes are fine grained and they may not contain any labeled representatives. In this thesis, we use state-of-the-art image representations and focus on efficient learning methods. Our contributions are (1) a benchmark of learning algorithms for large scale image classification, and (2) a novel learning algorithm based on label embedding for learning with scarce training data. Firstly, we propose a benchmark of learning algorithms for large scale image classification in the fully supervised setting. It compares several objective functions for learning linear classifiers such as one-vs-rest, multiclass, ranking and weighted average ranking using the stochastic gradient descent optimization. The output of this benchmark is a set of recommendations for large-scale learning. We experimentally show that, online learning is well suited for large-scale image classification. With simple data rebalancing, One-vs-Rest performs better than all other methods. Moreover, in online learning, using a small enough step size with respect to the learning rate is sufficient for state-of-the-art performance. Finally, regularization through early stopping results in fast training and a good generalization performance. Secondly, when dealing with thousands of classes, it is difficult to collect sufficient labeled training data for each class. For some classes we might not even have a single training example. We propose a novel algorithm for this zero-shot learning scenario. Our algorithm uses side information, such as attributes to embed classes in a Euclidean space. We also introduce a function to measure the compatibility between an image and a label. The parameters of this function are learned using a ranking objective. Our algorithm outperforms the state-of-the-art for zero-shot learning. It is flexible and can accommodate other sources of side information such as hierarchies. It also allows for a smooth transition from zero-shot to few-shots learning.

Book De L apprentissage de Repr  sentations Visuelles Robustes Aux Invariances Pour la Classification Et la Recherche D images

Download or read book De L apprentissage de Repr sentations Visuelles Robustes Aux Invariances Pour la Classification Et la Recherche D images written by Mattis Paulin and published by . This book was released on 2017 with total page 0 pages. Available in PDF, EPUB and Kindle. Book excerpt: This dissertation focuses on designing image recognition systems which are robust to geometric variability. Image understanding is a difficult problem, as images are two-dimensional projections of 3D objects, and representations that must fall into the same category, for instance objects of the same class in classification can display significant differences. Our goal is to make systems robust to the right amount of deformations, this amount being automatically determined from data. Our contributions are twofolds. We show how to use virtual examples to enforce robustness in image classification systems and we propose a framework to learn robust low-level descriptors for image retrieval. We first focus on virtual examples, as transformation of real ones. One image generates a set of descriptors -one for each transformation- and we show that data augmentation, ie considering them all as iid samples, is the best performing method to use them, provided a voting stage with the transformed descriptors is conducted at test time. Because transformations have various levels of information, can be redundant, and can even be harmful to performance, we propose a new algorithm able to select a set of transformations, while maximizing classification accuracy. We show that a small amount of transformations is enough to considerably improve performance for this task. We also show how virtual examples can replace real ones for a reduced annotation cost. We report good performance on standard fine-grained classification datasets. In a second part, we aim at improving the local region descriptors used in image retrieval and in particular to propose an alternative to the popular SIFT descriptor. We propose new convolutional descriptors, called patch-CKN, which are learned without supervision. We introduce a linked patch- and image-retrieval dataset based on structure from motion of web-crawled images, and design a method to accurately test the performance of local descriptors at patch and image levels. Our approach outperforms both SIFT and all tested approaches with convolutional architectures on our patch and image benchmarks, as well as several styate-of-theart datasets.

Book Apprentissage des r  seaux de neurones profonds et applications en traitement automatique de la langue naturelle

Download or read book Apprentissage des r seaux de neurones profonds et applications en traitement automatique de la langue naturelle written by Xavier Glorot and published by . This book was released on 2014 with total page pages. Available in PDF, EPUB and Kindle. Book excerpt: En apprentissage automatique, domaine qui consiste à utiliser des données pour apprendre une solution aux problèmes que nous voulons confier à la machine, le modèle des Réseaux de Neurones Artificiels (ANN) est un outil précieux. Il a été inventé voilà maintenant près de soixante ans, et pourtant, il est encore de nos jours le sujet d'une recherche active. Récemment, avec l'apprentissage profond, il a en effet permis d'améliorer l'état de l'art dans de nombreux champs d'applications comme la vision par ordinateur, le traitement de la parole et le traitement des langues naturelles. La quantité toujours grandissante de données disponibles et les améliorations du matériel informatique ont permis de faciliter l'apprentissage de modèles à haute capacité comme les ANNs profonds. Cependant, des difficultés inhérentes à l'entraînement de tels modèles, comme les minima locaux, ont encore un impact important. L'apprentissage profond vise donc à trouver des solutions, en régularisant ou en facilitant l'optimisation. Le pré-entraînnement non-supervisé, ou la technique du ``Dropout'', en sont des exemples. Les deux premiers travaux présentés dans cette thèse suivent cette ligne de recherche. Le premier étudie les problèmes de gradients diminuants/explosants dans les architectures profondes. Il montre que des choix simples, comme la fonction d'activation ou l'initialisation des poids du réseaux, ont une grande influence. Nous proposons l'initialisation normalisée pour faciliter l'apprentissage. Le second se focalise sur le choix de la fonction d'activation et présente le rectifieur, ou unité rectificatrice linéaire. Cette étude a été la première à mettre l'accent sur les fonctions d'activations linéaires par morceaux pour les réseaux de neurones profonds en apprentissage supervisé. Aujourd'hui, ce type de fonction d'activation est une composante essentielle des réseaux de neurones profonds. Les deux derniers travaux présentés se concentrent sur les applications des ANNs en traitement des langues naturelles. Le premier aborde le sujet de l'adaptation de domaine pour l'analyse de sentiment, en utilisant des Auto-Encodeurs Débruitants. Celui-ci est encore l'état de l'art de nos jours. Le second traite de l'apprentissage de données multi-relationnelles avec un modèle à base d'énergie, pouvant être utilisé pour la tâche de désambiguation de sens.

Book Architectures d apprentissage profond pour la reconnaissance d actions humaines dans des s  quences vid  o RGB D monoculaires

Download or read book Architectures d apprentissage profond pour la reconnaissance d actions humaines dans des s quences vid o RGB D monoculaires written by Huy-Hieu Pham (doctorant en informatique).) and published by . This book was released on 2019 with total page 153 pages. Available in PDF, EPUB and Kindle. Book excerpt: Cette thèse porte sur la reconnaissance d'actions humaines dans des séquences vidéo RGB-D monoculaires. La question principale est, à partir d'une vidéo ou d'une séquence d'images donnée, de savoir comment reconnaître des actions particulières qui se produisent. Cette tâche est importante et est un défi majeur à cause d'un certain nombre de verrous scientifiques induits par la variabilité des conditions d'acquisition, comme l'éclairage, la position, l'orientation et le champ de vue de la caméra, ainsi que par la variabilité de la réalisation des actions, notamment de leur vitesse d'exécution. Pour surmonter certaines de ces difficultés, dans un premier temps, nous examinons et évaluons les techniques les plus récentes pour la reconnaissance d'actions dans des vidéos. Nous proposons ensuite une nouvelle approche basée sur des réseaux de neurones profonds pour la reconnaissance d'actions humaines à partir de séquences de squelettes 3D. Deux questions clés ont été traitées. Tout d'abord, comment représenter la dynamique spatio-temporelle d'une séquence de squelettes pour exploiter efficacement la capacité d'apprentissage des représentations de haut niveau des réseaux de neurones convolutifs (CNNs ou ConvNets). Ensuite, comment concevoir une architecture de CNN capable d'apprendre des caractéristiques spatio-temporelles discriminantes à partir de la représentation proposée dans un objectif de classification. Pour cela, nous introduisons deux nouvelles représentations du mouvement 3D basées sur des squelettes, appelées SPMF (Skeleton Posture-Motion Feature) et Enhanced-SPMF, qui encodent les postures et les mouvements humains extraits des séquences de squelettes sous la forme d'images couleur RGB. Pour les tâches d'apprentissage et de classification, nous proposons différentes architectures de CNNs, qui sont basées sur les modèles Residual Network (ResNet), Inception-ResNet-v2, Densely Connected Convolutional Network (DenseNet) et Efficient Neural Architecture Search (ENAS), pour extraire des caractéristiques robustes de la représentation sous forme d'image que nous proposons et pour les classer. Les résultats expérimentaux sur des bases de données publiques (MSR Action3D, Kinect Activity Recognition Dataset, SBU Kinect Interaction, et NTU-RGB+D) montrent que notre approche surpasse les méthodes de l'état de l'art. Nous proposons également une nouvelle technique pour l'estimation de postures humaines à partir d'une vidéo RGB. Pour cela, le modèle d'apprentissage profond appelé OpenPose est utilisé pour détecter les personnes et extraire leur posture en 2D. Un réseau de neurones profond est ensuite proposé pour apprendre la transformation permettant de reconstruire ces postures en trois dimensions. Les résultats expérimentaux sur la base de données Human3.6M montrent l'efficacité de la méthode proposée. Ces résultats ouvrent des perspectives pour une approche de la reconnaissance d'actions humaines à partir des séquences de squelettes 3D sans utiliser des capteurs de profondeur comme la Kinect. Nous avons également constitué la base CEMEST, une nouvelle base de données RGB-D illustrant des comportements de passagers dans les transports publics. Elle contient 203 vidéos de surveillance collectées dans une station du métro incluant des événements "normaux" et "anormaux". Nous avons obtenu des résultats prometteurs sur cette base en utilisant des techniques d'augmentation de données et de transfert d'apprentissage. Notre approche permet de concevoir des applications basées sur des techniques de l'apprentissage profond pour renforcer la qualité des services de transport en commun.