75 research outputs found
Analyse d'images de documents anciens : Catégorisation de contenus par approche texture
Nous proposons une caractérisation du contenu des ouvrages anciens basée sur une approche texture non paramétrique. Cette démarche se veut générique et adaptable à tout type d'ouvrages en s'appuyant sur l'homogénéité des textures que l'on retrouve dans un ouvrage. En appliquant à plusieurs résolutions 5 algorithmes d'extractions de textures il est possible de caractériser le contenu des pages d'un ouvrage. Cette méthode est appliquée sur des pages d'ouvrages anciens du 16ème siècle
Analyse d'Images de Documents Anciens: une Approche Texture
In this article, we propose a method of characterization of images of old documents based on a texture approach. This characterization is carried out with the help of a multi-resolution study of the textures contained in the images of the document. Thus, by extracting five features linked to the frequencies and to the orientations in the different areas of a page, it is possible to extract and compare elements of high semantic level without expressing any hypothesis about the physical or logical structure of the analysed documents. Experimentations demonstrate the performance of our propositions and the advances that they represent in terms of characterization of content of a deeply heterogeneous corpus.Dans cet article, nous proposons une méthode de caractérisation d'images d'ouvrages anciens basée sur une approche texture. Cette caractérisation est réalisée à l'aide d'une étude multirésolution des textures contenues dans les images de documents. Ainsi, en extrayant cinq indices liés aux fréquences et aux orientations dans les différentes parties d'une page, il est possible d'extraire et de comparer des éléments de haut niveau sémantique sans émettre d'hypothèses sur la structure physique ou logique des documents analysés. Des expérimentations montrent la faisabilité de la réalisation d'outils d'aide à la navigation ou d'aide à l'indexation. Au travers de ces expérimentations, nous mettrons en avant la pertinence de ces indices et les avancées qu'ils représentent en terme de caractérisation de contenu d'un corpus fortement hétérogène
Old document image analysis : a texture approach
In this article, we propose a method of characterization of images of old documents based on a texture approach. This
characterization is carried out with the help of a multi-resolution study of the textures contained in the images of the
document. Thus, by extracting five features linked to the frequencies and to the orientations in the different areas of a
page, it is possible to extract and compare elements of high semantic level without expressing any hypothesis about the
physical or logical structure of the analysed documents. Experimentations demonstrate the performance of our
propositions and the advances that they represent in terms of characterization of content of a deeply heterogeneous
corpus.Dans cet article, nous proposons une méthode de caractérisation d’images d’ouvrages anciens basée sur une
approche texture. Cette caractérisation est réalisée à l’aide d’une étude multirésolution des textures
contenues dans les images de documents. Ainsi, en extrayant cinq indices liés aux fréquences et aux
orientations dans les différentes parties d’une page, il est possible d’extraire et de comparer des éléments de
haut niveau sémantique sans émettre d’hypothèses sur la structure physique ou logique des documents
analysés. Des expérimentations montrent la faisabilité de la réalisation d’outils d’aide à la navigation ou d’aide
à l’indexation. Au travers de ces expérimentations, nous mettrons en avant la pertinence de ces indices et les
avancées qu’ils représentent en terme de caractérisation de contenu d’un corpus fortement hétérogène
Évaluation de la qualité des documents anciens numérisés
Les travaux de recherche présentés dans ce manuscrit décrivent plusieurs apports au thème de l évaluation de la qualité d images de documents numérisés. Pour cela nous proposons de nouveaux descripteurs permettant de quantifier les dégradations les plus couramment rencontrées sur les images de documents numérisés. Nous proposons également une méthodologie s appuyant sur le calcul de ces descripteurs et permettant de prédire les performances d algorithmes de traitement et d analyse d images de documents. Les descripteurs sont définis en analysant l influence des dégradations sur les performances de différents algorithmes, puis utilisés pour créer des modèles de prédiction à l aide de régresseurs statistiques. La pertinence, des descripteurs proposés et de la méthodologie de prédiction, est validée de plusieurs façons. Premièrement, par la prédiction des performances de onze algorithmes de binarisation. Deuxièmement par la création d un processus automatique de sélection de l algorithme de binarisation le plus performant pour chaque image. Puis pour finir, par la prédiction des performances de deux OCRs en fonction de l importance du défaut de transparence (diffusion de l encre du recto sur le verso d un document). Ce travail sur la prédiction des performances d algorithmes est aussi l occasion d aborder les problèmes scientifiques liés à la création de vérités-terrains et d évaluation de performances.This PhD. thesis deals with quality evaluation of digitized document images. In order to measure the quality of a document image, we propose to create new features dedicated to the characterization of most commons degradations. We also propose to use these features to create prediction models able to predict the performances of different types of document analysis algorithms. The features are defined by analyzing the impact of a specific degradation on the results of an algorithm and then used to create statistical regressors.The relevance of the proposed features and predictions models, is analyzed in several experimentations. The first one aims to predict the performance of different binarization methods. The second experiment aims to create an automatic procedure able to select the best binarization method for each image. At last, the third experiment aims to create a prediction model for two commonly used OCRs. This work on performance prediction algorithms is also an opportunity to discuss the scientific problems of creating ground-truth for performance evaluation.BORDEAUX1-Bib.electronique (335229901) / SudocSudocFranceF
Analyse d images de documents anciens (une approche texture)
My phd thesis subject is related to the topic of old documents images indexation. The corpus of old documents has specific characteristics. The content (text and image) as well as the layout information are strongly variable. Thus, it is not possible to work on this corpus such as it usually done with contemporary documents. Indeed, the first tests which we realised on the corpus of the Centre d Etude de la Renaissance , with which we work, confirmed that the traditional approaches (driven model approaches) are not very efficient because it s impossible to put assumptions on the physical or logical structure of the old documents. We also noted the lack of tools allowing the indexing of large old documents images databases. In this phd work, we propose a new generic method which permits characterization of the contents of old documents images. This characterization is carried out using a multirésolution study of the textures contained in the images of documents. By constructing signatures related with the frequencies and the orientations of the various parts of a page it is possible to extract, compare or to identify different kind of semantic elements (reference letters, illustrations, text, layout...) without making any assumptions about the physical or logical structure of the analyzed documents. These textures information are at the origin of creation of indexing tools for large databases of old documents images.Mes travaux de thèse sont liés à la problématique de l'indexation de grosses quantités d'images de documents anciens. Ils visent à traiter un corpus de documents dont le contenu (texte et image) ainsi que la mise en page se trouvent être fortement variables (l'ensemble des ouvrages d'une bibliothèque par exemple). Ainsi, il n'est donc pas envisageable de travailler sur ce corpus tel qu'on le fait habituellement avec les documents contemporains. En effet, les premiers tests que nous avons effectués sur le corpus du Centre d'Etudes Supérieures de la Renaissance de Tours, avec qui nous travaillons, ont confirmé que les approches classiques (guidée par le modèle) sont peu efficaces car il est impossible d'émettre des hypothèses sur la structure physique ou logique des documents traités.. Nous avons également constaté le manque d'outils permettant l'indexation de grandes bases d'images de documents anciens Face à ce double constat, ces travaux de thèse nous ont amené à proposer une méthode de caractérisation du contenu d'images de documents anciens. Cette caractérisation est réalisée à l'aide d'une étude multirésolution des textures contenues dans les images de document. Ainsi, en extrayant des signatures liées aux fréquences et aux orientations des différentes parties d'une page, il est possible d'extraire, de comparer ou encore d'identifier des éléments de haut niveau sémantique (lettrines, illustrations, texte, mise en page...) sans émettre d'hypothèses sur la structure physique ou logique des documents analysés. Ces indices textures ont permis la création d'outils d'aide à l'indexation de grosses bases d'images de documents anciens.LA ROCHELLE-BU (173002101) / SudocTOURS-Polytech'Informat.Product. (372612209) / SudocSudocFranceF
Graph-based Analysis of Hierarchical Embedding Generated by Deep Neural Network
International audienceIn a previous work, we have developed a framework for the multimodal and hierarchical classification of images from soil remediation reports. We extended this work using Deep Metric Learning (DML) as an additional training step to improve embeddings quality and obtained 84.24% of weighted F1 score for the level 5th hierarchical level. However, the standard classifier performance metrics are insufficient to explain the decision process reasoning. So far of our knowledge, there are no methods to analyze hierarchical classification algorithms. In this work, we propose a method of graph analysis to describe the embeddings that represent the extended classifier, which we believe properly interprets the obtained results than classification metrics. We illustrate the method of analyzing hierarchical classification algorithms on private dataset, but the method remains generic enough to be used in other contexts
Massive, Free and Reproducible Grountruthed Document Image Databases Generation with DocCreator
International audienc
Graph-based Analysis of Hierarchical Embedding Generated by Deep Neural Network
International audienceIn a previous work, we have developed a framework for the multimodal and hierarchical classification of images from soil remediation reports. We extended this work using Deep Metric Learning (DML) as an additional training step to improve embeddings quality and obtained 84.24% of weighted F1 score for the level 5th hierarchical level. However, the standard classifier performance metrics are insufficient to explain the decision process reasoning. So far of our knowledge, there are no methods to analyze hierarchical classification algorithms. In this work, we propose a method of graph analysis to describe the embeddings that represent the extended classifier, which we believe properly interprets the obtained results than classification metrics. We illustrate the method of analyzing hierarchical classification algorithms on private dataset, but the method remains generic enough to be used in other contexts
Massive, free and reproducible grountruthed document image databases generation with DocCreator
International audienc
- …
