Cette thèse s'attachera à présenter une nouvelle approche pour séparer les formules mathématiques des autres composantes rédactionnelles d¿un document mathématique sans passer par un système de reconnaissance optique de caractères. L¿extraction se fait d¿abord par repérage des opérateurs mathématiques les plus significatifs d¿une formule, puis par extension du contexte aux opérateurs avoisinants jusqüà la délimitation totale de l¿espace de la formule. L¿étiquetage est réalisé à partir de modèles créés lors d¿une phase d¿apprentissage utilisant la logique floue. Le taux d¿étiquetage primaire est de l¿ordre de 95.3%. Mais l'étiquetage secondaire accroît ce taux d¿environ 4%. Les résultats obtenus montrent l¿applicabilité de notre méthode puisque 93% des formules mathématiques ont pu être extraites d'images de documents de bonne qualité d¿impression. Cette thèse synthétise le travail effectué, pose les problèmes rencontrés et discute des résultats obtenus.
Reihe
Sprache
Produkt-Hinweis
Broschur/Paperback
Klebebindung
Illustrationen
Illustrations, black and white
Maße
Höhe: 220 mm
Breite: 150 mm
Dicke: 16 mm
Gewicht
ISBN-13
978-613-1-59063-4 (9786131590634)
Copyright in bibliographic data and cover images is held by Nielsen Book Services Limited or by the publishers or by their respective licensors: all rights reserved.
Schweitzer Klassifikation
Docteur en informatique, maître Assistante à l'Ecole Supérieure des Sciences et Techniques de Tunis, auteur de plusieurs articles publiés dans des revues et conférences nationales et internationales (IJDAR, ICDAR, ICPR, DRR, CIFED...), membre responsable à UTIC: Unité de Recherche sur les Technologies de l'Information et de Communication