Chapitre 1 : Traitement d'images numériques
Pour faire simple, le traitement d'images numériques est la manipulation algorithmique d'images numériques sur un ordinateur numérique. Le traitement numérique de l'image, un sous-domaine du traitement numérique du signal, offre de nombreux avantages par rapport à son prédécesseur analogique. Il permet d'utiliser plus d'algorithmes sur les données d'entrée et permet d'éviter l'accumulation de problèmes tels que le bruit et la distorsion. Le traitement d'images numériques peut être décrit comme des systèmes multidimensionnels en raison du fait que les images sont spécifiées sur deux dimensions (ou plus). L'avancement de la technologie informatique, la croissance des mathématiques (en particulier le développement et l'amélioration de la théorie des mathématiques discrètes) et la demande croissante de traitement d'images numériques dans divers domaines, notamment l'environnement, l'agriculture, l'armée, l'industrie et la médecine, sont les principales influences sur sa création et sa croissance.
Le traitement numérique de l'image, ou traitement d'image numérique comme on l'appelait auparavant, a été lancé dans les années 1960 par un certain nombre d'institutions de recherche, dont Bell Laboratories, le Jet Propulsion Laboratory, le MIT, l'Université du Maryland et d'autres pour une utilisation dans des domaines tels que l'imagerie satellite, la conversion de normes filaires, l'imagerie médicale, le vidéophone, la reconnaissance de caractères et l'amélioration des photographies.
Cependant, compte tenu de la technologie disponible à l'époque, le coût de traitement était plutôt élevé. Dans les années 1970, cependant, le traitement numérique de l'image a explosé à mesure que les ordinateurs bon marché et le matériel spécialisé sont devenus largement accessibles. Par conséquent, des défis tels que la conversion des normes de télévision pourraient être relevés en temps réel à l'aide du traitement d'image. Les ordinateurs à usage général ont commencé à remplacer le matériel spécialisé pour toutes les tâches, sauf les plus coûteuses en calcul, à mesure que leurs vitesses de traitement augmentaient. Avec l'avènement d'ordinateurs puissants et de processeurs de signal dans les années 2000, le traitement d'images numériques a rapidement remplacé les techniques analogiques en tant que référence dans l'industrie.
La transformée en cosinus discret (DCT) était une innovation clé dans la technologie de compression d'images numériques qui a été initialement présentée par Nasir Ahmed en 1972.
Dans les années 1970, l'utilisation généralisée de la technologie MOS a radicalement modifié le domaine du traitement électronique du signal.
Le gadget de tomodensitométrie à rayons X (souvent connu sous le nom de CT) pour le diagnostic de la tête a été créé en 1972 par l'ingénieur de l'entreprise britannique EMI Housfield (tomographie par ordinateur). La technique du noyau CT repose sur la projection d'une coupe transversale d'une tête humaine, qui est ensuite traitée numériquement pour recréer l'image en coupe transversale. Les images tomographiques de différentes sections du corps humain ont été produites clairement lorsque EMI a créé un appareil de tomodensitométrie du corps entier en 1975. Cette méthode de diagnostic a reçu le prix Nobel en 1979.
En raison de l'utilisation d'algorithmes plus complexes, le traitement d'images numériques peut fournir à la fois de meilleures performances sur les tâches de base et l'introduction de techniques qui seraient difficiles à mettre en ouvre avec un équipement analogique.
Le traitement d'images numériques, en particulier, est à la fois une application utile et une technologie qui repose sur :
Classification
Extraction de caractéristiques
Analyse du signal à plusieurs échelles
Reconnaissance de formes
Projection
Exemples de méthodes utilisées par le traitement d'images numériques :
Diffusion anisotrope
Modèles de Markov cachés
Retouche d'image
Restauration d'image
Analyse indépendante des composants
Filtrage linéaire
Réseaux neuronaux
Équations aux dérivées partielles
Pixellisation
Correspondance d'entités ponctuelles
Analyse en composantes principales
Des cartes qui s'organisent toutes seules
Ondelettes
Pour adoucir ou affiner les photos numériques, il suffit d'appliquer un filtre adapté. Il est possible de filtrer les données par :
convolution dans le domaine spatial à l'aide d'un ensemble de noyaux bien conçus (filtres).
masquage du domaine fréquentiel (Fourier) pour masquer certaines fréquences
Les deux approches sont présentées ci-dessous :
Avant d'être traduites dans l'espace de Fourier, les images sont souvent rembourrées ; Les images filtrées passe-haut ci-dessous montrent les effets de différentes méthodes de remplissage :
Par rapport au remplissage répété des bords, le remplissage nul fait que le filtre passe-haut affiche un ensemble supplémentaire de bords.
Filtrage passe-haut dans le domaine spatial : une démonstration MATLAB.
img=damier(20) ; % générer un damier
% ************************** DOMAINE SPATIAL ***************************
klaplace=[0 -1 0 ; -1 5 -1 ; 0 -1 0] ; % de noyau de filtre laplacien
X=conv2(img,klaplace) ; % convolution du test img avec
% 3x3 Grains laplaciens
figure()
imshow(X,[]) % show Laplacien filtré
title('Détection des bords laplaciens')
Des exemples de la façon dont les transformations affines peuvent être utilisées pour effectuer des manipulations d'image fondamentales, y compris la mise à l'échelle, la rotation, la translation, la réflexion et le cisaillement, sont présentés ci-dessous :
La matrice affine est appliquée à une image en la transformant d'abord en une matrice où chaque entrée représente l'intensité d'un seul pixel. Une fois que la ligne et la colonne d'un pixel dans la matrice d'image sont connues, la position d'un pixel peut être représentée par un vecteur montrant les coordonnées de ce pixel dans l'image, [x, y]. Cela permet de multiplier la coordonnée par une matrice de transformation affine, qui à son tour donne la valeur en pixels de l'image de sortie à l'emplacement souhaité.
Toutefois, des coordonnées homogènes 3D sont requises pour les transformations qui incluent des transformations de translation. Le nouveau système de coordonnées ressemble à ceci : [x, y, 1], avec la troisième dimension attribuée à une constante non nulle (généralement 1). Cela permet des décalages de translation en multipliant le vecteur de coordonnées par une matrice 3 par 3. Ainsi, parce que 1 est une constante, la troisième dimension permet la traduction.
Comme la multiplication matricielle est associative, si de nombreuses transformations affines sont effectuées en séquence, elles peuvent être réduites en une seule transformation affine en multipliant leurs matrices respectives. Lorsqu'elle est appliquée à un vecteur ponctuel, la matrice résultante a le même effet que l'application des transformations individuelles [x, y, 1] dans l'ordre. Cela signifie qu'une liste de matrices de transformation affine peut être simplifiée en une seule.
Les coordonnées bidimensionnelles, par exemple, ne peuvent être tournées que par rapport au point zéro (0, 0). Cependant, tout point peut être ramené à l'origine (0, 0) en coordonnées homogènes 3D, pivoté, puis ramené à sa position d'origine (l'opposé de la première translation). En combinant ces trois transformations affines en une seule matrice, nous pouvons faire pivoter l'image autour de n'importe quel point donné.
Le débruitage des photographies est une tâche bien adaptée à la morphologie mathématique. La morphologie mathématique repose fortement sur des éléments structurels.
Les composants structurels sont abordés dans les exemples suivants. Ci-dessous et sous forme de tableau, nous voyons la fonction de débruitage, l'image comme I, et l'élément structurel comme B.
Par ex.
Quelle est la signification du terme « dilatation » ?, B)(i,j) = .
Autoriser la dilatation(I,B) = D. (I,B)
D(I', B)(1,1) =
Clarifier le sens du terme « érosion », B)(i,j) = .
Supposons l'érosion(I,B) = E. (I,B)
E(I', B)(1,1) =
Après la dilatation Après l'érosion
Lors de l'ouverture, l'érosion se produit en premier, suivie de la dilatation, et lors de la fermeture, la dilatation vient en premier, suivie de l'érosion. En pratique, la convolution peut être utilisée pour mettre en ouvre à la fois le D(I,B) et le E(I,B).
Le débruitage est une technique utilisée pour supprimer le bruit des images, l'image a été mise en niveaux de gris.
Un masque avec méthode de débruitage est une matrice logique avec .
Les techniques de débruitage utilisent une approche centrale à mi-hauteur, largeur partielle, puis arrêt au numéro de la ligne où l'image se termine, numéro de colonne.
Il s'agit d'un bloc d'image dont la bordure est [le point en dessous du centre : le point au-dessus du centre] ; il s'agit d'un voisin, [Le point à gauche du centre : le point à droite du centre.].
Convolution Remplacez le noyau par un petit groupe de voisins et un élément structurel.
Considérez la technique de clôture.
Dilatation d'abord
Matlab est utilisé pour lire l'image et la mettre en niveaux de...