Kapitel 1 : Gleichzeitige Lokalisierung und Kartierung
Das Berechnen des Standorts eines Agenten in einer unbekannten Umgebung bei gleichzeitiger Erstellung oder Aktualisierung einer Karte dieser Umgebung wird als Problem der gleichzeitigen Lokalisierung und Kartierung (SLAM) bezeichnet. Trotz seines offensichtlichen Henne-Ei-Charakters wurde dieses Problem durch eine Reihe von Algorithmen gelöst, die ihre Aufgaben in einer überschaubaren Zeit in bestimmten Umgebungen erledigen können. Der Partikelfilter, der erweiterte Kalman-Filter, die Kovarianz-Schnittmenge und die graphbasierte simultane Lokalisierung und Kartierung (GraphSLAM) sind beliebte Approximative-Lösungstechniken. Roboternavigation, robotisches Mapping und Odometrie für Virtual oder Augmented Reality nutzen SLAM-Algorithmen, die auf Ideen aus der Computational Geometry und Computer Vision basieren.
Das Ziel von SLAM-Algorithmen ist nicht die Perfektion, sondern die betriebliche Compliance, sodass sie immer für die zur Verfügung stehenden Ressourcen optimiert sind. Die in der Literatur beschriebenen Methoden werden in einer Vielzahl von realen Anwendungen eingesetzt, darunter autonome Fahrzeuge, Drohnen, U-Boote, Raumsonden, Haushaltsroboter und sogar der menschliche Körper selbst.
Bei einer Reihe von Kontrollen und Sensorbeobachtungen über diskrete Zeitintervalle besteht das SLAM-Problem darin, eine Schätzung des Agentenzustands und eine Karte der Umgebung zu berechnen .
Wahrscheinlichkeit liegt jedem Wertmaß zugrunde, dann ist das Ziel die Berechnung.
Die Bayes-Regel bietet einen Rahmen für die sequentielle Aktualisierung von Ortsposterioren, wenn eine Karte und eine Übergangsfunktion gegeben sind.
In ähnlicher Weise kann die Karte sukzessive aktualisiert werden durch
Eine lokale optimale Lösung für die gemeinsame Schlussfolgerung der beiden Variablen kann, wie bei vielen Inferenzproblemen, durch abwechselnde Aktualisierungen der beiden Überzeugungen in Form eines Erwartungsmaximierungsalgorithmus gefunden werden.
Kalman-Filter und Partikelfilter sind zwei Beispiele für statistische Methoden, die verwendet werden, um Annäherungen an die oben genannten Gleichungen zu liefern. Sie geben eine grobe Schätzung der posterioren Verteilung der Posen- und Map-Parameter des Roboters. Um die algorithmische Komplexität für groß angelegte Anwendungen zu reduzieren, ist es möglich, die Abhängigkeit von statistischen Unabhängigkeitsannahmen zu vermeiden, indem Methoden verwendet werden, die das obige Modell konservativ unter Verwendung von Kovarianzschnittmengen approximieren. Sie liefern ein Set, das sich der Karte annähert, und ein Set, das die aktuelle Pose des Roboters enthält. Ein weiterer gängiger Ansatz für SLAM mit Bildern ist die Bündelanpassung oder allgemeiner die maximale a posteriori estimation (MAP), bei der Posen und Orientierungspunkte gemeinsam geschätzt werden, um die Kartentreue zu verbessern. MAP wird in kommerziellen SLAM-Systemen wie ARCore von Google verwendet, dem Nachfolger von Tango (der bisherigen Augmented-Reality-Computing-Plattform des Unternehmens). Anstatt zu versuchen, die volle A-posterior-Wahrscheinlichkeit zu schätzen, berechnen MAP-Schätzer die wahrscheinlichste Erklärung für die Roboterposen und die Karte anhand der Sensordaten.
Unterschiedliche Bedürfnisse und Annahmen über die Arten von Karten, Sensoren und Modellen sind oft das, was Forscher dazu motiviert, neue SLAM-Algorithmen zu entwickeln. Viele SLAM-Systeme können in Permutationen zu diesen Themen unterteilt werden.
Anstatt sich auf die Erstellung einer geometrisch genauen Karte zu konzentrieren, erfassen topologische Karten die Konnektivität (d. h. die Topologie) der Umgebung. Die globale Konsistenz in metrischen SLAM-Algorithmen wurde mit Hilfe topologischer SLAM-Techniken erzwungen.
Im Gegensatz dazu verwenden Gitterkarten zur Darstellung eines topologischen Raums Gitter aus quadratischen oder hexagonalen diskretisierten Zellen, den besetzten Zellen, und ziehen daraus Rückschlüsse auf diese.
Um die Berechnung zu erleichtern, wird in der Regel davon ausgegangen, dass die Zellen statistisch unabhängig sind.
In diesem Sinne werden sie auf 1 gesetzt, wenn die Zellen der neuen Karte mit der Beobachtung an der Position übereinstimmen, und auf 0, wenn sie inkonsistent sind.
Die Komplexität des Kartierungsproblems in modernen selbstfahrenden Autos wurde durch die umfangreiche Nutzung von hochdetaillierten Kartendaten, die im Vorfeld gesammelt wurden, stark reduziert. Die Positionen einzelner Abschnitte der weißen Linie und der Bordsteine auf der Straße können mit Anmerkungen auf der Karte markiert werden. Maps kann auch Bilder mit Geotags wie Google Street View enthalten. Im Wesentlichen reduzieren diese Systeme das SLAM-Problem auf eine reine Lokalisierungsaufgabe, indem sie es möglicherweise ermöglichen, sich bewegende Objekte wie Autos und Personen in Echtzeit zur Karte hinzuzufügen.
Die Stärken und Schwächen verschiedener Sensortypen waren ein wichtiger Motivator für die Entwicklung neuer Algorithmen für SLAM. Um metrische Verzerrungen und Messrauschen zu überwinden, ist statistische Unabhängigkeit unerlässlich. Es sind die Annahmen von SLAM-Algorithmen, die je nach verwendetem Sensortyp variieren. Punktwolken, die aus Laserscans oder visuellen Merkmalen generiert werden, können bei jedem Schritt einfach und eindeutig per Bildregistrierung ausgerichtet werden, so dass in diesen Fällen keine SLAM-Inferenz erforderlich ist. Taktile Sensoren sind jedoch äußerst spärlich, da sie nur Informationen über Punkte in unmittelbarer Nähe des Wirkstoffs liefern. Daher erfordert rein taktiles SLAM robuste Vorgängermodelle, um diese Einschränkung auszugleichen. Die überwiegende Mehrheit der SLAM-Aufgaben liegt zwischen diesen beiden Modalitäten.
Es gibt zwei Hauptkategorien von Sensormodellen: Rohdatenmodelle und Landmark-basierte Modelle.
Ein Landmark ist ein global unterscheidbares physisches Merkmal, dessen Standort mit Hilfe eines Sensors bestimmt werden kann, wie z. B. drahtlose APs oder Richtfunksender.
Die Rohdatenmethode geht nicht davon aus, dass erkennbare Landmarken vorhanden sind, und modelliert stattdessen direkt als Funktion des Standorts.
Beispiele für optische Sensoren sind Einzel- und Dual-Laser-Entfernungsmesser, High-Definition- und Flash-Lidar, zwei- und dreidimensionales Sonar sowie zwei- und dreidimensionale Kameras.
Hochpräzise Differential-GPS-Sensoren haben SLAM in einigen Außenanwendungen nahezu überflüssig gemacht. Diese könnten als Ortssensoren mit scharfen Wahrscheinlichkeiten interpretiert werden, die die Inferenz aus einer gleichzeitigen Lokalisierungs- und Kartierungsperspektive völlig überwältigen. Einige Robotikanwendungen sind jedoch besonders besorgt über den gelegentlichen Rückgang oder den vollständigen Ausfall von GPS-Sensoren, z. B. in Zeiten militärischer Konflikte.
Der Begriff steht für die Kinematik des Modells, die typischerweise Details über die Anweisungen enthält, die einem Roboter gegeben werden.
Das Modell umfasst, die Kinematik des Roboters ist ebenfalls enthalten, Abschätzungen der Erfassungsleistung unter Eigen- und Umgebungsgeräuschen.
Die Eingaben der verschiedenen Sensoren werden durch das dynamische Modell, die Unsicherheitsmodelle, fair gewichtet und konvergieren zu einer klaren digitalen Darstellung des Raums, wobei die Position und Richtung des Roboters durch eine Wolke von Wahrscheinlichkeiten dargestellt werden.
Die ultimative Darstellung eines solchen Modells wird als Karte bezeichnet. Die Karte kann eine wörtliche Darstellung des Modells oder ein generischer Name dafür sein.
Die Kinematik von zweidimensionalen Robotern wird in der Regel mit zusätzlichem Motorgeräusch implementiert, das auf einer Kombination aus Rotations- und "Vorwärts"-Befehlen basiert. Obwohl häufig eine Gaußsche Näherung verwendet wird, ist die Verteilung, die durch unabhängiges Rauschen in Winkel- und Linearrichtung gebildet wird, nicht Gaußsch. Alternativ können Odometriedaten von den Rädern des Roboters nach jedem Befehl ausgelesen und als Sensorinformationen und nicht als Kinematik behandelt werden.
Das häufige SLAM-Problem wurde auf den akustischen Bereich ausgeweitet, wo die 3D-Position von Schallquellen zur Darstellung von Umgebungen verwendet wird. Akustisches SLAM hingegen hat Probleme mit Nachhall, Inaktivität und Lärm, da diese Merkmale akustisch abgeleitet sind.
Als Rahmen für die Verschmelzung von wegweisenden Merkmalen, die sowohl aus den auditiven als auch aus den visuellen Modalitäten innerhalb einer Umgebung gewonnen werden, wurde audiovisuelles SLAM ursprünglich für die Mensch-Roboter-Interaktion entwickelt. Daher müssen SLAM-Algorithmen für menschenzentrierte Roboter und Maschinen Merkmale berücksichtigen, die sowohl in den visuellen als auch in den akustischen Modalitäten wahrgenommen werden und die menschliche Interaktion charakterisieren. Eine genauere Darstellung der Welt kann mit Hilfe eines audiovisuellen Rahmens konstruiert werden, der visuelle Merkmale wie die menschliche Pose und akustische Merkmale wie die menschliche Sprache verwendet, um die Standorte menschlicher Sehenswürdigkeiten zu schätzen und zu kartieren. Monokulare Kameras und mikroelektronische Mikrofonarrays sind Beispiele für stromsparende, leichte Geräte, die in mobilen Robotikanwendungen nützlich sein können (denken Sie an Drohnen und Serviceroboter). Durch die Kombination des vollen Sichtfelds und der ungehinderten Merkmalsdarstellung von Audiosensoren mit dem begrenzten Sichtfeld, den Merkmalsverdeckungen und optischen Verschlechterungen leichter visueller Sensoren kann...