Datenzusammenführung - Data fusion

Die Fusion der Daten aus zwei Quellen (Dimensionen 1 und 2) kann einen Klassifikator ergeben , der allen Klassifikatoren überlegen ist, die nur auf Dimension 1 oder Dimension 2 basieren.

Bei der Datenfusion handelt es sich um den Prozess der Integration mehrerer Datenquellen, um konsistentere, genauere und nützlichere Informationen zu erhalten, als dies von jeder einzelnen Datenquelle bereitgestellt wird.

Datenfusionsprozesse werden oft als niedrig, mittel oder hoch kategorisiert, abhängig von der Verarbeitungsstufe, in der die Fusion stattfindet. Bei der Low-Level-Datenfusion werden mehrere Rohdatenquellen kombiniert, um neue Rohdaten zu erzeugen. Es wird erwartet, dass fusionierte Daten informativer und synthetischer sind als die ursprünglichen Eingaben.

Beispielsweise wird die Sensorfusion auch als (Multisensor-)Datenfusion bezeichnet und ist eine Teilmenge der Informationsfusion .

Das Konzept der Datenfusion hat seinen Ursprung in der gewachsenen Fähigkeit von Mensch und Tier, Informationen aus mehreren Sinnen zu integrieren, um ihre Überlebensfähigkeit zu verbessern. Beispielsweise kann eine Kombination aus Sehen, Fühlen, Riechen und Schmecken anzeigen, ob eine Substanz essbar ist.

Das JDL/DFIG-Modell

Joint Director of the Labs (JDL)/Data Fusion Information Group (DFIG) Modell

Mitte der 1980er Jahre bildeten die Joint Directors of Laboratories das Data Fusion Subpanel (das später als Data Fusion Group bekannt wurde). Mit dem Aufkommen des World Wide Web umfasste die Datenfusion somit Daten-, Sensor- und Informationsfusion. Die JDL/DFIG führte ein Modell der Datenfusion ein, das die verschiedenen Prozesse aufteilte. Derzeit sind die sechs Ebenen des Data Fusion Information Group (DFIG)-Modells:

Ebene 0: Quellenvorverarbeitung (oder Datenbewertung )

Stufe 1: Objektbewertung

Stufe 2: Situationsbewertung

Stufe 3: Folgenabschätzung (oder Bedrohungsverfeinerung )

Stufe 4: Prozessverfeinerung (oder Ressourcenmanagement )

Stufe 5: Benutzerverfeinerung (oder kognitive Verfeinerung )

Level 6: Missionsverfeinerung (oder Missionsmanagement )

Obwohl das JDL-Modell (Level 1–4) heute noch verwendet wird, wird es oft kritisiert, weil es impliziert, dass die Levels notwendigerweise der Reihe nach ablaufen, und auch wegen seiner fehlenden angemessenen Darstellung des Potenzials für einen Human-in-the-Loop . Das DFIG-Modell (Stufe 0–5) untersuchte die Auswirkungen von Situationsbewusstsein, Benutzerverfeinerung und Missionsmanagement. Trotz dieser Mängel sind die JDL/DFIG-Modelle nützlich für die Visualisierung des Datenfusionsprozesses, erleichtern die Diskussion und das gemeinsame Verständnis und sind wichtig für das Design der Informationsfusion auf Systemebene.

Geodatenanwendungen

Im Bereich Geodaten ( GIS ) ist Datenfusion oft gleichbedeutend mit Datenintegration . Bei diesen Anwendungen besteht häufig die Notwendigkeit, verschiedene Datensätze zu einem einheitlichen (fusionierten) Datensatz zu kombinieren, der alle Datenpunkte und Zeitschritte aus den Eingabedatensätzen enthält. Der fusionierte Datensatz unterscheidet sich von einem einfachen kombinierten Superset dadurch, dass die Punkte im fusionierten Datensatz Attribute und Metadaten enthalten, die für diese Punkte im ursprünglichen Datensatz möglicherweise nicht enthalten waren.

Ein vereinfachtes Beispiel dieses Prozesses ist unten gezeigt, wo der Datensatz "α" mit dem Datensatz β fusioniert wird, um den fusionierten Datensatz δ zu bilden. Datenpunkte in der Menge "α" haben die räumlichen Koordinaten X und Y und die Attribute A1 und A2. Datenpunkte in der Menge β haben räumliche Koordinaten X und Y und Attribute B1 und B2. Der fusionierte Datensatz enthält alle Punkte und Attribute.

Eingabedatensatz α Eingabedatensatz β Zusammengeführter Datensatz δ
Punkt x Ja A1 A2
α1 10 10 m n
α2 10 30 m n
α3 30 10 m n
α4 30 30 m n
Punkt x Ja B1 B2
β1 20 20 Q R
β2 20 40 Q R
β3 40 20 Q R
β4 40 40 Q R
Punkt x Ja A1 A2 B1 B2
δ1 10 10 m n Q? R?
δ2 10 30 m n Q? R?
3 30 10 m n Q? R?
δ4 30 30 m n Q? R?
5 20 20 M? N? Q R
6 20 40 M? N? Q R
δ7 40 20 M? N? Q R
δ8 40 40 M? N? Q R

In einem einfachen Fall, in dem alle Attribute über den gesamten Analysebereich einheitlich sind, können die Attribute einfach zugewiesen werden: M?, N?, Q?, R? zu M, N, Q, R. In einer realen Anwendung sind die Attribute nicht einheitlich und eine Art von Interpolation ist normalerweise erforderlich, um den Datenpunkten in der fusionierten Menge die Attribute richtig zuzuordnen.

Visualisierung von fusionierten Datensätzen für Steinhummerspuren in der Tasmansee. Bild erzeugt mit der Eonfusion- Software von Myriax Pty. Ltd.

In einer viel komplizierteren Anwendung verwenden Meerestierforscher die Datenfusion, um Tierverfolgungsdaten mit bathymetrischen , meteorologischen , Meeresoberflächentemperatur- (SST) und Tierlebensraumdaten zu kombinieren , um die Lebensraumnutzung und das Tierverhalten als Reaktion auf externe Kräfte wie das Wetter zu untersuchen und zu verstehen oder Wassertemperatur. Jeder dieser Datensätze weist ein anderes räumliches Raster und eine andere Abtastrate auf, sodass eine einfache Kombination wahrscheinlich zu falschen Annahmen führen und die Ergebnisse der Analyse verfälschen würde. Durch die Datenfusion werden jedoch alle Daten und Attribute in einer einzigen Ansicht zusammengeführt, in der ein vollständigeres Bild der Umgebung entsteht. Auf diese Weise können Wissenschaftler wichtige Orte und Zeiten identifizieren und neue Erkenntnisse über die Wechselwirkungen zwischen Umwelt und Tierverhalten gewinnen.

In der Abbildung rechts werden Felsenhummer vor der Küste Tasmaniens untersucht. Hugh Pederson von der University of Tasmania verwendete eine Datenfusionssoftware, um die Tracking-Daten des südlichen Felsenhummers (farbcodiert für Tag und Nacht in Gelb bzw.

Datenintegration

Bei Anwendungen außerhalb des Geobereichs gelten Unterschiede in der Verwendung der Begriffe Datenintegration und Datenfusion. In Bereichen wie Business Intelligence wird beispielsweise Datenintegration verwendet, um das Zusammenführen von Daten zu beschreiben, während Datenfusion eine Integration mit anschließender Reduzierung oder Ersetzung ist. Die Datenintegration kann als Satzkombination angesehen werden, bei der der größere Satz beibehalten wird, während die Fusion eine Satzreduktionstechnik mit verbessertem Vertrauen ist.

Anwendungsbereiche

Von mehreren Verkehrserfassungsmodalitäten

Die Daten der verschiedenen Sensing-Technologien können auf intelligente Weise kombiniert werden, um den Verkehrszustand genau zu bestimmen. Es hat sich gezeigt, dass ein auf Datenfusion basierender Ansatz, der die am Straßenrand gesammelten Akustik-, Bild- und Sensordaten verwendet, die Vorteile der verschiedenen Einzelmethoden kombiniert.

Entscheidungsfusion

In vielen Fällen sind geografisch verteilte Sensoren stark energie- und bandbreitenbegrenzt. Daher werden die Rohdaten zu einem bestimmten Phänomen oft in wenigen Bits von jedem Sensor zusammengefasst. Beim Rückschluss auf ein binäres Ereignis (dh oder ) werden im Extremfall nur binäre Entscheidungen von Sensoren an ein Decision Fusion Center (DFC) gesendet und kombiniert, um eine verbesserte Klassifikationsleistung zu erzielen.

Für ein verbessertes Kontextbewusstsein

Mit einer Vielzahl von integrierten Sensoren, einschließlich Bewegungssensor, Umgebungssensor, Positionssensor, bietet ein modernes Mobilgerät typischerweise mobilen Anwendungen Zugriff auf eine Reihe von sensorischen Daten, die zur Verbesserung des Kontextbewusstseins genutzt werden könnten. Durch die Verwendung von Signalverarbeitungs- und Datenfusionstechniken wie Merkmalsgenerierung, Machbarkeitsstudie und Hauptkomponentenanalyse (PCA) werden solche sensorischen Daten die positive Klassifikationsrate der Bewegung und des kontextrelevanten Status des Geräts erheblich verbessern. Viele kontextgestützte Informationstechniken werden von Snidaro et al.

Siehe auch

Verweise

Quellen

Allgemeine Referenzen

Literaturverzeichnis

  • Halle, David L.; McMullen, Sonya AH (2004). Mathematische Techniken in der Multisensor-Datenfusion, Zweite Auflage . Norwood, MA: Artech House, Inc. ISBN 978-1-5805-3335-5.
  • Mitchell, HB (2007). Multisensor-Datenfusion – eine Einführung . Berlin: Springer-Verlag. ISBN 978-3-540-71463-7.
  • Das, S. (2008). Datenfusion auf hohem Niveau . Norwood, MA: Artech House-Verleger. ISBN 978-1-59693-281-4.

Externe Links