Visuelle Objekterkennung (Tiertest) - Visual object recognition (animal test)

Visuelle Objekterkennung bezieht sich auf die Fähigkeit, die sichtbaren Objekte basierend auf einer visuellen Eingabe zu identifizieren. Eine wichtige Signatur der visuellen Objekterkennung ist die "Objektinvarianz" oder die Fähigkeit, Objekte über Änderungen des detaillierten Kontexts hinweg zu identifizieren, in dem Objekte betrachtet werden, einschließlich Änderungen in Beleuchtung, Objektpose und Hintergrundkontext.

Grundstufen der Objekterkennung

Neuropsychologische Beweise bestätigen, dass es vier spezifische Phasen im Prozess der Objekterkennung gibt. Diese Phasen sind:

Stufe 1 Verarbeitung grundlegender Objektkomponenten wie Farbe, Tiefe und Form.
Stufe 2 Diese Grundkomponenten werden dann auf der Grundlage von Ähnlichkeit gruppiert und liefern Informationen über unterschiedliche Kanten der visuellen Form. Anschließend kann eine Figur-Grund- Segregation erfolgen.
Stufe 3 Die visuelle Darstellung wird mit strukturellen Beschreibungen im Gedächtnis abgeglichen.
Stufe 4 Semantische Attribute werden auf die visuelle Darstellung angewendet, um Bedeutung und damit Wiedererkennung zu gewährleisten.

Innerhalb dieser Phasen gibt es spezifischere Prozesse, die stattfinden, um die verschiedenen Verarbeitungskomponenten zu vervollständigen. Darüber hinaus haben andere bestehende Modelle im Gegensatz zu dieser allgemeinen Hierarchie von unten nach oben integrative Hierarchien (von oben nach unten und von unten nach oben) sowie eine parallele Verarbeitung vorgeschlagen.

Hierarchische Erkennungsverarbeitung

Die visuelle Erkennungsverarbeitung wird typischerweise als eine Bottom-up-Hierarchie angesehen, in der Informationen sequentiell mit zunehmender Komplexität verarbeitet werden. Während dieses Prozesses befinden sich untergeordnete kortikale Prozessoren wie der primäre visuelle Kortex am unteren Ende der Hierarchie. An der Spitze befinden sich übergeordnete kortikale Prozessoren wie der inferotemporale Kortex (IT), wo die visuelle Erkennung erleichtert wird. Eine hoch anerkannte hierarchische Bottom-up-Theorie ist James DiCarlos Untangling-Beschreibung, bei der jede Stufe des hierarchisch angeordneten ventralen visuellen Pfads Operationen durchführt, um Objektdarstellungen schrittweise in ein leicht extrahierbares Format zu transformieren. Im Gegensatz dazu ist eine zunehmend populäre Erkennungsverarbeitungstheorie die der Top-Down-Verarbeitung. Ein von Moshe Bar (2003) vorgeschlagenes Modell beschreibt eine "Shortcut"-Methode, bei der frühe visuelle Eingaben, teilweise analysiert, vom frühen visuellen Kortex zum präfrontalen Kortex (PFC) gesendet werden . Mögliche Interpretationen des groben visuellen Inputs werden im PFC generiert und dann an den inferotemporalen Kortex (IT) gesendet, wodurch anschließend relevante Objektrepräsentationen aktiviert werden, die dann in den langsameren Bottom-up-Prozess einbezogen werden. Diese "Abkürzung" soll die Anzahl der für den Abgleich erforderlichen Objektdarstellungen minimieren, wodurch die Objekterkennung erleichtert wird. Läsionsstudien haben diesen Vorschlag mit Ergebnissen über langsamere Reaktionszeiten bei Personen mit PFC-Läsionen unterstützt, was darauf hindeutet, dass nur die Bottom-up-Verarbeitung verwendet wird.

Objektkonstanz und Theorien der Objekterkennung

Ein wesentlicher Aspekt der Objekterkennung ist die Objektkonstanz: die Fähigkeit, ein Objekt unter verschiedenen Betrachtungsbedingungen zu erkennen. Zu diesen unterschiedlichen Bedingungen gehören Objektorientierung, Beleuchtung und Objektvariabilität (Größe, Farbe und andere Unterschiede innerhalb der Kategorie). Damit das visuelle System Objektkonstanz erreicht, muss es eine Gemeinsamkeit in der Objektbeschreibung über verschiedene Sichtweisen und die Netzhautbeschreibungen hinweg extrahieren können.[9] Teilnehmer, die Kategorisierungs- und Erkennungsaufgaben durchführten, während sie sich einem funktionellen Magneten unterzogen, fanden einen erhöhten Blutfluss, der auf eine Aktivierung in bestimmten Regionen des Gehirns hinweist. Die Kategorisierungsaufgabe bestand darin, dass die Teilnehmer Objekte aus kanonischen oder ungewöhnlichen Ansichten entweder als Innen- oder Außenobjekte platzierten. Die Erkennungsaufgabe erfolgt, indem den Teilnehmern Bilder präsentiert werden, die sie zuvor gesehen haben. Die Hälfte dieser Bilder hatte die gleiche Ausrichtung wie zuvor gezeigt, während die andere Hälfte in der entgegengesetzten Perspektive präsentiert wurde. Die Gehirnregionen, die an der mentalen Rotation beteiligt sind, wie die ventralen und dorsalen Sehbahnen und der präfrontale Kortex, zeigten während dieser Aufgaben den stärksten Anstieg des Blutflusses, was zeigt, dass sie für die Fähigkeit, Objekte aus mehreren Blickwinkeln zu betrachten, entscheidend sind. Mehrere Theorien wurden entwickelt, um einen Einblick zu geben, wie Objektkonstanz zum Zweck der Objekterkennung erreicht werden kann, einschließlich blickpunktinvarianter, blickpunktabhängiger und Mehrfachansichtstheorien.

Standpunkt-invariante Theorien

Blickpunkt-invariante Theorien legen nahe, dass die Objekterkennung auf strukturellen Informationen, wie etwa einzelnen Teilen, basiert, was eine Erkennung unabhängig vom Blickpunkt des Objekts ermöglicht. Dementsprechend ist die Erkennung von jedem Standpunkt aus möglich, da einzelne Teile eines Objekts gedreht werden können, um jeder bestimmten Ansicht zu entsprechen.[10] Diese Form der analytischen Erkennung erfordert wenig Speicher, da nur strukturelle Teile kodiert werden müssen, die durch die Wechselbeziehungen dieser Teile und die mentale Rotation mehrere Objektrepräsentationen erzeugen können.[10] Den Teilnehmern einer Studie wurde jeweils eine Kodierungsansicht von 24 vorausgewählten Objekten sowie fünf Füllbilder präsentiert. Die Objekte wurden dann im zentralen Gesichtsfeld entweder mit derselben Ausrichtung oder einer anderen Ausrichtung als das Originalbild dargestellt. Dann wurden die Teilnehmer gebeten zu benennen, ob dieselben oder unterschiedliche Tiefenorientierungsansichten dieser Objekte präsentiert wurden. Das gleiche Verfahren wurde dann ausgeführt, wenn die Bilder dem linken oder rechten Gesichtsfeld präsentiert wurden. Blickpunktabhängiges Priming wurde beobachtet, wenn Testansichten direkt der rechten Hemisphäre präsentiert wurden, jedoch nicht, wenn Testansichten direkt der linken Hemisphäre präsentiert wurden. Die Ergebnisse unterstützen das Modell, dass Objekte ansichtspunktabhängig gespeichert werden, da die Ergebnisse nicht davon abhingen, ob der gleiche oder ein anderer Satz von Teilen aus den Ansichten mit unterschiedlicher Ausrichtung wiederhergestellt werden konnte.

3D-Modelldarstellung

Dieses von Marr und Nishihara (1978) vorgeschlagene Modell besagt, dass die Objekterkennung durch Abgleichen von 3D-Modelldarstellungen, die von dem visuellen Objekt erhalten wurden, mit 3D-Modelldarstellungen, die als vertikale Formvorschriften im Speicher gespeichert sind, erreicht wird. Durch den Einsatz von Computerprogrammen und Algorithmen konnte Yi Yungfeng (2009) die Fähigkeit des menschlichen Gehirns demonstrieren, 3D-Bilder nur anhand der 2D-Bilder, die auf der Netzhaut erscheinen, mental zu konstruieren. Ihr Modell zeigt auch ein hohes Maß an Formkonstanz zwischen 2D-Bildern, die eine Erkennung des 3D-Bildes ermöglichen. Die von dem Objekt erhaltenen 3-D-Modelldarstellungen werden gebildet, indem zuerst die Konkavitäten des Objekts identifiziert werden, die den Reiz in einzelne Teile aufteilen. Neuere Forschungen legen nahe, dass ein Bereich des Gehirns, der als kaudaler intraparietaler Bereich (CIP) bekannt ist, dafür verantwortlich ist, die Neigung und Neigung einer ebenen Oberfläche zu speichern, die die Erkennung der Konkavität ermöglicht. Rosenburget al. implantierten Affen eine Sklerasuchspule zur Überwachung der Augenposition, während gleichzeitig die Aktivierung einzelner Neuronen von Neuronen innerhalb des CIP aufgezeichnet wird. Während des Experiments saßen Affen 30 cm von einem LCD-Bildschirm entfernt, der die visuellen Reize anzeigte. Binokulare Disparitätshinweise wurden auf dem Bildschirm angezeigt, indem Stimuli als grün-rote Anaglyphen wiedergegeben wurden, und die Schräg-Neigungs-Kurven reichten von 0 bis 330. Ein einzelner Versuch bestand aus einem Fixationspunkt und dann der Präsentation eines Stimulus für 1 Sekunde. Die Neuronenaktivierung wurde dann unter Verwendung der chirurgisch eingeführten Mikroelektroden aufgezeichnet. Diese einzelne Neuronenaktivierung für spezifische Konkavitäten von Objekten führt zu der Entdeckung, dass jede Achse eines individuellen Teils eines Objekts, das Konkavität enthält, in Speicherspeichern gefunden wird. Die Identifizierung der Hauptachse des Objekts unterstützt den Normalisierungsprozess durch mentale Rotation, die erforderlich ist, da nur die kanonische Beschreibung des Objekts im Speicher gespeichert wird. Die Erkennung wird erlangt, wenn der Blickpunkt des beobachteten Objekts gedanklich gedreht wird, um der gespeicherten kanonischen Beschreibung zu entsprechen.

Abbildung 1. Dieses Bild, das auf der Grundlage von Biedermans (1987) Recognition by Components-Theorie erstellt wurde, ist ein Beispiel dafür, wie Objekte in Geons zerlegt werden können.

Erkennung nach Komponenten

Eine Erweiterung des Modells von Marr und Nishihara, die Recognition-by-Components-Theory , vorgeschlagen von Biederman (1987), schlägt vor, dass die von einem Objekt gewonnenen visuellen Informationen in einfache geometrische Komponenten wie Blöcke und Zylinder, auch als " Geons " bekannt, unterteilt werden " (geometrische Ionen) und werden dann mit der ähnlichsten Objektdarstellung verglichen, die im Speicher gespeichert ist, um die Identifizierung des Objekts bereitzustellen (siehe Abbildung 1).

Standpunktabhängige Theorien

Blickpunktabhängige Theorien legen nahe, dass die Objekterkennung durch den Blickpunkt beeinflusst wird, an dem es gesehen wird, was bedeutet, dass Objekte, die in neuen Blickwinkeln gesehen werden, die Genauigkeit und Geschwindigkeit der Objektidentifikation verringern. Diese Erkennungstheorie basiert eher auf einem ganzheitlicheren System als auf Teilen, was darauf hindeutet, dass Objekte mit mehreren Blickwinkeln und Winkeln im Speicher gespeichert werden. Diese Form der Erkennung erfordert viel Speicher, da jeder Standpunkt gespeichert werden muss. Die Genauigkeit der Erkennung hängt auch davon ab, wie vertraut der beobachtete Standpunkt des Objekts ist.

Theorie mit mehreren Ansichten

Diese Theorie schlägt vor, dass die Objekterkennung auf einem Standpunktkontinuum liegt, bei dem jeder Standpunkt für verschiedene Arten der Erkennung rekrutiert wird. An einem Extrem dieses Kontinuums werden blickpunktabhängige Mechanismen für die Unterscheidung innerhalb von Kategorien verwendet, während am anderen Extrem blickpunktinvariante Mechanismen für die Kategorisierung von Objekten verwendet werden.

Neuronale Substrate

Alt-Text
Der Dorsalstrom ist grün und der Ventralstrom lila dargestellt.

Der dorsale und ventrale Strom

Das: Die visuelle Verarbeitung von Objekten im Gehirn lassen sich in zwei Verarbeitungswege aufgeteilt werden dorsalen Strom (wie / wo), die von der sich Sehrinde zu den Scheitellappen und ventralen Strom (was), die von der sich Sehrinde zu der inferotemporale Kortex (IT). Die Existenz dieser zwei getrennten visuellen Verarbeitungswege wurde zuerst von Ungerleider und Mishkin (1982) vorgeschlagen, die auf der Grundlage ihrer Läsionsstudien nahelegten, dass der Rückenstrom an der Verarbeitung visueller räumlicher Informationen beteiligt ist, wie z. und der ventrale Strom ist an der Verarbeitung von visuellen Objektidentifikationsinformationen (was) beteiligt. Seit diesem ersten Vorschlag wurde alternativ vorgeschlagen, den dorsalen Pfad als "Wie"-Pfad zu bezeichnen, da die hier verarbeiteten visuellen räumlichen Informationen uns Informationen über die Interaktion mit Objekten liefern Der Fokus liegt auf dem ventralen Strom .

Funktionelle Spezialisierung im ventralen Strom

Innerhalb des ventralen Stroms wurden in funktionellen Bildgebungsstudien verschiedene Regionen mit vorgeschlagener funktioneller Spezialisierung beobachtet. Die am häufigsten gefundenen Hirnregionen mit funktioneller Spezialisierung sind der fusiforme Gesichtsbereich (FFA), der eine erhöhte Aktivierung für Gesichter im Vergleich zu Objekten zeigt, der parahippocampale Platzbereich (PPA) für Szenen vs. Objekte, der extrastriatische Körperbereich (EBA) für Körperteile vs. Objekte, MT+/V5 für bewegte Stimuli vs. statische Stimuli und der Lateral Occipital Complex (LOC) für erkennbare Formen vs. verschlüsselte Stimuli. (Siehe auch: Neuronale Verarbeitung für einzelne Kategorien von Objekten )

Strukturelle Verarbeitung: der laterale Okzipitalkomplex

Der laterale Okzipitalkomplex (LOC) hat sich als besonders wichtig für die Objekterkennung auf der wahrnehmungsstrukturellen Ebene erwiesen. In einer ereignisbezogenen fMRT- Studie, die die Anpassung von Neuronen untersuchte, die bei der visuellen Verarbeitung von Objekten aktiviert wurden, wurde festgestellt, dass die Ähnlichkeit der Objektform für die spätere Anpassung im LOC notwendig ist, aber spezifische Objektmerkmale wie Kanten und Konturen sind nicht. Dies legt nahe, dass die Aktivierung im LOC Objektforminformationen höherer Ebene und nicht einfache Objektmerkmale darstellt. In einer verwandten fMRT- Studie deutet die Aktivierung des LOC, die unabhängig von den visuellen Hinweisen des präsentierten Objekts wie Bewegung, Textur oder Luminanzkontraste auftrat, darauf hin, dass die verschiedenen visuellen Hinweise auf niedriger Ebene, die verwendet werden, um ein Objekt zu definieren, in „Objekt- verwandte Bereiche", um den Wahrnehmungs- und Erkennungsprozess zu unterstützen. Keine der erwähnten höherwertigen Objektforminformationen scheint semantische Informationen über das Objekt zu liefern, da das LOC eine neuronale Reaktion auf verschiedene Formen zeigt, einschließlich nicht vertrauter, abstrakter Objekte.

Weitere Experimente haben vorgeschlagen, dass das LOC aus einem hierarchischen System für die Formselektivität besteht, das eine stärkere selektive Aktivierung in den posterioren Regionen für Objektfragmente anzeigt, während die vorderen Regionen eine stärkere Aktivierung für vollständige oder partielle Objekte zeigen. Dies steht im Einklang mit früheren Forschungen, die eine hierarchische Darstellung im ventralen temporalen Kortex nahelegen, wo die primäre Merkmalsverarbeitung in den hinteren Regionen und die Integration dieser Merkmale zu einem ganzen und bedeutungsvollen Objekt in den vorderen Regionen stattfindet.

Semantische Verarbeitung

Semantische Assoziationen ermöglichen eine schnellere Objekterkennung. Wenn einem Objekt zuvor eine semantische Bedeutung zugeordnet wurde, neigen Menschen eher dazu, das Objekt korrekt zu identifizieren. Untersuchungen haben gezeigt, dass semantische Assoziationen eine viel schnellere Erkennung eines Objekts ermöglichen, selbst wenn das Objekt aus unterschiedlichen Blickwinkeln betrachtet wird. Wenn Objekte in zunehmend abweichenden Winkeln von der traditionellen Betrachtungsebene betrachtet werden, hatten Objekte, die erlernte semantische Assoziationen enthielten, kürzere Reaktionszeiten im Vergleich zu Objekten, die keine erlernten semantischen Assoziationen enthielten. Wenn die Objekterkennung zunehmend schwieriger wird, ermöglichen semantische Assoziationen eine viel einfachere Erkennung. In ähnlicher Weise kann ein Subjekt darauf vorbereitet werden, ein Objekt zu erkennen, indem es eine Handlung beobachtet, die sich einfach auf das Zielobjekt bezieht. Dies zeigt, dass Objekte eine Reihe von sensorischen, motorischen und semantischen Assoziationen haben, die es einer Person ermöglichen, ein Objekt richtig zu erkennen. Dies unterstützt die Behauptung, dass das Gehirn mehrere Teile verwendet, wenn es versucht, ein Objekt genau zu identifizieren.

Durch Informationen von neuropsychologischen Patienten wurde eine Dissoziation der Erkennungsverarbeitung zwischen struktureller und semantischer Verarbeitung identifiziert, da strukturelle, farbliche und assoziative Informationen selektiv beeinträchtigt werden können. In einer PET- Studie wurde festgestellt, dass Bereiche, die an der assoziativen semantischen Verarbeitung beteiligt sind, der linke vordere obere/ mittlere Temporalgyrus und der linke Temporalpol im Vergleich zu Struktur- und Farbinformationen sowie der rechte Temporalpol nur im Vergleich zu Farbentscheidungsaufgaben sind. Diese Ergebnisse weisen darauf hin, dass gespeichertes Wahrnehmungswissen und semantisches Wissen separate kortikale Regionen in die Objekterkennung einbeziehen, sowie darauf hin, dass es hemisphärische Unterschiede in den temporalen Regionen gibt.

Die Forschung hat auch Beweise geliefert, die darauf hindeuten, dass visuelle semantische Informationen in den Gyri fusiformis der inferotemporalen Lappen konvergieren. In einer Studie, die das semantische Wissen von Kategorien mit Attributen verglich , wurde festgestellt, dass sie unterschiedliche Rollen bei ihrem Beitrag zur Wiedererkennung spielen. Für kategoriale Vergleiche wurden die lateralen Regionen des Gyrus fusiformis durch lebende Objekte aktiviert, im Vergleich zu nicht lebenden Objekten, die die medialen Regionen aktivierten. Für Attributvergleiche wurde festgestellt, dass der rechte fusiforme Gyrus durch die globale Form aktiviert wurde, im Vergleich zu lokalen Details, die den linken fusiformen Gyrus aktivierten. Diese Ergebnisse legen nahe, dass der Typ der Objektkategorie bestimmt, welcher Bereich des fusiformen Gyrus für die Verarbeitung der semantischen Erkennung aktiviert wird, während die Attribute eines Objekts die Aktivierung entweder im linken oder rechten fusiformen Gyrus bestimmen, je nachdem, ob globale Form oder lokale Details verarbeitet werden .

Darüber hinaus wurde vorgeschlagen, dass eine Aktivierung in vorderen Regionen der Gyri fusiformis eine erfolgreiche Erkennung anzeigt. Es wurde jedoch festgestellt, dass die Aktivierungsstufen von der semantischen Relevanz des Objekts abhängen. Der Begriff semantische Relevanz bezieht sich hier auf "ein Maß für den Beitrag semantischer Merkmale zur Kernbedeutung eines Konzepts". Die Ergebnisse zeigten, dass Objekte mit hoher semantischer Relevanz, wie zum Beispiel Artefakte , im Vergleich zu Objekten mit geringer semantischer Relevanz, wie zum Beispiel natürlichen Objekten, eine Erhöhung der Aktivierung bewirkten. Dies liegt an der vorgeschlagenen erhöhten Schwierigkeit, zwischen natürlichen Objekten zu unterscheiden, da sie sehr ähnliche strukturelle Eigenschaften aufweisen, was die Identifizierung im Vergleich zu Artefakten erschwert. Je einfacher das Objekt zu identifizieren ist, desto wahrscheinlicher wird es daher erfolgreich erkannt.

Eine weitere Bedingung, die eine erfolgreiche Objekterkennungsleistung beeinflusst, ist die kontextbezogene Erleichterung . Es wird angenommen, dass ein Objekt bei Aufgaben der Objekterkennung von einem "Kontextrahmen" begleitet wird, der semantische Informationen über den typischen Kontext des Objekts bietet. Es hat sich herausgestellt, dass, wenn ein Objekt außerhalb des Kontexts liegt, die Objekterkennungsleistung durch langsamere Reaktionszeiten und größere Ungenauigkeiten im Vergleich zu Erkennungsaufgaben behindert wird, wenn sich ein Objekt in einem geeigneten Kontext befand. Basierend auf Ergebnissen einer fMRI- Studie wurde vorgeschlagen, dass es im Gehirn ein " Kontextnetzwerk " für kontextbezogene Objekte gibt, deren Aktivität hauptsächlich im parahippocampalen Kortex (PHC) und im Retrosplenial Complex (RSC) zu finden ist. Innerhalb des PHC wurde festgestellt, dass die Aktivität in der Parahippocampal Place Area (PPA) eher Szenen als Objekten bevorzugt; Es wurde jedoch vorgeschlagen, dass die Aktivität im PHC für einzelne Objekte bei Aufgaben der kontextuellen Erleichterung auf das spätere Denken an die räumliche Szene zurückzuführen sein kann, in der das Objekt kontextuell dargestellt wird. Weitere Experimente ergaben, dass die Aktivierung sowohl für nicht-räumliche als auch für räumliche Kontexte im PHC gefunden wurde, obwohl die Aktivierung von nicht-räumlichen Kontexten auf den vorderen PHC und den hinteren PHC für räumliche Kontexte beschränkt war.

Erkennungsspeicher

Wenn jemand ein Objekt sieht, weiß er, was das Objekt ist, weil er es bei einer früheren Gelegenheit gesehen hat; das ist Erkennungsgedächtnis . Anomalien des ventralen (Was-)Stroms der Sehbahn beeinträchtigen nicht nur unsere Fähigkeit, ein Objekt zu erkennen, sondern auch die Art und Weise, wie ein Objekt uns präsentiert wird. Ein bemerkenswertes Merkmal des visuellen Erkennungsgedächtnisses ist seine bemerkenswerte Kapazität: Selbst nachdem Menschen Tausende von Bildern in einzelnen Versuchen gesehen haben, arbeiten sie bei nachfolgenden Gedächtnistests mit hoher Genauigkeit und erinnern sich an beträchtliche Details der Bilder, die sie gesehen haben

Kontext

Der Kontext ermöglicht eine viel größere Genauigkeit bei der Objekterkennung. Wenn ein identifizierbares Objekt unscharf ist, ist die Erkennungsgenauigkeit viel höher, wenn das Objekt in einen vertrauten Kontext gestellt wird. Darüber hinaus ermöglicht auch ein unbekannter Kontext eine genauere Objekterkennung als das isolierte Objekt. Dies kann der Tatsache zugeschrieben werden, dass Objekte normalerweise in einer bestimmten Umgebung und nicht in keiner Umgebung gesehen werden. Wenn die Umgebung, in der sich das Objekt befindet, dem Betrachter bekannt ist, wird es viel einfacher zu bestimmen, um welches Objekt es sich handelt. Obwohl der Kontext nicht erforderlich ist, um richtig zu erkennen, ist er Teil der Assoziation, die man mit einem bestimmten Objekt macht.

Der Kontext wird besonders wichtig, wenn Gesichter oder Emotionen erkannt werden. Wenn Gesichtsemotionen ohne Kontext präsentiert werden, ist die Fähigkeit, die gezeigte Emotion genau zu beschreiben, deutlich geringer als bei gegebenem Kontext. Dieses Phänomen gilt für alle Altersgruppen und Kulturen, was bedeutet, dass der Kontext für die genaue Identifizierung von Gesichtsgefühlen für alle Personen unerlässlich ist.

Vertrautheit

Vertrautheit ist ein kontextfreier Mechanismus in dem Sinne, dass sich das, was man erkennt, einfach vertraut anfühlt, ohne Zeit damit zu verbringen, herauszufinden, in welchem ​​Kontext man das Objekt kennt. Die ventro-laterale Region des Frontallappens ist während des zufälligen Lernens an der Gedächtniskodierung und später beim Erhalten und Abrufen semantischer Erinnerungen beteiligt. Vertrautheit kann Wahrnehmungsprozesse induzieren, die sich von denen unbekannter Objekte unterscheiden, was bedeutet, dass unsere Wahrnehmung einer endlichen Anzahl vertrauter Objekte einzigartig ist. Abweichungen von typischen Sichtweisen und Kontexten können die Effizienz beeinträchtigen, für die ein Objekt am effektivsten erkannt wird. Es hat sich gezeigt, dass bekannte Objekte nicht nur effizienter erkannt werden, wenn sie aus einem vertrauten Blickwinkel betrachtet werden, im Gegensatz zu einem unbekannten, sondern dieses Prinzip gilt auch für neuartige Objekte. Dies führt zu dem Gedanken, dass Repräsentationen von Objekten in unserem Gehirn eher in einer vertrauten Weise der in der Umgebung beobachteten Objekte organisiert sind. Die Erkennung wird nicht nur hauptsächlich durch die Objektform und/oder -ansichten gesteuert, sondern auch durch dynamische Informationen. Vertrautheit kann die Wahrnehmung dynamischer Punktlichtanzeigen, sich bewegender Objekte, des Geschlechts von Gesichtern und der Gesichtserkennung verbessern.

Erinnerung

Erinnerung hat viele Ähnlichkeiten mit Vertrautheit; es ist jedoch kontextabhängig und erfordert spezifische Informationen aus dem abgefragten Vorfall.

Beeinträchtigungen

Der Verlust der Objekterkennung wird als visuelle Objektagnosie bezeichnet . Es gibt zwei große Kategorien von visueller Objektagnosie : apperzeptive und assoziative. Wenn eine Objektagnosie aufgrund einer Läsion in der dominanten Hemisphäre auftritt, ist oft eine schwerwiegende damit verbundene Sprachstörung, einschließlich eines Verlusts der Wortbedeutung, verbunden.

Auswirkungen von Läsionen im ventralen Strom

Die Objekterkennung ist eine komplexe Aufgabe und umfasst mehrere verschiedene Bereiche des Gehirns – nicht nur einen. Wird ein Bereich beschädigt, kann die Objekterkennung beeinträchtigt werden. Der Hauptbereich der Objekterkennung findet im Schläfenlappen statt . So wurde beispielsweise festgestellt, dass Läsionen des perirhinalen Kortex bei Ratten insbesondere mit einer Zunahme der Merkmalsmehrdeutigkeit zu Beeinträchtigungen der Objekterkennung führen. Neonatale Aspirationsläsionen des Amygdaloidkomplexes bei Affen scheinen zu einem größeren Verlust des Objektgedächtnisses geführt zu haben als frühe Hippocampusläsionen. Bei erwachsenen Affen wird die Beeinträchtigung des Objektgedächtnisses jedoch besser durch eine Schädigung des perirhinalen und entorhinalen Kortex als durch eine Schädigung der Amygdaloidkerne erklärt. Kombinierte amygdalohippocampale (A + H)-Läsionen bei Ratten beeinträchtigten die Leistung bei einer Objekterkennungsaufgabe, wenn die Retentionsintervalle über 0s hinaus verlängert wurden und wenn Teststimuli innerhalb einer Sitzung wiederholt wurden. Schäden an Amygdala oder Hippocampus beeinträchtigen die Objekterkennung nicht, während A + H-Schäden zu deutlichen Defiziten führen. In einer Objekterkennungsaufgabe war der Grad der Diskriminierung bei den elektrolytischen Läsionen des Globus pallidus (Teil der Basalganglien ) bei Ratten signifikant niedriger als bei der Substantia-Innominata/Ventral Pallidum, die wiederum schlechter war als die Kontrolle und das Medial Septum/ Vertikales Diagonalband von Broca-Gruppen; jedoch unterschied nur Globus Pallidus nicht zwischen neuen und vertrauten Objekten. Diese Läsionen schädigen den ventralen (was) Weg der visuellen Verarbeitung von Objekten im Gehirn.

Visuelle Agnosien

Agnosie ist ein seltenes Ereignis und kann das Ergebnis eines Schlaganfalls, einer Demenz, einer Kopfverletzung, einer Gehirninfektion oder einer erblichen Erkrankung sein. Apperzeptive Agnosie ist ein Defizit in der Objektwahrnehmung, das eine Unfähigkeit verursacht, die Bedeutung von Objekten zu verstehen. In ähnlicher Weise ist die assoziative visuelle Agnosie die Unfähigkeit, die Bedeutung von Objekten zu verstehen; dieses Mal liegt das Defizit jedoch im semantischen Gedächtnis. Beide Agnosien können den Weg zur Objekterkennung beeinflussen, wie Marrs Theory of Vision. Anders als bei der apperzeptiven Agnosie sind assoziativ agnosische Patienten erfolgreicher beim Zeichnen, Kopieren und Abgleichen von Aufgaben; diese Patienten zeigen jedoch, dass sie wahrnehmen, aber nicht erkennen können. Integrative Agnosie (eine Unterart der assoziativen Agnosie) ist die Unfähigkeit, einzelne Teile zu einem Gesamtbild zu integrieren. Bei diesen Arten von Agnosien kommt es zu einer Schädigung des ventralen (was) Stroms des visuellen Verarbeitungsweges. Objektorientierungs-Agnosie ist die Unfähigkeit, die Orientierung eines Objekts trotz ausreichender Objekterkennung zu extrahieren. Bei dieser Art von Agnosie kommt es zu einer Schädigung des dorsalen (wo) Stroms des visuellen Verarbeitungsweges. Dies kann die Objekterkennung in Bezug auf Vertrautheit und noch mehr bei unbekannten Objekten und Blickwinkeln beeinträchtigen. Eine Schwierigkeit beim Erkennen von Gesichtern kann durch Prosopagnosie erklärt werden . Jemand mit Prosopagnosie kann das Gesicht nicht erkennen, ist aber dennoch in der Lage, Alter, Geschlecht und emotionalen Ausdruck wahrzunehmen. Die Gehirnregion, die bei der Gesichtserkennung spezifiziert wird, ist der fusiforme Gesichtsbereich . Prosopagnosie kann auch in apperzeptive und assoziative Subtypen unterteilt werden. Auch die Erkennung einzelner Stühle, Autos, Tiere kann beeinträchtigt sein; daher teilen diese Objekte ähnliche Wahrnehmungsmerkmale mit dem Gesicht, die im spindelförmigen Gesichtsbereich erkannt werden.

Alzheimer-Krankheit

Die Unterscheidung zwischen Kategorie und Attribut in der semantischen Repräsentation kann unsere Fähigkeit beeinflussen, die semantische Funktion beim Altern und bei Krankheitszuständen, die das semantische Gedächtnis beeinflussen, wie beispielsweise die Alzheimer-Krankheit (AD), zu beurteilen . Aufgrund semantischer Gedächtnisdefizite haben an Alzheimer erkrankte Personen Schwierigkeiten, Objekte zu erkennen, da das semantische Gedächtnis bekanntermaßen zum Abrufen von Informationen zum Benennen und Kategorisieren von Objekten verwendet wird. Tatsächlich wird stark diskutiert, ob das semantische Gedächtnisdefizit bei AD den Verlust von semantischem Wissen für bestimmte Kategorien und Konzepte oder den Verlust von Wahrnehmungsmerkmalen und -attributen widerspiegelt.

Siehe auch

Verweise