Farbkonstanz
Netzaufbau
Netzaufbau
Das von Stanikunas, Vaitkevicius und Kulikowski (2004) verwendete neuronale Netz stellte ein Feedforward-Netz dar, wobei neben der Input- und Output-Schicht zwei weitere Hidden-Schichten zum Einsatz kamen (siehe Abbildung 24):
Input-Schicht
- Input-Schicht: Die Input-Schicht umfasste insgesamt sechs Input-Units und ließ sich in zwei Farbkanäle unterteilen, die jeweils drei Units
umfassten:
- R-Zapfen: Diese Unit produzierte im künstlichen neuronalen Netz auf Zahlen, die Licht einer langen Wellenlänge repräsentierten, einen besonders starken Output und reagierte im Bereich langer Wellenlängen besonders sensitiv. Analog dazu gibt es auch im menschlichen Auge einen solchen Zapfen, der ebenfalls auf sichtbares Licht mit einer längeren Wellenlänge reagiert und somit hauptsächlich für die Wahrnehmung von Rot verantwortlich ist.
- G-Zapfen: G-Zapfen (G für Grün) sprachen besonders auf den mittleren Wellenbereich des sichtbaren Lichtes an, so dass diese Zapfen sowohl im menschlichen Auge als auch in dem künstlichen neuronalen Netz besonders sensitiv auf eine solche mittlere Wellenlänge reagieren.
- B-Zapfen: Die kürzeste Wellenlänge wurde durch die B-Zapfen abgedeckt. Die Zapfen waren folglich besonders sensitiv für die Farbe Blau.
Hidden-Schicht
- Erste Hidden-Schicht: Die erste Hidden-Schicht war durch zuvor festgelegte, unveränderbare Gewichte mit den Input-Units verbunden. Es wurden drei
verschiedene Typen von Gegenfarbenzellen unterschieden:
- R-G: Bei dem Typ "R-G" standen sich die Farben Rot und Grün gegenüber. Im künstlichen neuronalen Netz wurden drei Zahlwerte, die die kurzen, mittleren und langen Wellenlängen repräsentierten so verrechnet, dass diese Unit durch die Farbe Rot (lange Wellenlängen) aktiviert und durch die Farbe Grün (mittlere Wellenlängen) gehemmt wurde. Die kurze Wellenlänge ("Blau") hatte bei der Berechnung nur einen äußerst geringfügigen Einfluss.
- B-G: Die Unit, die das Gegensatzpaar Blau-Gelb (G steht hier nicht für Grün, sondern für Gelb!) symbolisierte, wurde ebenfalls von den R-, G- und B-Zapfen gespeist. Der B-Zapfen, d.h. die kurze Wellenlänge, besaß im künstlichen Netz auf diese Gegenfarbenzelle einen stark hemmenden Einfluss, während R- und G-Zapfen (lange und mittlere Wellenlängen) jeweils einen moderaten aktivierenden Einfluss aufwiesen. Wurden beide Wellenlängen aktiviert, so addierte sich dieser Einfluss entsprechend. Dies war vor allem bei der Farbe Gelb der Fall, die sich ungefähr zwischen (bezüglich der Wellenlänge!) den Farben Rot und Grün befand.
- S-W: Das Gegensatzpaar Schwarz-Weiß war nur mit den R- und G-Zapfen durch positive Gewichte verbunden (siehe Abbildung 24). Weißes Licht, welches die R- und G-Zapfen in etwa in gleichem Maße aktivierte (Kandel et al., 1995), führte zu einer Aktivierung dieser Unit. Wurde kein Licht dargeboten, so blieb eine Aktivierung aus.
- Zweite Hidden-Schicht: Die zweite Hidden-Schicht umfasste fünf Hidden-Units, die vollständig mit den sechs Gegenfarbenzellen der ersten Hidden-Schicht verbunden waren (siehe Abbildung 24). Sämtliche Gewichte zwischen diesen beiden Schichten konnten in der Trainingsphase modifiziert werden.
Outputschicht
- Output-Schicht: Auch die Output-Schicht war vollständig mit der zweiten Hidden-Schicht verbunden (siehe Abbildung 24), wobei hier ebenfalls alle Gewichte veränderbar waren. Der Output-Vektor wurde mit Hilfe der drei Output-Units gebildet, der stark vereinfacht dargestellt den Farbeindruck eines Objektes als Zahlenwert beschreiben und somit Neuronen im visuellen Areal V4 repräsentieren sollte.
Wie in Abbildung 24 erkennbar, wurde das Netz in zwei Verarbeitungspfade unterteilt. Der obere Pfad der Abbildung griff auf Farbinformationen des Hintergrundes zurück, während der untere Pfad die Farbe des betrachteten Objektes analysierte.
Dem neuronalen Netz wurde das Objekt in der Trainingsphase unter 40 verschiedenen Farben (nach dem Farbsystem von Munsell) dargeboten, während die Farbe des Hintergrundes nicht variierte. Jedoch konnte auch das vom Hintergrund reflektierte Licht in Abhängigkeit der verwendeten Beleuchtung unterschiedliche Wellenlängen annehmen. Insgesamt kamen in verschiedenen Trainingsdurchläufen maximal neun verschiedene Beleuchtungen zum Einsatz. Ziel des Trainings war die korrekte Identifikation der Objektfarbe unter den unterschiedlichen Beleuchtungsbedingungen.
In der Trainingsphase wurden die korrekten Output-Werte vorgegeben (supervised learning) und die variablen Gewichte mit Hilfe der Backpropagation Lernregel angepasst.