KIT – Department of Informatics – The Department - About Us - Newsarchiv - Bessere Ergebnisse durch Deep Neural Networks

Bessere Ergebnisse durch Deep Neural Networks

author:
Sebastian Schäfer
date: 03.08.2015

links

Zur wissenschaftlichen Publikation

KIT-Informatiker verbessern die automatische Bilderkennung im Infrarot-Bereich

Während es heute für spezielle Algorithmen recht einfach ist, Personen anhand ihrer Fotos in einer Bilddatenbank zu finden, verhält sich die Identifizierung von Menschen auf einem Infrarotbild deutlich schwieriger. Aktuell ist es nahezu unmöglich von einer thermischen Infrarotaufnahme auf eine konkrete Person zu schließen. Solche Aufnahmen sind jedoch ein wichtiger Bestandteil für die Sicherheitstechnik, um auch bei Dunkelheit Gefahrenbereiche überwachen zu können. Durch die Möglichkeit der Identifizierung der aufgenommenen Personen, würde sich der Nutzen eines solchen Systems immens steigern.

Dabei stellen sich der Wissenschaft gleich mehrere Probleme: Zum Einen werden Infrarotbilder in einer deutlich niedrigeren Auflösung aufgenommen, als Bilder bei sichtbarem Licht. Zum Anderen handelt es sich bei Infrarotbildern um thermische Aufnahmen, die sich in ihrem Aussehen deutlich von Aufnahmen mit sichtbarem Licht unterscheiden.
Die KIT-Wissenschaftler Professor Rainer Stiefelhagen und Saquib Sarfraz vom Institut für Anthropomatik und Robotik (IAR) haben hierfür einen Lösungsansatz gefunden. Sie bedienen sich der Methoden der „Deep Neural Networks“, also einer Art der künstlichen neuronalen Netzwerke. Dabei soll das Netzwerk lernen, bei der Betrachtung von Infrarotbildern das dazu passende Bild bei sichtbarem Licht zu erkennen.

Abgleich von Infrarotbildern

Bilder der selben Person können als Infrarotbild sehr unterschieldlich aussehen.

Erste Versuche konnten die Wissenschaftler anhand einer Bilddatenbank der Universität von Notre Dame durchführen. Die Datenbank enthielt 4.585 Bilder von 82 Personen, teilweise aufgenommen mit sichtbarem Licht und teilweise in Infrarot. Jedes Bild wurde in mehrere Flächen mit einer geringen Auflösung von 20 x 20 Pixel aufgeteilt, um die Größe der Datenbank zu erhöhen. Die Bilder der ersten 41 Personen nutzten Stiefelhagen und Sarfraz, um dem Netzwerk ihr Verfahren beizubringen. Die zweiten 41 Personen dienten anschließend als Testlauf.

Nach den Tests zeigte sich, dass die Methode der Karlsruher Informatiker die Bilderkennung von Infrarotbildern im Vergleich mit den bisher gängigen Methoden um zehn Prozent verbessern konnte. Die Wissenschaftler schafften es mit Hilfe des Netzwerks ein Infrarotbild in 35 Millisekunden seinem entsprechenden Äquivalent in sichtbarem Licht zuzuordnen. Und das bei mehr als 80 Prozent Genauigkeit.

Die Experten sind sich aber sicher, dass sie mit dieser Methode eine noch größere Genauigkeit erreichen könnten. Hierzu müsste man aber zunächst über größere Bilddatenbanken mit sichtbaren und thermischen Infrarot-Aufnahmen verfügen. Damit könnten dann auch komplexere Netzwerke trainiert werden.