Caffe vom Berkeley Vision and Learning Center (BVLC)

Open Source, Software Schlagwörter: , , 0 Kommentare

Die wahre Herausforderung an die Künstliche Intelligenz besteht in der Lösung von Aufgaben, die für uns Menschen leicht durchzuführen sind, aber deren Lösung nur schwer als mathematische Regeln zu formulieren sind. Dies sind Aufgaben, die wir Menschen intuitiv lösen, wie z.B. Spracherkennung oder Bilderkennung.

Eine computerbasierte Lösung für diese Art von Aufgaben beinhaltet die Fähigkeit von Computern, aus der Erfahrung zu lernen und die Welt in Bezug auf eine Hierarchie von Konzepten zu verstehen. Hierbei ist jedes Konzept durch seine Beziehung zu einfacheren Konzepten definiert. Durch das Sammeln von Wissen aus der Erfahrung vermeidet dieser Ansatz die Notwendigkeit für die menschlichen Bediener, all das Wissen, das der Computer für seine Arbeit benötigt, formal spezifizieren zu müssen. Die Hierarchie der Konzepte erlaubt es dem Computer komplizierte Konzepte zu erlernen, indem er sie aus einfacheren zusammensetzt. Wenn wir ein Diagramm zeichnen, das zeigt, wie diese Konzepte übereinander aufgebaut werden, dann ist das Diagramm tief, mit vielen Schichten. Aus diesem Grund nennen wir diesen Ansatz in der Künstlichen Intelligenz „“.

Caffe ist eine Programmbibliothek für Deep Learning.

Sie wurde von Yangqing Jia während seiner Ph.D.-Zeit am Vision und Learning Centre der University of California, Berkeley entwickelt.

Caffe hat zuerst die MATLAB-Implementierung von schnellen Convolutional Neural Networks (CNN) nach C und C++ portiert. Caffe beinhaltet zahlreiche Algorithmen und Deep-Learning-Architekturen für die Klassifikation und Clusteranalyse von Bilddaten. CNN, R-CNN (Rekurrentes neuronales Netz), LSTM (Long short-term memory) und vollständig verbundene neuronale Netze werden unterstützt. Mit Caffe kann die Grafikprozessor-basierte Beschleunigung mit cuDNN von Nvidia genutzt werden, sodass 60 Millionen Bilder pro Tag prozessiert werden können.

Als hauptsächliche Programmierschnittstelle sind Python (NumPy) und MATLAB vorgesehen. Yahoo hat Caffe in Apache Spark eingebunden (CaffeOnSpark) um Deep Learning verteilt zu verwenden.

Eine der häufigsten Techniken in der Künstlichen Intelligenz ist . ist ein selbstadaptiver Algorithmus. Deep Learning, eine Teilmenge des Maschinellen Lernens, nutzt eine Reihe hierarchischer Schichten bzw. eine Hierarchie von Konzepten um den Prozess des Maschinellen Lernens durchzuführen. Die hierbei benutzten Künstlichen neuronalen Netze sind wie das menschliche Gehirn gebaut, wobei die Neuronen wie ein Netz miteinander verbunden sind. Die erste Schicht des neuronalen Netzes, der sichtbare „input Layer“, verarbeitet eine Rohdateneingabe, wie z.B. die einzelnen Pixel eines Bildes. Die Dateneingabe enthält Variablen, die wir beobachten können, daher „sichtbare Schicht“.

Windows Caffe

Deep Learning

Die Entwickler betreiben Caffe auf Ubuntu 16.04-12.04, OS X 10.11-10.8 und über Docker und AWS. Die Makefile.config und Makefile.config Build werden durch eine Community-CMake-Build ergänzt. Guillaume Dumont pflegt einen Windows branch auf GitHup. Da unsere Bildateien in der Regel auf Windows Festplatten liegen, freuen wir uns besonders über diesen Supprt. Ihr findet Windows Caffe hier: https://github.com/BVLC/caffe/tree/windows

Bilddatenbank vorbereiten

Zum Testen der Trainingsleistung von Caffe ist als Input eine Bilddatenbank erforderlich. Caffe umfasst Modelle, die gemäß ihrer Konfiguration Bilder aus der ILSVRC12-Challenge („ImageNet“) verwenden. Die Originalbilddateien stehen unter http://image-net.org/download-images zum Herunterladen zur Verfügung.

Auf den neuesten NVIDIA Pascal™-Grafikprozessoren läuft Caffe bis zu 65 % schneller. Innerhalb eines einzelnen Knotens lässt es sich über mehrere Grafikprozessoren skalieren. Dadurch lassen sich Modelle innerhalb weniger Stunden anstatt mehrerer Tage trainieren.

Nützliche Links

Caffe
Windows Caffe
Bachelorarbeit: Erkennung von Verkehrszeichen mit Konvolutionalen Neuronalen Netzen
http://www.nvidia.de/object/caffe-deep-learning-framework-de.html

Jetzt bist du gefragt!

Bereits heute ermöglicht Deep Learning selbstfahrende Autos, intelligente persönliche Assistenten und intelligentere Webdienste. Hast du Anregungen oder Ergänzungen? Dann freue ich mich auf deinen Kommentar.

Du kannst diesen Beitrag natürlich auch weiterempfehlen. Ich bin dir für jede Unterstützung dankbar!

Schreibe einen Kommentar

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert.

* Die DSGVO-Checkbox ist ein Pflichtfeld

*

Ich stimme zu

Business Shooting

Mit dem visuellen Erscheinungsbild beginnt alles. Egal ob Du Freelancer, langjähriger Unternehmer oder Verantwortlicher eines Start-ups bist – Du musst nach außen kommunizieren, für welche Kompetenzen und Botschaften Du stehst.
Imagefördernde Fotos unterstützen ein Unternehmen dabei, sich erfolgreich und attraktiv zu präsentieren und damit neue Kunden anzusprechen.
Bei meiner Arbeit geht es mir sowohl um die ausdrucksstarke und kompetente Darstellung der Führungskräfte und Mitarbeiter als auch um die repräsentative Abbildung der Produkte.

Aktuell

Chatten Sie jetzt mit uns