Caffe vom Berkeley Vision and Learning Center (BVLC)

Mai 31, 2017

—

von

Die wahre Herausforderung an die Künstliche Intelligenz besteht in der Lösung von Aufgaben, die für uns Menschen leicht durchzuführen sind, aber deren Lösung nur schwer als mathematische Regeln zu formulieren sind. Dies sind Aufgaben, die wir Menschen intuitiv lösen, wie z.B. Spracherkennung oder Bilderkennung.

Eine computerbasierte Lösung für diese Art von Aufgaben beinhaltet die Fähigkeit von Computern, aus der Erfahrung zu lernen und die Welt in Bezug auf eine Hierarchie von Konzepten zu verstehen. Hierbei ist jedes Konzept durch seine Beziehung zu einfacheren Konzepten definiert. Durch das Sammeln von Wissen aus der Erfahrung vermeidet dieser Ansatz die Notwendigkeit für die menschlichen Bediener, all das Wissen, das der Computer für seine Arbeit benötigt, formal spezifizieren zu müssen. Die Hierarchie der Konzepte erlaubt es dem Computer komplizierte Konzepte zu erlernen, indem er sie aus einfacheren zusammensetzt. Wenn wir ein Diagramm zeichnen, das zeigt, wie diese Konzepte übereinander aufgebaut werden, dann ist das Diagramm tief, mit vielen Schichten. Aus diesem Grund nennen wir diesen Ansatz in der Künstlichen Intelligenz „Deep Learning“.

Caffe ist eine Programmbibliothek für Deep Learning.

Sie wurde von Yangqing Jia während seiner Ph.D.-Zeit am Vision und Learning Centre der University of California, Berkeley entwickelt.

Caffe hat zuerst die MATLAB-Implementierung von schnellen Convolutional Neural Networks (CNN) nach C und C++ portiert. Caffe beinhaltet zahlreiche Algorithmen und Deep-Learning-Architekturen für die Klassifikation und Clusteranalyse von Bilddaten. CNN, R-CNN (Rekurrentes neuronales Netz), LSTM (Long short-term memory) und vollständig verbundene neuronale Netze werden unterstützt. Mit Caffe kann die Grafikprozessor-basierte Beschleunigung mit cuDNN von Nvidia genutzt werden, sodass 60 Millionen Bilder pro Tag prozessiert werden können.

Was wir tun

Wir helfen Unternehmen, Marken und ihren Werbeagenturen, XR-Erlebnisse zu schaffen, die helfen, den Umsatz zu steigern.

Gerne unterstützen wir Sie bei der Planung, Durchführung und Optimierung Ihrer 3D Projekte. Beliebte Schlüsselworte: Skulpturen, Maskottchen, Low Poly, Natur und Weltraum.
Machen Sie Ihr nächstes 3D-Projekt zu einem Erfolg! ✓schnell ✓professionell ✓unkompliziert.

Produktion von 3D-Inhalten

Als hauptsächliche Programmierschnittstelle sind Python (NumPy) und MATLAB vorgesehen. Yahoo hat Caffe in Apache Spark eingebunden (CaffeOnSpark) um Deep Learning verteilt zu verwenden.

Eine der häufigsten Techniken in der Künstlichen Intelligenz ist Maschinelles Lernen. Maschinelles Lernen ist ein selbstadaptiver Algorithmus. Deep Learning, eine Teilmenge des Maschinellen Lernens, nutzt eine Reihe hierarchischer Schichten bzw. eine Hierarchie von Konzepten um den Prozess des Maschinellen Lernens durchzuführen. Die hierbei benutzten Künstlichen neuronalen Netze sind wie das menschliche Gehirn gebaut, wobei die Neuronen wie ein Netz miteinander verbunden sind. Die erste Schicht des neuronalen Netzes, der sichtbare „input Layer“, verarbeitet eine Rohdateneingabe, wie z.B. die einzelnen Pixel eines Bildes. Die Dateneingabe enthält Variablen, die wir beobachten können, daher „sichtbare Schicht“.

Windows Caffe

Die Entwickler betreiben Caffe auf Ubuntu 16.04-12.04, OS X 10.11-10.8 und über Docker und AWS. Die Makefile.config und Makefile.config Build werden durch eine Community-CMake-Build ergänzt. Guillaume Dumont pflegt einen Windows branch auf GitHup. Da unsere Bildateien in der Regel auf Windows Festplatten liegen, freuen wir uns besonders über diesen Supprt. Ihr findet Windows Caffe hier: https://github.com/BVLC/caffe/tree/windows

caffe.exe: command line brew
usage: caffe <command> <args>

commands:
  train           train or finetune a model
  test            score a model
  device_query    show GPU diagnostic information
  time            benchmark model execution time

  Flags from C:\Users\guillaume\work\caffe-builder\build_v140_x64\packages\gflags\gflags_download-prefix\src\gflags_download\src\gflags.cc:
    -flagfile (load flags from file) type: string default: ""
    -fromenv (set flags from the environment [use 'export FLAGS_flag1=value'])
      type: string default: ""
    -tryfromenv (set flags from the environment if present) type: string
      default: ""
    -undefok (comma-separated list of flag names that it is okay to specify on
      the command line even if the program does not define a flag with that
      name.  IMPORTANT: flags in this list that have arguments MUST use the
      flag=value format) type: string default: ""

  Flags from C:\Users\guillaume\work\caffe-builder\build_v140_x64\packages\gflags\gflags_download-prefix\src\gflags_download\src\gflags_completions.cc:
    -tab_completion_columns (Number of columns to use in output for tab
      completion) type: int32 default: 80
    -tab_completion_word (If non-empty, HandleCommandLineCompletions() will
      hijack the process and attempt to do bash-style command line flag
      completion on this value.) type: string default: ""

  Flags from C:\Users\guillaume\work\caffe-builder\build_v140_x64\packages\gflags\gflags_download-prefix\src\gflags_download\src\gflags_reporting.cc:
    -help (show help on all flags [tip: all flags can have two dashes])
      type: bool default: false currently: true
    -helpfull (show help on all flags -- same as -help) type: bool
      default: false
    -helpmatch (show help on modules whose name contains the specified substr)
      type: string default: ""
    -helpon (show help on the modules named by this flag value) type: string
      default: ""
    -helppackage (show help on all modules in the main package) type: bool
      default: false
    -helpshort (show help on only the main module for this program) type: bool
      default: false
    -helpxml (produce an xml version of help) type: bool default: false
    -version (show version and build info and exit) type: bool default: false



  Flags from C:\Users\guillaume\work\caffe-builder\build_v140_x64\packages\glog\glog_download-prefix\src\glog_download\src\logging.cc:
    -alsologtoemail (log messages go to these email addresses in addition to
      logfiles) type: string default: ""
    -alsologtostderr (log messages go to stderr in addition to logfiles)
      type: bool default: false currently: true
    -colorlogtostderr (color messages logged to stderr (if supported by
      terminal)) type: bool default: false
    -log_backtrace_at (Emit a backtrace when logging at file:linenum.)
      type: string default: ""
    -log_dir (If specified, logfiles are written into this directory instead of
      the default logging directory.) type: string default: ""
    -log_link (Put additional links to the log files in this directory)
      type: string default: ""
    -log_prefix (Prepend the log prefix to the start of each log line)
      type: bool default: true
    -logbuflevel (Buffer log messages logged at this level or lower (-1 means
      don't buffer; 0 means buffer INFO only; ...)) type: int32 default: 0
    -logbufsecs (Buffer log messages for at most this many seconds) type: int32
      default: 30
    -logemaillevel (Email log messages logged at this level or higher (0 means
      email all; 3 means email FATAL only; ...)) type: int32 default: 999
    -logfile_mode (Log file mode/permissions.) type: int32 default: 436
    -logmailer (Mailer used to send logging email) type: string
      default: "/bin/mail"
    -logtostderr (log messages go to stderr instead of logfiles) type: bool
      default: false
    -max_log_size (approx. maximum log file size (in MB). A value of 0 will be
      silently overridden to 1.) type: int32 default: 1800
    -minloglevel (Messages logged at a lower level than this don't actually get
      logged anywhere) type: int32 default: 0
    -stderrthreshold (log messages at or above this level are copied to stderr
      in addition to logfiles.  This flag obsoletes --alsologtostderr.)
      type: int32 default: 2
    -stop_logging_if_full_disk (Stop attempting to log to disk if the disk is
      full.) type: bool default: false

  Flags from C:\Users\guillaume\work\caffe-builder\build_v140_x64\packages\glog\glog_download-prefix\src\glog_download\src\vlog_is_on.cc:
    -v (Show all VLOG(m) messages for m <= this. Overridable by --vmodule.)
      type: int32 default: 0
    -vmodule (per-module verbose level. Argument is a comma-separated list of
      <module name>=<log level>. <module name> is a glob pattern, matched
      against the filename base (that is, name ignoring .cc/.h./-inl.h). <log
      level> overrides any value given by --v.) type: string default: ""



  Flags from C:\projects\caffe\tools\caffe.cpp:
    -gpu (Optional; run in GPU mode on given device IDs separated by ','.Use
      '-gpu all' to run on all available GPUs. The effective training batch
      size is multiplied by the number of devices.) type: string default: ""
    -iterations (The number of iterations to run.) type: int32 default: 50
    -level (Optional; network level.) type: int32 default: 0
    -model (The model definition protocol buffer text file.) type: string
      default: ""
    -phase (Optional; network phase (TRAIN or TEST). Only used for 'time'.)
      type: string default: ""
    -sighup_effect (Optional; action to take when a SIGHUP signal is received:
      snapshot, stop or none.) type: string default: "snapshot"
    -sigint_effect (Optional; action to take when a SIGINT signal is received:
      snapshot, stop or none.) type: string default: "stop"
    -snapshot (Optional; the snapshot solver state to resume training.)
      type: string default: ""
    -solver (The solver definition protocol buffer text file.) type: string
      default: ""
    -stage (Optional; network stages (not to be confused with phase), separated
      by ','.) type: string default: ""
    -weights (Optional; the pretrained weights to initialize finetuning,
      separated by ','. Cannot be set simultaneously with snapshot.)
      type: string default: ""

Bilddatenbank vorbereiten

Zum Testen der Trainingsleistung von Caffe ist als Input eine Bilddatenbank erforderlich. Caffe umfasst Modelle, die gemäß ihrer Konfiguration Bilder aus der ILSVRC12-Challenge („ImageNet“) verwenden. Die Originalbilddateien stehen unter http://image-net.org/download-images zum Herunterladen zur Verfügung.

Auf den neuesten NVIDIA Pascal™-Grafikprozessoren läuft Caffe bis zu 65 % schneller. Innerhalb eines einzelnen Knotens lässt es sich über mehrere Grafikprozessoren skalieren. Dadurch lassen sich Modelle innerhalb weniger Stunden anstatt mehrerer Tage trainieren.

Nützliche Links

Caffe
Windows Caffe
Bachelorarbeit: Erkennung von Verkehrszeichen mit Konvolutionalen Neuronalen Netzen
http://www.nvidia.de/object/caffe-deep-learning-framework-de.html

Jetzt bist du gefragt!

Bereits heute ermöglicht Deep Learning selbstfahrende Autos, intelligente persönliche Assistenten und intelligentere Webdienste. Hast du Anregungen oder Ergänzungen? Dann freue ich mich auf deinen Kommentar.

Du kannst diesen Beitrag natürlich auch weiterempfehlen. Ich bin dir für jede Unterstützung dankbar!

Deep Learning Künstliche Intelligenz Maschinelles Lernen

Hallo > Blog > Software > Open Source > Caffe vom Berkeley Vision and Learning Center (BVLC)

Gefällt Ihnen dieser Beitrag? Teilen Sie ihn mit anderen. Sie machen uns damit eine große Freude!

Wie können wir Ihnen helfen?

Wir unterstützen Sie bei der Umsetzung Ihres Augmented Reality (AR) oder Virtual Reality (VR) Projektes! Ob Produktfotografie, 3D-Scan-Service, 3D-Visualisierung oder fertige 3D-Modelle für AR/VR – wir beraten Sie persönlich und unverbindlich.

Wenn Sie ein individuelles Angebot auf Basis Ihrer aktuellen Vorlagen (Fotos, Zeichnungen, Skizzen) wünschen, nutzen Sie einfach unser Anfrageformular.

3D-Modelle für Metaverse und Echtzeit-Anwendungen: VR, AR und mehr

Als Atelier für Metaverse Inhalte und interaktive Markenerlebnisse bieten wir Ihnen eine breite Palette an 3D-Modellen, die sich perfekt für Echtzeitanwendungen eignen. Ob Sie in eine virtuelle Welt eintauchen wollen (Virtual Reality, VR), virtuelle Objekte in die reale Welt einblenden wollen (Augmented Reality, AR) oder beides kombinieren wollen (Mixed Reality, MR) – unsere Modelle sind für alle Formen von Extended Reality (XR) optimiert. Dank unserer Expertise können Sie wertvolle Entwicklungszeit und -kosten sparen. Nutzen Sie unsere 3D-Modelle als Prototypen für Ihre XR-Erfahrungen oder integrieren Sie sie in Ihr fertiges Projekt. Wir stehen Ihnen gerne mit Rat und Tat zur Seite und sorgen dafür, dass Ihre Markenerlebnisse einzigartig und unvergesslich werden.

3D-Visualisierung
3D-Scan – Dienstleistung

Angebot anfordern