Maschinelles Lernen: r23 veröffentlicht Bildbeschreibungsmodul für WordPress

Allgemein Schlagwörter: , , 0 Kommentare

Unser Backofen kann es, unser Kühlschrank kann es und auch unsere Heizung kann es – selbstständig Zustände, wie beispielsweise den Garprozess des Bratens im Ofen erkennen und darauf reagieren. Zahlreiche, miteinander verbundene Sensoren und definierte Regeln zeichnen diese Technik aus. Was für unsere Haushaltsgeräte heute schon Alltag ist, findet in Zukunft im Rahmen der Industrie 4.0 Initiative auch in industriellen Produktionsanalagen ihren Einsatz.

Hier gehen die Forscher und Unternehmen weltweit aber noch einen Schritt weiter. Sie wollen die Intelligenz in die Maschine bringen: Maschinen sollen die Daten automatisch analysieren, Zusammenhänge lernen und daraus intelligente Handlungen ableiten.

Die Fachleute aus Wissenschaft und Wirtschaft machen heutige Maschinen zu cyber-physischen Systemen (CPS) und gestalten dadurch die Zukunft unserer Produktion. Diese CPS zeichnen sich durch Anpassungs- und Lernfähigkeit aus: Sie analysieren ihre Umgebung und lernen auf Basis ihrer Beobachtungen Muster, Zusammenhänge und prognosefähige Modelle ganz selbstständig, das heißt, ohne dass ein Engineering Aufwand nötig ist. Typische Anwendungen für solche Systeme sind die Prozessüberwachung, die vorausschauende Wartung, Bildverarbeitung und Fehlerdiagnose. Wissenschaftler und Unternehmer erhoffen sich dadurch spannende Arbeitsfelder für Fachkräfte ohne akademischen Hintergrund zu schaffen.

Quelle Pressemitteilung: Wie Maschinen das selbstständige Lernen lernen

Vor wenigen Monaten veröffentlichte Google seine Software zum Erstellen automatischer Bildunterschriften. Der Heise Verlag stellte die Hintergründe in einem wunderbaren Beitrag vor.

Was kann das Cloud Vision API?

Mit dem Cloud Vision API soll nun eine wesentlich genauere Erkennung von Bildinhalten möglich sein. Mit dem API lassen sich Metadaten für Bilder erstellen und anstößige Inhalte moderieren. Auch etwaig im Bild vorhandene Emotionen, in der Regel in Gesichtern, werden erkannt.

  • Label/Entity Detection: Ermittlung des zentralen Objekts im Bild
  • Optical Character Recognition: Sucht nach Texten im Bild und versucht, diese zu verstehen
  • Safe Search Detection: Ermittlung von anstößigem Inhalt
  • Facial Detection: Gesichtserkennung
  • Landmark Detection: Identifikation von bekannten Natur- und Baudenkmälern
  • Logo Detection: Erkennen von Logos und Zuordnung zu einer Marke

R23 erstellt hier eine Anbindung an Cloud Vision API.

Schreibe einen Kommentar

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert.

* Die DSGVO-Checkbox ist ein Pflichtfeld

*

Ich stimme zu

Aktuell