Machine Learning im Einsatz
Maschinelles Lernen und künstliche Intelligenz revolutionieren nicht nur die Datenverarbeitung, sondern eröffnen ganz neue Möglichkeiten der Problemlösung. Diese Chancen sind noch größer, wenn wir das Potenzial von Open-Source-Tools mehr Entwicklern und Forschern zur Verfügung stellen. Was könnten wir bewirken, wenn wir diese Technologien gemeinsam nutzen würden, um Probleme des Klimawandels, des Gesundheitswesens und der Bildung zu lösen? Je intelligenter und vielseitiger maschinelles Lernen und künstliche Intelligenz eingesetzt werden können, desto mehr Möglichkeiten eröffnen sich. Auf der Google I/O 2016 lernte ich das Open-Source-Projekt TensorFlow kennen.
Im Herbst 2016 veröffentlichte Google “Show and Tell” zum Erstellen automatischer Bildunterschriften als TensorFlow-Modell. Das Modul erkennt und beschreibt Fotos auf der Basis vorhandener Beschreibungen anderer Fotos, die von menschlichen Betrachtern verfasst wurden. Dabei ist es nicht nur in der Lage, ähnliche Fotos zu klassifizieren und auf dieselbe Art zu beschreiben, sondern auch vorhandene Beschreibungen zu kombinieren und in einen neuen Kontext zu setzen. Der Wechsel zu TensorFlow und die Verbesserungen am Modul selbst führen zu einer besseren Erkennungsrate.
Google hat einen weiteren wichtigen Schritt im Feld der künstlichen Intelligenz gemacht: Über Cloud Vision API steht uns die Bilderkennung zur Verfügung.
- Label/Entity Detection: Ermittlung des zentralen Objekts im Bild
- Optical Character Recognition: Sucht nach Texten im Bild und versucht, diese zu verstehen
- Safe Search Detection: Ermittlung von anstößigem Inhalt
- Facial Detection: Gesichtserkennung
- Landmark Detection: Identifikation von bekannten Natur- und Baudenkmälern
- Logo Detection: Erkennen von Logos und Zuordnung zu einer Marke
R23 ist der Spezialist für imagefördernde Bilder und unterstützt Unternehmen dabei sich erfolgreich und attraktiv zu präsentieren und damit neue Kunden anzusprechen. 1999 gegründet, gestalten wir heute in Hagen und bei unseren Kunden vor Ort repräsentative Lösungen für die individuellen Herausforderungen. Bei unserer Arbeit geht es uns sowohl um die ausdrucksstarke und kompetente Darstellung der Führungskräfte und Mitarbeiter als auch um die repräsentative Abbildung der Produkte. Wir nutzen innovative Technologien wie Virtual Reality, 3D-Internet-Technologien und Machine Learning von Google.
Wer Lust auf einen Bilderkennungstest mit r23 hat, geht auf diese Website, und lädt ein Bild seiner Wahl hoch. Um nur einmal zu sehen, wie das Ganze funktioniert, kann man auf eine Vorauswahl an Bildanalysen zurückgreifen.