AutoML für die Klassifizierung von Bildern und Objekterkennung

Open Source Schlagwörter: , , 0 Kommentare
Voiced by Amazon Polly

Vor einigen Monaten hat sein AutoML-Projekt vorgestellt, ein Ansatz, der das von maschinellen Lernmodellen automatisiert. Google kündigte in einem Blogeintrag den nächsten Schritt in dessen Entwicklung an. Das System konnte einen Algorithmus für die Einordnung von anspruchsvollen Datensätzen wie ImageNet und Coco-Objekterkennung selbstständig erstellen.

Was ist ImageNet?

ImageNet ist eine Datenbank von Bildern, welche für Forschungsprojekte eingesetzt wird. Jedes Bild wird einem Substantiv zugeordnet. Die Substantive sind durch das WordNet-Projekt hierarchisch angeordnet. Zu jedem Substantiv gibt es im Schnitt mehr als 500 Bilder.

ImageNet wird seit der Veröffentlichung, welche 2009 auf der IEEE Conference on Computer Vision and Pattern Recognition stattfand, zum Trainieren von Convolutional Neural Networks verwendet.

Ein Convolutional Neural Network ist ein künstliches neuronales Netz. Es handelt sich um ein von biologischen Prozessen inspiriertes Konzept im Bereich des maschinellen Lernens. Convolutional Neural Networks finden Anwendung in zahlreichen modernen Technologien der künstlichen Intelligenz, vornehmlich bei der maschinellen Verarbeitung von Bild- oder Audiodaten.

Google hat AutoML nun für größere Datensätze angepasst: Zum einen sortiert AutoML den Modellbaum in einer optimierteren Weise. Zum anderen ließ Google AutoML die von Cifar-10 analysieren. Das für das Team am besten geeignete Modell wurde direkt auf die Analyse von Coco und Cifar-10 übertragen. Das daraus enstehende Machine-Learning-System nennt Google NASNet.

Google NASNet als Open-Source zur Verfügung. Das Unternehmen hofft, dass sich die Machine-Learning-Community dies zu Nutze macht und eigene Modelle auf Basis von NASNet entwickelt.

Beispiel Objekterkennung mit Faster-RCNN mit NASNet.
Beispiel Objekterkennung mit Faster-RCNN mit NASNet.

Links

https://github.com/tensorflow/models/tree/master/research/slim/nets/nasnet
ImageNet
Coco-Objekterkennung
WordNet

Foto: NASNet erkennt zuverlässig Objekte auf Bildern. (Bild: Google)

Wie können wir Ihnen helfen?

Sie wollen online richtig verkaufen? Wir unterstützen Sie bei der Umsetzung Ihres (AR) oder (VR) Projektes! Egal ob Produktfotografie, 3D Scan Service, 3D-Visualisierung oder fertige 3D Modelle für AR/VR – wir beraten Sie persönlich und unverbindlich.

Wünschen Sie ein individuelles Angebot auf Basis Ihrer aktuellen Vorlagen, nutzen Sie einfach unser Anfrageformular.



Gefällt Ihnen dieser Beitrag? Teilen Sie ihn mit anderen. Sie machen mir damit eine große Freude!
R23
R23

Schreibe einen Kommentar

Ihre E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert.

Senden Sie uns Ihre Videonachricht!

Sie können im r23:Blog Ihren Textkommentar mit einer Videonachricht ergänzen! Diese Nachricht kann bis zu 90 Sekunden lang sein.

Wir freuen uns auf Sie!

Hinweis: Das r23:Blog setzt auf selbstlernende Systeme für die reale Welt.
Mit einer Künstlichen Intelligenz (KI) wird eine Abschrift von Ihrer Videonachricht erstellt.
Für ein optimales Erlebnis von r23:Blog und den dazugehörigen Applikationen wird die Verwendung von Firefox in der aktuellen Version empfohlen. Unterstützt werden weitere aktuelle Browser.

Anleitung: Videonachrichten im r23:Blog

R23

Aktuell