AutoML für die Klassifizierung von Bildern und Objekterkennung

Open Source Schlagwörter: , , 0 Kommentare

Vor einigen Monaten hat sein AutoML-Projekt vorgestellt, ein Ansatz, der das Design von maschinellen Lernmodellen automatisiert. Google kündigte in einem Blogeintrag den nächsten Schritt in dessen Entwicklung an. Das System konnte einen Algorithmus für die Einordnung von anspruchsvollen Datensätzen wie ImageNet und Coco-Objekterkennung selbstständig erstellen.

Was ist ImageNet?

ImageNet ist eine Datenbank von Bildern, welche für Forschungsprojekte eingesetzt wird. Jedes Bild wird einem Substantiv zugeordnet. Die Substantive sind durch das WordNet-Projekt hierarchisch angeordnet. Zu jedem Substantiv gibt es im Schnitt mehr als 500 Bilder.

ImageNet wird seit der Veröffentlichung, welche 2009 auf der IEEE Conference on Computer Vision and Pattern Recognition stattfand, zum Trainieren von Convolutional Neural Networks verwendet.

Verwandeln Sie Ihren Commerce mit AR und 3D-Produktvisualisierung!

Bei uns geht es um Techniken, die es schaffen, das Produkt zum Erlebnis zu machen. Virtual & Augmented Reality, 360 Grad-Videos, Darstellungen in 3D, virtuelle Showrooms. Die Besucher:innen sollen eintauchen in die Welt des Unternehmens mit immersiven Technologien.
Charakterdesign / Maskottchen

Sie können uns mit der Erstellung von individuellen 3D-Visualisierungen beauftragen. Jeder kann 3D-Visualisierungen bei unserem Kreativservice bestellen - unabhängig davon, ob Sie nur ein einzelnes 3D-Modell benötigen oder viele.

Ein Convolutional Neural Network ist ein künstliches neuronales Netz. Es handelt sich um ein von biologischen Prozessen inspiriertes Konzept im Bereich des maschinellen Lernens. Convolutional Neural Networks finden Anwendung in zahlreichen modernen Technologien der künstlichen Intelligenz, vornehmlich bei der maschinellen Verarbeitung von Bild- oder Audiodaten.

hat AutoML nun für größere Datensätze angepasst: Zum einen sortiert AutoML den Modellbaum in einer optimierteren Weise. Zum anderen ließ Google AutoML die von Cifar-10 analysieren. Das für das Team am besten geeignete Modell wurde direkt auf die Analyse von Coco und Cifar-10 übertragen. Das daraus enstehende Machine-Learning-System nennt Google NASNet.

Google NASNet als Open-Source zur Verfügung. Das Unternehmen hofft, dass sich die Machine-Learning-Community dies zu Nutze macht und eigene Modelle auf Basis von NASNet entwickelt.

Beispiel Objekterkennung mit Faster-RCNN mit NASNet.
Beispiel Objekterkennung mit Faster-RCNN mit NASNet.

Links

https://github.com/tensorflow/models/tree/master/research/slim/nets/nasnet
ImageNet
Coco-Objekterkennung
WordNet

Foto: NASNet erkennt zuverlässig Objekte auf Bildern. (Bild: Google)

Wie können wir Ihnen helfen?

Wir unterstützen Sie bei der Umsetzung Ihres Augmented Reality (AR) oder Virtual Reality (VR) Projektes! Egal ob Produktfotografie, 3D Scan Service, 3D-Visualisierung oder fertige 3D Modelle für AR/VR – wir beraten Sie persönlich und unverbindlich.

Wünschen Sie ein individuelles Angebot auf Basis Ihrer aktuellen Vorlagen, nutzen Sie einfach unser Anfrageformular.



Gefällt Ihnen dieser Beitrag? Teilen Sie ihn mit anderen. Sie machen mir damit eine große Freude!
R23
Fehler auf blog.r23.de entdeckt?
Wir freuen uns über eine Mail an fehlerhinweis@r23.de!
Inhaltliches Feedback?
Gerne als Leser:innenkommentar unter dem Text.
R23

Kommentar

Möchten Sie mitdiskutieren?
Hinterlassen Sie einen Kommentar!

Ihre E-Mail-Adresse wird nicht veröffentlicht.

R23

Aktuell