AutoML für die Klassifizierung von Bildern und Objekterkennung

Open Source Schlagwörter: , , 0 Kommentare

Vor einigen Monaten hat sein AutoML-Projekt vorgestellt, ein Ansatz, der das Design von maschinellen Lernmodellen automatisiert. Google kündigte in einem Blogeintrag den nächsten Schritt in dessen Entwicklung an. Das System konnte einen Algorithmus für die Einordnung von anspruchsvollen Datensätzen wie ImageNet und Coco-Objekterkennung selbstständig erstellen.

Was ist ImageNet?

ImageNet ist eine Datenbank von Bildern, welche für Forschungsprojekte eingesetzt wird. Jedes Bild wird einem Substantiv zugeordnet. Die Substantive sind durch das WordNet-Projekt hierarchisch angeordnet. Zu jedem Substantiv gibt es im Schnitt mehr als 500 Bilder.

ImageNet wird seit der Veröffentlichung, welche 2009 auf der IEEE Conference on Computer Vision and Pattern Recognition stattfand, zum Trainieren von Convolutional Neural Networks verwendet.

Wir visualisieren Ideen!

R23 ist Ihre Digitalagentur für Virtual & Augmented Reality. Wir investieren in immersive Technologien wie Augmented Reality und künstliche Intelligenz, die die Grundlage für die Art und Weise sein werden, wie wir in Zukunft online einkaufen. Mit neuen visuellen Entdeckungstools helfen wir Käufer:innen, neue Produkte zu finden, und mit AR-Erlebnissen helfen wir Menschen, Artikel zu visualisieren, bevor sie sie kaufen.
Charakterdesign / Maskottchen

Fotorealistische Visualisierungen und 3D-Animationen lassen sich schnell und kostengünstig erzeugen und in Ihrem Online-Shop veröffentlichen.

Ein Convolutional Neural Network ist ein künstliches neuronales Netz. Es handelt sich um ein von biologischen Prozessen inspiriertes Konzept im Bereich des maschinellen Lernens. Convolutional Neural Networks finden Anwendung in zahlreichen modernen Technologien der künstlichen Intelligenz, vornehmlich bei der maschinellen Verarbeitung von Bild- oder Audiodaten.

hat AutoML nun für größere Datensätze angepasst: Zum einen sortiert AutoML den Modellbaum in einer optimierteren Weise. Zum anderen ließ Google AutoML die von Cifar-10 analysieren. Das für das Team am besten geeignete Modell wurde direkt auf die Analyse von Coco und Cifar-10 übertragen. Das daraus enstehende Machine-Learning-System nennt Google NASNet.

Google NASNet als Open-Source zur Verfügung. Das Unternehmen hofft, dass sich die Machine-Learning-Community dies zu Nutze macht und eigene Modelle auf Basis von NASNet entwickelt.

Beispiel Objekterkennung mit Faster-RCNN mit NASNet.
Beispiel Objekterkennung mit Faster-RCNN mit NASNet.

Links

https://github.com/tensorflow/models/tree/master/research/slim/nets/nasnet
ImageNet
Coco-Objekterkennung
WordNet

Foto: NASNet erkennt zuverlässig Objekte auf Bildern. (Bild: Google)

Wie können wir Ihnen helfen?

Wir unterstützen Sie bei der Umsetzung Ihres Augmented Reality (AR) oder Virtual Reality (VR) Projektes! Egal ob Produktfotografie, 3D Scan Service, 3D-Visualisierung oder fertige 3D Modelle für AR/VR – wir beraten Sie persönlich und unverbindlich.

Wünschen Sie ein individuelles Angebot auf Basis Ihrer aktuellen Vorlagen, nutzen Sie einfach unser Anfrageformular.



Hat Ihnen dieser Artikel gefallen?

Mit Ihrer Bewertung helfen Sie uns, unsere Inhalte noch weiter zu verbessern.

Gefällt Ihnen dieser Beitrag? Teilen Sie ihn mit anderen. Sie machen uns damit eine große Freude!
R23
R23 : Metaverse, Augmented Reality, Virtual Reality

Hinterlasse Sie einen Kommentar

An der Diskussion beteiligen?
Hinterlassen Sie uns einen Kommentar!

Ihre E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert

Ralf Dreiundzwanzig: Atelier für Virtual & Augmented Reality

Aktuell