Auf dieser Seite zeigen wir Euch das Ergebnis der Bilderkennung über unser Plugin für WordPress. Wir verwenden für das Bildbeschreibungsmodul die Google Cloud Vision API. Wir sind r23, unabhängiger Full-Service-Dienstleister für Deep Learning, Künstliche Intelligenz und Machine Learning.
Das Plugin erkennt und beschreibt Bilder auf der Basis vorhandener Beschreibungen anderer Bilder, die von menschlichen Betrachtern verfasst wurden. Nach einigen Sekunden der „Überlegung“ gibt Google Cloud Vision eine Reihe von Vorschlägen aus, was auf den Bildern zu sehen ist, sowie eine Prozentzahl, mit der angegeben wird, wie wahrscheinlich es sich um den jeweiligen Vorschlag handelt.
Die Fotovorlage für folgende Auswertung war ein Shooting mit der wunderbaren Christal in Bochum.
Was kann das Bildbeschreibungsmodul von r23?
Ergebnis:
Die zentralen Objekte im Bild:
Red95%
Clothing92%
Woman91%
Person90%
Lady85%
Beauty84%
Photography84%
Girl82%
Model73%
Black Hair72%
Undergarment72%
Bei Google Cloud Machine Learning wird das Potenzial der Google-Infrastruktur mit den neuesten Innovationen im Bereich Deep Learning kombiniert. Mit Cloud Machine Learning kannst Du Prognosemodelle für Deine Daten erzeugen.
Sekundenschnelle Bereitstellung in mehr als 100 Sprachen. Bereichere deine Metadaten für Bilder um automatische Übersetzungen von Google Übersetzer.
Übersetzung:
Red 95%
Bekleidung 92%
Frau 91%
Person 90%
Lady 85%
Schönheit 84%
Fotografie 84%
Girl 82%
Modell 73%
Schwarze Haare 72%
Undergarment 72%
Gesichtserkennung:
R23 weist darauf hin, dass es sich nicht um eine Wiedererkennung oder Identifikation handelt. Vielmehr wird nur geprüft, ob überhaupt ein Gesicht im Bild präsent ist, wo sich wesentliche Merkmale wie Auge, Nase und Mund befinden.
Farben:
Merkmale:
R23 weist darauf hin, dass es sich nicht um eine Wiedererkennung oder Identifikation handelt. Vielmehr wird nur geprüft, ob überhaupt ein Gesicht im Bild präsent ist, wo sich wesentliche Merkmale wie Auge, Nase und Mund befinden.
RIGHT_EYE: x:432.158 y:330.68713
LEFT_OF_LEFT_EYEBROW: x:289.99768 y:334.1596
RIGHT_OF_LEFT_EYEBROW: x:329.66788 y:327.89532
LEFT_OF_RIGHT_EYEBROW: x:377.76947 y:317.5909
RIGHT_OF_RIGHT_EYEBROW: x:453.572 y:297.82147
MIDPOINT_BETWEEN_EYES: x:356.8514 y:350.00418
NOSE_TIP: x:356.7235 y:423.09998
UPPER_LIP: x:382.58478 y:461.843
LOWER_LIP: x:399.315 y:498.75082
MOUTH_LEFT: x:374.20905 y:478.09912
MOUTH_RIGHT: x:440.52744 y:465.92014
MOUTH_CENTER: x:394.1057 y:477.39548
NOSE_BOTTOM_RIGHT: x:402.93668 y:420.14264
NOSE_BOTTOM_LEFT: x:357.10217 y:428.90057
NOSE_BOTTOM_CENTER: x:375.12427 y:435.91498
LEFT_EYE_TOP_BOUNDARY: x:318.03534 y:350.65027
LEFT_EYE_RIGHT_CORNER: x:345.63055 y:356.3997
LEFT_EYE_BOTTOM_BOUNDARY: x:327.05353 y:365.83014
LEFT_EYE_LEFT_CORNER: x:310.98724 y:359.82217
LEFT_EYE_PUPIL: x:321.2241 y:358.3791
RIGHT_EYE_TOP_BOUNDARY: x:417.04916 y:329.5092
RIGHT_EYE_RIGHT_CORNER: x:449.68652 y:329.94446
RIGHT_EYE_BOTTOM_BOUNDARY: x:429.90863 y:342.74646
RIGHT_EYE_LEFT_CORNER: x:403.7583 y:342.79688
RIGHT_EYE_PUPIL: x:422.61404 y:336.779
LEFT_EYEBROW_UPPER_MIDPOINT: x:301.38864 y:318.3574
RIGHT_EYEBROW_UPPER_MIDPOINT: x:408.66217 y:295.5304
LEFT_EAR_TRAGION: x:356.87524 y:401.23734
RIGHT_EAR_TRAGION: x:572.0153 y:349.28656
FOREHEAD_GLABELLA: x:350.5291 y:322.35464
CHIN_GNATHION: x:415.8838 y:550.7196
CHIN_LEFT_GONION: x:360.27148 y:484.47363
CHIN_RIGHT_GONION: x:562.31476 y:440.90326
Wer Lust auf einen Bilderkennungstest hat, geht auf diese Website, und lädt ein Bild seiner Wahl hoch. Nach einigen Sekunden der „Überlegung“ gibt das selbstlernende System eine Reihe von Vorschlägen aus, was auf dem Foto zu sehen ist, sowie eine Prozentzahl, mit der angegeben wird, wie wahrscheinlich es sich um den jeweiligen Vorschlag handelt.