Schlagwort-Archive: Llava

Spielen mit dem Alpaca: Llava

Ich habe zwei Modelle für Alpaca installiert: Llama 3.1 und Llava. Llava hat eine Bilderkerkennung, die ich ausprobieren musste.

Die Testbilder

Mein erstes Testbild war ein Sonnenuntergang, den ich vor Jahren an einem Feld in Fröndenberg fotografiert habe. Nichts besonderes, sondern einfach ein Bild entstanden am Straßenrand. Motiv gesehen, angehalten, Foto gemacht, wieder eingestiegen und weiter gefahren. Nett anzusehen, aber mehr auch nicht. Kamera war eine Samsung NX300.https://res.craft.do/user/full/a7353577-1054-f012-dcec-3f575fa84ce1/doc/567edddc-55ec-41e8-a06e-0404544aaa9e/22f810c2-7dfa-4e4b-bd2e-ad64ed3be530

Testbild Nummer zwei habe ich bei einem Auftritt von Marduk beim Rock Hard Festival geschossen. Ein intensiver Moment im Konzert, ein geiler Gig. (Und tatsächlich eine meiner Lieblingsbands.) Kamera war eine Nikon D90.https://res.craft.do/user/full/a7353577-1054-f012-dcec-3f575fa84ce1/doc/567edddc-55ec-41e8-a06e-0404544aaa9e/3ab94e65-2b64-4550-8a86-3ed7642e9e17

Testbild Nummer drei ist etwas komplizierter. Es handelt sich um ein verunglücktes Handy-Panorama, aufgenommen mit einem Xiaomi Redmi Note 11. Man kann deutlich die Bildfehler beim Übergang zum letzten Drittel des Bildes (betrachtet von links nach rechts) erkennen. Das Motiv sollte bekannt sein: Schloss Neuschwanstein, gesehen von der Marienbrücke.https://res.craft.do/user/full/a7353577-1054-f012-dcec-3f575fa84ce1/doc/567edddc-55ec-41e8-a06e-0404544aaa9e/ebfc5c33-0cc9-4b91-82e5-d234efa425ad

Hier nun was Llava zu den Bildern sagen konnte:

Bild 1: Sonnenuntergang

„The image shows a vibrant sunset or sunrise, with the sky filled with warm hues of orange and pink. The clouds are layered and there is a reflection of light on them. In the foreground, there appears to be a field or meadow with some crops or plants growing in rows. There’s also a fence visible, likely separating different agricultural areas. The bottom part of the image seems to have a transparent overlay that shows what the landscape looks like during daylight hours.

Bild 2: Marduk

„This image appears to show a musician performing on stage. The individual is holding up their hand in a gesture that could suggest they are addressing the audience or perhaps performing. They seem to be part of a band, as indicated by the presence of other musicians and sound equipment in the background. The atmosphere suggests that this is likely an outdoor concert during either sunset or sunrise, given the sky’s coloration. The image captures the excitement and energy associated with live music events.“

Bild 3: Schloss Neuschwanstein

„The image depicts a scenic landscape featuring a castle perched on a cliff. The castle, with its imposing structure and fortified walls, stands out against the backdrop of a clear sky. The surrounding environment is lush and green, indicative of a healthy and thriving ecosystem, possibly a region known for its natural beauty and conservation efforts.
The image appears to be a photograph taken during daylight hours, as evidenced by the warm sunlight illuminating the scene. There’s a sense of tranquility and timelessness associated with such landscapes, which might suggest that this location is significant historically or culturally.
The foreground shows a path leading towards the castle, inviting viewers to imagine walking along it to explore the ruins or learn about the history of the place. The perspective from a lower angle enhances the grandeur and prominence of the castle in the landscape.
The text „Castle in the cliff“ is visible in the image, which confirms that this is indeed an image of a castle situated on a cliff. This labeling helps to identify the subject matter within the photograph.“

Kleines Fazit

Die Ergebnisse sind gleichzeitig überraschend und erschreckend. Auf der einen Seite sind die Aussagen wesentlich detaillierter und besser als ich es bei einem auf meinem Laptop installierten System für möglich gehalten hätte. Auf der anderen Seite halluziniert das System doch auch sehr stark (die kursiven Teile der Aussagen).