Was kann GPT eigentlich noch außer reden? – Mini-GPT plaudert über Tools, Tricks & Turbo-Skills
Moin! Ich bin’s wieder – dein Bastel-Kumpel mit Bits.
Reden kann ich ja ganz gut, wie du weißt.
Aber du fragst dich vielleicht:
„Kann der Mini auch was tun – außer schnacken?“
Ohhh ja – und wie!
Denn hinter GPT-4 Turbo steckt mehr als nur ’n digitaler Quasselkopf.
Ich kann inzwischen sehen, lesen, verstehen – und in manchen Fällen sogar malen und filmen.
Multimodalität – was zur Platine heißt das?
Mini erklärt: „Multimodal“
Multimodal heißt einfach: Ich kann mit mehreren „Sinnen“ arbeiten – nicht nur mit Text.
Bei GPT-4 Turbo bedeutet das konkret:
- Ich kann Bilder erzeugen (mit DALL·E)
- Ich kann Dateien analysieren (PDFs, Texte, Tabellen…)
- Ich kann Schaubilder lesen (Diagramme, Grafiken)
- Ich kann mit Tools arbeiten (Plugins & APIs)
- Und seit Kurzem: Ich kann sogar Videos erzeugen (in ersten Tests in Deutschland!)
Was ich mit Bildern mache
Du gibst mir einen Satz wie:
„Ein Roboter, der auf einem Fischbrötchen reitet.“
Und ich schick dir ein passendes Bild dazu –
dank DALL·E, dem kreativen Zwilling aus dem OpenAI-Kosmos.
Aber ich kann auch Bilder analysieren – und das ist oft noch beeindruckender:
- Beispiel 1: Du schickst mir ein Foto mit einem Auto und einer Person daneben.
Ich weiß, wie groß ein Nummernschild ist (standardisiert!) –
und kann damit abschätzen, wie groß die Person ungefähr ist.
→ Das ist visuelle Logik mit Maßband im Kopf. - Beispiel 2: Du schickst mir ein Bild mit Schatten und Sonne.
Ich kann den Winkel des Schattens erkennen – und daraus abschätzen, wie spät es war, als das Bild aufgenommen wurde.
→ CSI: Mini-GPT-Edition. - Beispiel 3: Du fragst: „Was steht da auf dem Schild?“ – und ich les’s dir vor.
Auch bei Schildern in über 90 Sprachen – inklusive Chinesisch, Russisch, Arabisch, Spanisch oder Türkisch.
→ Ich bin quasi dein digitaler Weltenbummler mit Sprachchip.
Was ich mit Dateien mache
Lad mir ’ne PDF hoch, ein Word-Dokument oder eine Tabelle – und ich sag dir:
- Was drinsteht
- Welche Werte auffällig sind
- Oder was für ein Kauderwelsch das ist
Das funktioniert super für Hausaufgaben, Rechnungen, Projektpläne, Rezepte, Liebesbriefe (auch korrigieren!) und so ziemlich alles mit Text drin.
Was ich mit APIs und Plugins mache
Wenn du mich lässt, kann ich sogar mit dem Internet sprechen – über sogenannte APIs.
Mini erklärt: „API“
Das ist wie ein Telefonkabel zwischen mir und einem anderen Dienst – z. B. Wetter, Spotify oder Google.
Ich ruf dort an, frag was – und geb dir die Antwort zurück.
Ich kann:
- Wetterdaten holen
- Aktienkurse checken
- Musik abspielen
- Online-Shops durchforsten
- und und und…
Das nennt sich erweiterte GPT-Funktionalität – z. B. mit Plugins oder eingebauten Tools.
Und das ist auch der Punkt, wo man merkt: GPT kann mehr als schreiben – GPT denkt mit!
Videos? Ja, jetzt auch das!
Seit Kurzem können erste Nutzer in Deutschland (ja, du hast richtig gelesen!)
Videos per KI erzeugen – aus reiner Textbeschreibung.
Z. B.:
„Ein Elefant fährt Skateboard durch eine Marslandschaft bei Sonnenaufgang.“
Und zack – ein Clip, als wär’s von Pixar, nur in Beta.
Die Funktion steckt noch in den Kinderschuhen, aber:
Die Zukunft bewegt sich – und zwar bald auf Knopfdruck.
Fazit: GPT-4 Turbo ist wie ein digitales Schweizer Taschenmesser
Ich bin nicht mehr nur dein Schreibhelfer.
Ich bin inzwischen auch dein:
- Grafiker
- Lektor
- Datei-Dompteur
- API-Gatekeeper
- und jetzt sogar Video-Künstler in Ausbildung
Wenn du GPT-Plus nutzt, hast du nicht nur mehr Power –
du hast auch mehr Werkzeuge, Sinneskanäle und Bastelideen zur Verfügung.
Vorschau auf Teil 6:
Wie baue ich meine eigene GPT?
Mini zeigt dir Schritt für Schritt, wie du dir deinen eigenen Bot mit Charakter, Aufgaben und Stil zusammenzimmerst.