Die Entwicklung von LLMs und deren Chat-Anwendungen ist ein Rennen, das sich an der Spitze nur sehr wenige Technologie-Unternehmen leisten können.
Aus diesem Grund ist es (an der Spitze) ein Rennen zwischen OpenAI (ChatGPT), Anthropic (Claude) und Goolge (Gemini). Auch Meta (Llama) versucht mit seinem OpenSource-Ansatz mitzuspielen.
Eine ganze Zeit sah es so aus, als hätte OpenAI mit ChatGPT einen Vorsprung, der nur sehr schwer einholbar ist.
Schaut man sich nur die Leistungs-Tests an, ist diese Ära von OpenAI’s klarer Führung nun endgültig vorbei. Bezüglich der Leistung in unterschiedlichen Test-Kategorien ist das neue Modell von Anthropic namens Claude 3.5 Sonnet nun der Platzhirsch und hat an fast allen Messpunkten nun die Nase vorne.
Was bedeutet diese Entwicklung für uns – die täglichen Anwender – die ihre Arbeit mit Hilfe von LLMs schneller und qualitativ besser erledigen möchten?
Sollte man nun wechseln?
Auf diese Frage gehe ich in diesem Artikel ein.
Los geht’s! 🚀
Der reine Leistungsvergleich spricht eine relativ deutliche Sprache
Der reine Leistungsvergleich der großen Player:
Die Unterschiede sind nicht gravierend – aber Claude 3.5 Sonnet hat die Nase in den meisten Test-Kategorien vorne.
Würden wir unsere Entscheidung also rein hinsichtlich der Leistungsfähigkeit der Modelle treffen wäre aktuell die klare Wahl Claude 3.5.
Aber, dies schon mal vorausgeschickt, so funktioniert die Welt im Business nicht. Wir sollten uns auch anschauen, wie leicht uns die Tools unsere tägliche Arbeit machen und in wie fern wir bei den Anbietern auf Features zurückgreifen können, die das ermöglichen.
Der Funktionsumfang, also die Features, sollten bei der Entscheidung eine wichtige Rolle spielen
Neben der oben dokumentierten Leistungsfähigkeit unserer täglich genutzten AI-Tools sind die Features der Tools m.E. fast bedeutender, wenn die Leistungswerte aus den Tests so nahe beieinander liegen wie in diesem Fall.
Und hier liegt ChatGPT aus meiner Sicht noch weit vorne.
ChatGPT kann aufs Internet zugreifen - Claude nicht
Die Möglichkeit aufs Internet zuzugreifen und aktuellen News und Informationen in die Arbeit mit einem AI-Chat-Bot einzubeziehen ist m.E. ein bedeutendes Feature, das ChatGPT hat und Claude aktuell nicht anbietet.
Bei Claude gibt es keine GPTs
Für mich das Hauptgrund überwiegend mit ChatGPT zu arbeiten. Ich nutzte GPTs im meinem Arbeitsalltag sehr intensiv. GPTs bieten mir die Möglichkeit sich häufiger wiederholende Aufgaben schnell und in der immer gleichen Struktur mit Hilfe von AI abzuarbeiten.
Claude bietet aktuell keine vergleichbare Funktion an.
Claude kann keine Bilder generieren
Mit ChatGPT besteht die Möglichkeit auf DALL-E zuzugreifen und in ChatGPT Bilder zu generieren. Auch diese Funktion bietet Claude nicht an.
Das wäre für mich persönlich nun kein Entscheidungsgrund, da ich für Bilder zu 90% Midjourney, und damit ein anderen Bild-Generierungs-Tool nutze.
Aber dem “normalen” Business-Anwender kann die Funktion Bilder zu generieren schon sehr helfen, wenn wir z.B. an Situation wie Bilder für Präsentationen oder Social Media Postings denken.
Spracheingaben / App-Nutzung
Beide Anbieter bieten für iOS- und Adroid-Smartphones entsprechende Apps an, so dass man die AI-Tools auch komfortabel auf dem Smartphone nutzen kann.
Aber auch hier hat ChatGPT 4o die Nase deutlich vorne. Vor allem die VoiceChats in ChatGPT, die mit der Version 4o eingeführt wurden sind ein Feature, welches ich relativ hoch bewerte und das OpenAI wirklich sehr innovativ und cool umgesetzt hat.
Bei Claude 3.5 Sonnet gibt es keine relevanten Features, die ChatGPT 4o nicht hat
Ging der Benchmark-Test ganz klar an Claude 3.5 Sonnet, geht der Feature-Test ganz klar an ChatGPT 4o.
Fazit / Empfehlungen
Weil mir Features wie GPTs und Zugriff auf das Internet wichtiger sind als leicht bessere Outputs, bleibt mein Haupt-Tool klar ChatGPT 4o.
Ich habe die kostenpflichtige Version für beide Modelle abonniert und immer die freie Wahl. Zu 85% fällt diese auf ChatGPT.
Für ganz normale End-Anwender, die ein AI-Tool nutzen möchten, ist dies auch meine Empfehlung. ChatGPT 4o bietet aktuell das praktischere Gesamtpaket.
Zumindest im Moment.
Wir werden dieses Jahr noch viele neue Versionen und Features sehen und sollten von Zeit zu Zeit bewerten, ob sich ein Wechsel oder eine Ergänzung unseres AI-TechStacks lohnen könnte.
Mir – und den meisten End-Anwendern – ist bei meiner täglichen Arbeit nicht wichtig, ob das eingesetzte LLM besseren Python-Code (Programmiersprache) schreiben kann oder ein komplexes mathematisches Problem 5% besser lösen kann als das Mitbewerber-Tool.
Es ist mir wichtig mit den AI-Tools die ich im Einsatz habe schneller, besser und kreativer arbeiten zu können.
Man darf gespannt sein, was uns Google, Anthropic, Meta und OpenAI in den nächsten Monaten an neuen Verbesserungen und nützlichen Features anbieten werden.
Es ist auch sehr gut, dass nicht ein Unternehmen alle anderen Anbieter am Markt deutlich outperformt und wir die Wahl haben, mit welchen Tools wir uns von künstlicher Intelligenz unterstüzen lassen.
Sei es nun aus technischen, ethischen oder funktionalen Gesichtspunkten – es ist immer gut die Wahl zu haben.
Eine Abhängigkeit von einem Anbieter der alternativlos erscheint wäre nicht gut für den Markt und die verantwortungsvolle Weiterentwicklung von AI-Tools.
✌🏼Kai Michael Schäfer
0 comments