Warum Google sein neues KI-Modell Gemini für das leistungsfähigste hält
Geht es nach dem Google-CEO Sundar Pichai, läutet Gemini, das künftig viele Google-Produkte und Dienste unterstützen soll, ein neues Zeitalter ein.
Gemini geht rund ein Jahr nach dem Erstauftritt von ChatGPT an den Start. Es ist absehbar, dass Versionen von Googles Gemini und OpenAIs ChatGPT-Technologie demnächst im Markt konkurrieren werden. An Zuversicht für das Rennen um den KI-Markterfolg fehlt es dem Anbieter keinesfalls.
"Diese neue Ära von Modellen stellt eine der größten wissenschaftlichen und technischen Anstrengungen dar, die wir als Unternehmen unternommen haben", sagt Google-CEO Sundar Pichai bei der Vorstellung von Googles neuem KI-Modells. "Gemini ist unser bisher leistungsfähigstes Modell, das in vielen führenden Benchmarks die beste Perfomance aufweist". Gemini sei laut Pichai "von Grund auf multimodal entwickelt, was bedeutet, dass Gemini verschiedene Arten von Informationen wie Text, Code, Audio, Bild und Video verstehen und nahtlos miteinander kombinieren kann."
Das Large Language Model (LMM) Gemini wird zunächst den KI-Chatbot Bard antreiben und ihn beim fortgeschrittenem Verständnis und logischem Denken, bei der Planung und anderen Fähigkeiten unterstützen. Gemini soll auch in die generative Sucherfahrung von Google integriert werden und dann Suchanfragen mit Texten beantworten. Ab 2024 wird Gemini in weiteren Produkten und Diensten verfügbar sein, darunter Search, Chrome und Duet AI.
LMM in drei Varianten
Gemini Ultra ist Googles größtes LLM. Nach Angaben des Herstellers kann diese Variante menschliche Experten bei massiven Multitasking-Sprachverständnis (MMLU) übertreffen, weil es in Dutzenden von Fachgebieten - etwa Physik, Mathematik, Recht und Geschichte - umfassend trainiert ist.
"Die Leistung von Gemini Ultra übertrifft den aktuellen Stand der Technik in 30 der 32 der üblichen akademischen Benchmarks. Mit einer Punktzahl von 90 Prozent ist Gemini Ultra das erste Modell, das menschliche Experten bei MMLU übertrifft", berichtete Pichai stolz.
Gemini Pro wird künftig viele KI-Dienste von Google stützen und bildet bereits jetzt das Rückgrat von Google Bard. Gemini Pro sei Googles bestes Modell für die Skalierung über eine breite Palette von Aufgaben hinweg, schrieb das Unternehmen.
Gemini Nano ist die leichtgewichtigere Gemini-Variante, die direkt auf Geräten und für On-Device-Aufgaben, auch in Edge-Umgebungen, zum Einsatz kommen soll. Zudem kann sie nativ und offline auf Android-Geräten ausgeführt werden. Google Pixel 8-Nutzer sollen die neuen Nano-Funktionen noch in diesem Jahr über Nano erhalten.
"Gemini ist unser bisher flexibelstes Modell - es ist in der Lage, effizient auf allem zu laufen, von Rechenzentren bis hin zu mobilen Geräten", erläuterte Demis Hassabis, CEO und Mitbegründer des Google-KI-Geschäftsbereichs DeepMind in einem Blogpost. "Seine hochmodernen Fähigkeiten werden die Art, wie Entwickler und Unternehmenskunden KI entwickeln und skalieren, erheblich verbessern."
Zugang zu Gemini Pro können Unternehmenskunden und Entwickler bereits ab dem 13. Dezember bekommen, entweder über die Gemini-API in Google Cloud Vertex AI oder über das kostenlose webbasierte Entwicklertool Google AI Studio, um Anwendungen schnell zu prototypisieren und zu starten.
Grundsätzlich plant der Anbieter, Gemini über Google Cloud an Kunden zu lizenzieren, damit diese es in ihren eigenen Workloads und Anwendungen einsetzen können.
Erweiterte Codierfähigkeiten
Ein wichtiger Anwendungsfall für Gemini ist die fortgeschrittene Kodierung. Laut Demis Hassabis, KI-Forscher bei Google, kann Gemini hochwertigen Code in den beliebtesten Programmiersprachen wie Python, Java, C++ und Go verstehen, erklären und generieren.
Seine Fähigkeit, sprachenübergreifend zu arbeiten und komplexe Informationen zu verstehen, mache es zu einem der weltweit führenden Grundlagenmodelle für die Programmierung. "Gemini kann als Motor für fortgeschrittenere Kodierungssysteme verwendet werden", sagte Hassabis. "Wir freuen uns darauf, dass Programmierer zunehmend leistungsfähige KI-Modelle als kollaborative Werkzeuge nutzen können, die ihnen helfen, über Probleme nachzudenken, Code-Entwürfe vorzuschlagen und bei der Implementierung zu helfen - damit sie Apps schneller veröffentlichen und bessere Dienste entwickeln können".
Der Google-CEO über die Zukunft der KI
Sein Unternehmen habe hart daran gearbeitet, die Sicherheit und den Verantwortungssinn von Gemini zu gewährleisten, sowohl durch interne und externe Tests als auch durch strenge Sicherheitsrisikobewertungen, berichtete Pichai.
"KI hat das Potenzial, Möglichkeiten zu schaffen - vom Alltäglichen bis zum Außergewöhnlichen - für Menschen überall", sagte Pichai. "Sie wird neue Wellen der Innovation und des wirtschaftlichen Fortschritts auslösen und Wissen, Lernen, Kreativität und Produktivität in einem Ausmaß fördern, wie wir es noch nie zuvor gesehen haben."
Das Ziel, das Google mit Gemini verfolge, sei es, die KI für jeden Menschen auf der Welt hilfreicher zu machen. "Das ist eine unglaubliche Dynamik, und doch beginnen wir erst an der Oberfläche dessen zu kratzen, was möglich ist", so Pichai. "Ich glaube, dass der Wandel, den wir gerade mit der KI erleben, der tiefgreifendste in unserem Leben sein wird."