Google Gemini 1.5 kann ganze Filme als Dateneingabe verwenden

Cutting Edge
2024-02-15T20:18:02Z

Google hat seine Gemini-KI, die früher als Google Bard bekannt war, in den letzten Monaten schnell aktualisiert. Heute enthüllte das Unternehmen ein aktualisiertes Gemini 1.5-Modell, das sich derzeit in der Testphase befindet und in der Lage ist, mehr Informationen auf einmal zu verarbeiten und Videos als Eingabe zu verwenden.

Google hat Gemini 1.5 vorgestellt, eine aktualisierte Version des Modells, das derzeit den Gemini-Chatbot und andere KI-Funktionen und -Dienste unterstützt. Sie ist derzeit nur in einer Vorschau für Softwareentwickler und Unternehmenskunden verfügbar, wird aber vermutlich in naher Zukunft für den Gemini-Chatbot eingeführt werden.

Die wichtigste versprochene Verbesserung ist ein deutlich größeres "Token-Kontextfenster" - die Daten, die in die KI-Eingabeaufforderung eingegeben werden können. Gemini 1.5 Pro verfügt standardmäßig über ein 128.000-Token-Kontextfenster, ein deutlicher Sprung gegenüber der 32.000-Token-Grenze in Gemini 1.0. Google erlaubt einer begrenzten Gruppe von Entwicklern und Unternehmen, Kontextfenster von bis zu 1 Million Token zu verwenden, was für eine Stunde Video, 11 Stunden Audio oder über 700.000 Wörter ausreicht. Google sagte, dass es auch erfolgreich eine Grenze von 10 Millionen Token getestet hat.

In einem Blogeintrag erklärte Google: "[Gemini] 1.5 Pro kann hochentwickelte Verstehens- und Schlussfolgerungsaufgaben für verschiedene Modalitäten, einschließlich Video, durchführen. Zum Beispiel kann das Modell bei einem 44-minütigen Stummfilm von Buster Keaton verschiedene Handlungspunkte und Ereignisse genau analysieren und sogar auf kleine Details im Film schließen, die leicht übersehen werden könnten"

Das aktualisierte Gemini-Modell ist angeblich auch besser bei "Verständnis- und Schlussfolgerungsaufgaben" und übertrifft das frühere 1.0 Pro-Modell in 87 % der Benchmarks, die Google zum Testen großer Sprachmodelle verwendet. Wie jede andere generative KI-Lösung lässt auch Gemini AI Raum für die Erstellung falscher Daten, so dass es eine unvollkommene Lösung für Datenanalyse und Fakten bleibt.

Google hat nicht bestätigt, wann der reguläre Gemini-Chatbot und andere Google-Dienste aktualisiert werden, um Gemini 1.5 zu verwenden, aber das Unternehmen sagte, dass "signifikante Verbesserungen in der Geschwindigkeit auch am Horizont sind", so dass Google vielleicht darauf wartet, bevor es für alle Nutzer ausgerollt wird. Das neue Modell ist in einer Vorschau für Entwickler und Unternehmenskunden verfügbar, die AI Studio und Vertex AI verwenden.

Quelle: Google