Der Start von Google Gemini in dieser Woche bringt das Potenzial der Multimedia-Modellierung mit sichwobei die Eingabeinformationen Video, Bilder, Code oder Audio sein können, den Kontext verstehen und eine Reaktion auf Benutzeraufforderungen erzeugen.
Laut Google ist es das leistungsstärkste generative Modell für KI und wird in drei Modellen verfügbar sein: Ultra, Pro und Nano. Fortgeschrittenere Versionen werden erst im nächsten Jahr verfügbar sein, es ist jedoch bereits möglich, einige Funktionen zu nutzen. Derzeit ist der Modus noch eingeschränkt, nur im Text und nur auf Englisch.
Die Gemini Pro-Vorlage ist in den Bard-Chatbot integriert und kann über die Website unter aufgerufen werden bard.google.com. Sie müssen Zugriff auf ein Google-Konto haben und angemeldet sein, da dies im anonymen Modus nicht möglich ist.
In der Zukunft Ziel ist es, auch Multimedia-Funktionen in Bard zu integrieren, mit Anbindung an verschiedene Google-Anwendungen, unter anderem Gmail oder Youtube.. Dies ist ein wesentliches Unterscheidungsmerkmal im Vergleich zu anderen Modellen wie ChatGPT, GPT 4 von OpenAI oder Copilot und Bing von Microsoft.
Google verspricht, Gemini bald in anderen Sprachen zu Bard hinzuzufügen, nennt jedoch keine Daten. Die leistungsstärkste Version von Gemini, Ultra, soll 2024 verfügbar sein und alles deutet darauf hin, dass sie in einer „verbesserten“ Version von Bard, Bard Advanced, verwendet werden könnte.
Sehen Sie sich das Google Gemini-Präsentationsvideo an
„Amateur-Musikpraktiker. Lebenslanger Unternehmer. Entdecker. Reisefan. Nicht entschuldigender Fernsehwissenschaftler.“
More Stories
Samsung Galaxy AI diesen Monat auf Portugiesisch aus Portugal
Plastik: Es gibt Chemikalien, die uns entgehen (insbesondere in recycelten Materialien) | Verschmutzung
Der potenzielle Landeplatz für die Mission zum Mond wurde enthüllt