Google verarbeitet gerade mehr als 3,2 Billiarden Tokens pro Monat. Das ist siebenmal mehr als vor einem Jahr. Ich sage dir das nicht, um dich zu beeindrucken. Ich sage es, weil es zeigt, wo die Entwicklung steht: wir sind nicht mehr in der Phase der Experimente. Wir sind in der Phase der Infrastruktur.
Google I/O 2026 fand am 19. und 20. Mai in Mountain View statt, und die zentrale Botschaft war klar: KI hilft nicht mehr nur beim Schreiben. KI handelt. Das klingt nach Marketing. Aber wenn man genau hinschaut, was da präsentiert wurde, steckt dahinter ein echter Paradigmenwechsel, der dich als EPU oder KMU früher betreffen wird als du denkst.
Ich beobachte das seit Jahren in der täglichen Arbeit als KI-Berater mit EPU und KMU in Österreich und der DACH-Region. Und was Google hier zeigt, ist kein Featureupdate. Es ist eine Neuausrichtung der gesamten Plattform. Lass mich das auseinandernehmen.
Gemini 3.5 Flash: Das schnellste relevante Modell seit Jahren
Gemini 3.5 Flash kombiniert Frontier-Intelligence mit der Fähigkeit, agentische Aufgaben auszuführen. Es übertrifft Gemini 3.1 Pro in Coding, agentischen und multimodalen Benchmarks, bei der Kosten- und Geschwindigkeit der Flash-Serie, und ist viermal schneller als andere Frontier-Modelle bei der Token-Ausgabe.
Das ist der entscheidende Satz: schneller als vergleichbare Frontier-Modelle, aber auf Frontier-Niveau. Das war bisher ein Widerspruch. Flash-Modelle waren günstig und schnell, aber nicht wirklich schlau. Das ändert sich hier.
Aber jetzt kommt der Teil, der die meisten überrascht. Pricing: die Inputkosten von Gemini 3.5 Flash liegen etwa fünfmal höher als bei Gemini 2.5 Flash. „Flash“ bedeutet nicht mehr automatisch „günstig“. Das ist eine wichtige Verschiebung für alle, die KI-Tools in ihre Workflows integriert haben oder planen, das zu tun. API-Preise steigen gerade branchenweit. Das verdient mehr Aufmerksamkeit als es bekommt.
Gemini 3.5 Flash ist ab sofort im Gemini-App, in der Google Suche (AI Mode), der Gemini API, AI Studio, Antigravity, Android Studio und Enterprise-Oberflächen verfügbar.
Gemini Omni: Video als neues Interface
Gemini Omni ist eine neue Modellreihe, die Geminis Reasoning-Fähigkeiten mit Kreation verbindet. Omni Flash akzeptiert Bild-, Audio-, Video- und Texteingaben und gibt Videos aus, die in realem Wissen verankert und natürlich editierbar sind.
Was das konkret bedeutet: du gibst einem Modell ein Bild, einen Text oder ein bestehendes Video, und es generiert und bearbeitet Video auf Basis davon. Das klingt nach einem Feature für Content Creator. Aber der tieferliegende Punkt ist ein anderer: Video wird zum Interface für KI-Kommunikation. Nicht nur für die Kreativbranche, sondern für Produktpräsentationen, Erklärvideos, Kundenservice. Wer heute keine Strategie für KI-generierte Videoformate hat, arbeitet in zwei Jahren auf dem Stand von 2022.
Gemini Spark: Dein erster echter digitaler Assistent
Das ist das Ding, das mich auf Google I/O 2026 am meisten interessiert hat. Nicht als Gadget, sondern als Konzept.
Gemini Spark ist ein persönlicher KI-Agent in der Gemini-App, der dabei hilft, das digitale Leben zu navigieren und im Hintergrund Aufgaben auszuführen. Er läuft auf dedizierten virtuellen Maschinen in der Google Cloud, ist rund um die Uhr aktiv und nutzt Gemini 3.5 sowie die Google Antigravity-Architektur, um langfristige Aufgaben einfach im Hintergrund durchzuführen. Spark wird zunächst Google-eigene Tools integrieren und in den kommenden Wochen über MCP auch Drittanbieter-Tools einbinden.
MCP. Das ist das Stichwort, das Entwickler und technisch-affine Nutzer aufhorchen lassen sollte. Model Context Protocol ist der Standard, über den ich seit Monaten spreche, der KI-Agenten mit externen Diensten verbindet. Google setzt hier auf denselben offenen Standard wie Anthropic und andere. Das bedeutet: was heute als geschlossenes Google-Ökosystem startet, öffnet sich. Wer jetzt versteht, wie Agenten funktionieren, hat einen strukturellen Vorteil.
Ich finde das persönlich sehr interessant, weil es bedeutet, dass ich Aufgaben senden kann und der Agent sie verfolgt, verwaltet und proaktiv bearbeitet. Terminkoordination, RSVP-Tracking, Recherche im Hintergrund. Das klingt nach Zukunft. Aber es rollt diesen Sommer aus.
Antigravity 2.0: Vibe Coding als Entwicklungsplattform
Google Antigravity ist die agentenzentrierte Entwicklungsplattform, um eine Idee in eine produktionsreife Anwendung zu verwandeln. Mit Antigravity 2.0 gibt es jetzt eine eigenständige Desktop-App, eine CLI, ein SDK und Managed Agents über die Gemini API.
Ein Demo während der Keynote zeigte, wie Antigravity plus Gemini 3.5 Flash in 12 Stunden ein funktionierendes Betriebssystem entwickelte, mit 93 parallelen Sub-Agenten, mehr als 15.000 Modell-Anfragen, 2,6 Milliarden Tokens und unter 1.000 Dollar API-Credits.
Das ist Showbusiness. Ich bin Realist genug, das zu sagen. Aber die zugrundeliegende Mechanik, mehrere KI-Agenten arbeiten parallel an verschiedenen Teilen eines Problems und koordinieren sich, das ist genau das, was ich als nächste Entwicklungsstufe eingeschätzt habe. Mit einem einzigen API-Aufruf lässt sich jetzt ein Agent starten, der Gründe, Tools nutzt und Code in einer isolierten Linux-Umgebung ausführt. Das ist für alle, die gerade mit n8n, Make oder ähnlichen Automatisierungstools arbeiten, eine direkte Weiterentwicklung der Logik, die sie bereits kennen.
Search: Das größte Upgrade seit drei Jahrzehnten
In Search werden Informationsagenten eingeführt. Das sind personalisierte KI-Agenten, die im Hintergrund rund um die Uhr aktiv sind, genau das finden, was man braucht, und dabei helfen, Maßnahmen zu ergreifen. Informationsagenten rollen diesen Sommer aus, zunächst für Google AI Pro und Ultra-Abonnenten.
Das ist der Punkt, an dem alle, die sich mit Search Everywhere Optimization beschäftigen, aufmerksam werden sollten. Meine Position dazu ist klar: KI-Suche verändert nicht die Grundlogik von Auffindbarkeit, sie verschärft sie. Wer Inhalte produziert, die zitierfähig, klar strukturiert und mit eigener Haltung ausgestattet sind, wird besser gefunden. Nicht von Google-Crawlern, sondern von KI-Agenten, die im Hintergrund für Nutzer recherchieren.
Für länger laufende Aufgaben kann Search einen Schritt weitergehen und persistente, benutzerdefinierte Dashboards oder Tracker erstellen, zu denen man zurückkehren und Fortschritte machen kann. Man kann sich das wie Mini-Apps für eigene spezifische Aufgaben vorstellen.
Das ist keine Funktion. Das ist eine neue Nutzungslogik. Search wird zur Leinwand für individuelle, interaktive Informationsumgebungen.
Google Workspace: Stimme als Interface für Docs, Gmail und Keep
Google kündigt neue Sprachfähigkeiten in Gmail, Docs und Keep an, ein neues Design-Tool namens Google Pics und Updates zu AI Inbox.
Docs Live kann genutzt werden, um Dokumente zu erstellen und zu bearbeiten. Die Funktion rollt für Android und iOS diesen Sommer mit Google AI Pro und Ultra aus. Ähnlich wird ein ähnlicher Modus in Google Keep freies Denken in prägnante Notizen organisieren, verfügbar in der Android-App diesen Sommer mit AI Pro und Ultra. Google Pics ist eine KI-Bildgenerations- und Design-App.
Für KMU, die Google Workspace nutzen, ist das eine direkte Produktivitätsfrage. Wer seine Mails und Dokumente bisher manuell strukturiert hat, bekommt hier einen ernstzunehmenden Zeitgewinn. Die Frage ist wie immer: bei welchem Abo-Tier? Google AI Pro und Ultra sind die Voraussetzung für die meisten dieser Features.
Daily Brief und Ask YouTube: Kleine Features mit großem Alltagspotenzial
Daily Brief ist ein weiterer sofort einsatzbereiter Agent in der Gemini-App. Er liefert eine personalisierte Zusammenfassung und synthetisiert Informationen aus dem Posteingang, Kalender und Aufgaben, um die wichtigsten Dinge herauszufiltern. Und er fasst nicht nur zusammen: er priorisiert, organisiert und schlägt nächste Schritte vor, sodass es einfach ist, aktiv zu werden.
Das klingt nach meinem Morgenbriefing-Workflow, den ich in n8n gebaut habe, und das ist kein Zufall. Die Logik dahinter ist dieselbe: kontextuelle Zusammenfassung aus mehreren Quellen, priorisiert und handlungsreif aufbereitet. Wer das noch nicht kennt, wird es hier kennenlernen.
Ask YouTube kann komplexe Suchanfragen und Folgefragen verarbeiten. Es listet die relevantesten Videos aus dem YouTube-Katalog mit einer interaktiven, strukturierten Antwort auf. Aktuell verfügbar für Premium-Abonnenten in den USA.
Für alle, die YouTube als Lernquelle nutzen, und das ist für mich ein tägliches Tool, ist das eine direkte Verbesserung des Workflows. Recherchieren, ohne 20 Videos durchzuklicken.
Intelligente Brillen und das Ende des Smartphone-Monopols
Google und seine Partner haben mindestens drei Smart-Glasses-Modelle, die dieses Jahr erscheinen. Darunter Xreals Project Aura. Googles Zusammenarbeit mit Samsung brachte zwei funktionierende Demos von „Intelligent Eyewear“-Geräten, die Gemini vollständig über Sprachbefehle nutzen. Die Brillen kommen von Warby Parker und Gentle Monster.
Das ist der langfristige Play, und ich sage das ausdrücklich als jemand, der kein Apple-Fanboy-Filter auf die Brille legt. Ray-Ban Meta hat gezeigt, dass Konsumenten bereit sind, KI in Brillenform zu tragen. Google antwortet mit mehr Integration, mehr Design-Auswahl und Gemini als Backend. Das wird diesen Herbst interessant.
Die Preisfrage: Was kostet das wirklich?
Google führt einen neuen AI Ultra-Plan für 100 Dollar pro Monat ein, der für Entwickler, Creator und Power User gedacht ist. Er beinhaltet ein fünffach höheres Nutzungslimit in Google Antigravity als der Google AI Pro-Plan.
100 Dollar pro Monat. Das ist die Ansage an alle, die glauben, KI bleibt dauerhaft günstig. Die Preise steigen, und das ist kein Google-Phänomen. Wer KI als strategisches Werkzeug einsetzt, sollte das in seiner Kostenplanung berücksichtigen.
Meine Einschätzung: für EPU und KMU ist Google AI Pro der relevante Einstieg, Ultra ist für intensive Nutzer und Entwickler. Was ich raten würde: jetzt testen, bevor die Preisgestaltung weiter konsolidiert wird.
Was du jetzt tun kannst
Google I/O 2026 hat eines sehr klar gemacht: die Phase, in der man KI ausprobiert, ist vorbei. Wir sind in der Phase, in der Infrastruktur gebaut wird.
Für dich als EPU oder KMU bedeutet das drei konkrete Dinge. Erstens: wenn du Google Workspace nutzt, teste die neuen Sprachfeatures in Docs und Gmail, sobald sie verfügbar sind. Das ist der niedrigschwelligste Einstieg in agentisches Arbeiten. Zweitens: informiere dich über MCP, denn das ist der Standard, über den KI-Agenten in Zukunft mit deinen Tools kommunizieren werden, egal ob Google, Anthropic oder Microsoft. Drittens: überlege, ob dein Content so strukturiert ist, dass ihn ein KI-Agent in der Suche als verlässliche Quelle erkennt. Nicht für den Google-Crawler von 2023. Für die Informationsagenten von 2026.
Google SynthID und C2PA Content Credentials werden ausgebaut, um KI-generierte Medien erkennbar zu machen. Das ist auch ein Signal: Transparenz bei KI-Content wird kein freiwilliges Extra mehr sein, sondern eine technische Infrastruktur, die sich ausbreitet.
Die Frage ist nicht, ob das alles zu dir kommt. Es kommt. Die Frage ist, ob du weißt, wie du es nutzt.