Google发布Gemini 2.5 Flash：实现更灵活的思维控制

Google veröffentlicht Gemini 2.5 Flash: Ermöglicht flexiblere Gedankenkontrollen

Im harten Wettbewerb auf dem Gebiet der künstlichen Intelligenz hat Google mit einer bahnbrechenden Innovation einmal mehr die Spielregeln neu geschrieben. Der kürzlich vorgestellte Gemini 2.5 Flash setzt nicht nur die starke Leistung seines Flaggschiffmodells fort, sondern erreicht durch die revolutionäre "Hybrid Reasoning Architecture" und den "Thinking on Budget"-Mechanismus auch das ultimative Gleichgewicht zwischen Kosten und Effizienz. Dieser Durchbruch markiert den formellen Eintritt der KI-Entwicklung in die Ära des "Think-on-Demand" und bietet Unternehmen und Entwicklern eine noch nie dagewesene Flexibilität und Kosteneffizienz.

ShirtAI ermöglicht die kostenlose und unbegrenzte Nutzung von Gemini-2.0-flash, Gemini-2.5-pro und anderen Modellen, mit einem Klick auf der offiziellen Website:www.lsshirtai.com

I. Performance Rampage: Neudefinition der Grenzen von Coding und Reasoning

1. der Galton-Board-Test: erstaunliche Leistung, die OpenAI übertrifft

Der Gemini 2.5 Flash hat seine atemberaubenden Fähigkeiten im kürzlich durchgeführten und heiß diskutierten Galton Board Physics Simulation Test unter Beweis gestellt. Die Aufgabe verlangte von dem Modell, die Flugbahn eines kleinen Balls durch ein mehrschichtiges Hindernisbrett genau zu simulieren und schließlich ein normalverteiltes Ergebnis zu präsentieren. Test im Gange:

- - Gemini 2.5 Flash reproduziert perfekt die Gesetze der Physik in nur 5 Eingabeaufforderungen und erzeugt eine flüssige und natürliche Animation, die perfekt mit den Regeln der realen Physik übereinstimmt.
  - Die Modelle von OpenAI wie GPT-4o mini und O3-mini scheiterten an ihrer Unfähigkeit, komplexe physikalische Interaktionen zu verarbeiten, und machten sogar Fehler auf niedriger Ebene wie Blob-Überlappung und Verteilungsanomalien.
  - Jeff Dean, der Chefwissenschaftler von Google, lobte persönlich die Ergebnisse des Tests und nannte sie einen "seismischen Durchbruch in der Codierungsleistung".

II. technologischer Kern: Hybride Reasoning-Architektur und die "Thinking Budget"-Revolution

1. hybride Inferenzmodelle: ein doppelter Durchbruch bei Leistung und Effizienz

Die Kerninnovation von Gemini 2.5 Flash ist seine hybride Denkarchitektur, ein dynamisches Berechnungsmodell, das ein Gleichgewicht zwischen Denkgeschwindigkeit und Genauigkeit herstellt. Im Gegensatz zu traditionellen Modellen, die mit voller Geschwindigkeit denken, ermöglicht Gemini 2.5 Flash den Entwicklern, das Denkbudget, d.h. die Anzahl der Token, die das Modell für interne Schlussfolgerungen verwendet, bevor es eine Antwort generiert, je nach Komplexität der Aufgabe flexibel zuzuweisen. Dieser Mechanismus wird durchbrochen:

Kontrollierbare Kosten: Wenn das Denken ausgeschaltet ist, sinken die Inferenzkosten auf $0,6/Million Token (1/6 ähnlicher Modelle), und die Leistung liegt nahe bei Pro, wenn das höchste Denkbudget (24k Token) eingeschaltet ist.
Dynamische Anpassung: Das Modell passt die Tiefe des Denkens automatisch an die Schwierigkeit der Aufgabe an. So werden zum Beispiel nur einige hundert Token benötigt, um einfache mathematische Probleme zu lösen, während Zehntausende von Token verbraucht werden können, um komplexe wissenschaftliche Analysen mit höchster Präzision durchzuführen.

2. der Arena-Test: ähnliche Modelle umfassend zerschlagen

In der Arena-Rangliste der Drittanbieter-Plattform Imarena liegt Gemini 2.5 Flash mit einer Elo-Punktzahl von 1392 auf dem zweiten Platz auf dem zweiten Platz, gleichauf mit Topmodellen wie GPT-4.5 und Grok-3, und deutlich besser als Claude 3.7 Sonnet (1340 Punkte) und DeepSeek R1 (1358 Punkte). Zu seinen Stärken gehören:

Code-Erzeugung: 63,5% Single-Pass-Rate im LiveCodeBench V5-Test (nahe an den 70,6% von DeepSeek R1).
Mathematisches Denken: In der Simulation des Mathematikwettbewerbs AIME 2025 erzielte er 78,01 TP3T in einem einzigen Versuch und übertrifft damit die 27,51 TP3T von Claude 3.7 Sonnet.
Wissensquiz: Die letzte Prüfung der Menschheit mit 12,11 TP3T die zweithöchste Punktzahl nach O4-mini (14,3%).

III. Entwicklerwahn: Effizienzsprung und Kostenrevolution

1. rasche Entwicklungserfahrung: vom Prototyp zum fertigen Produkt in wenigen Codezeilen

Entwickler nutzen bereits die Flexibilität von Gemini 2.5 Flash, um komplexe Projekte abzuschließen:

- Physiksimulation: Netizen @RameshR erzeugt normalverteilte Galton-Platten-Animationen in nur 5 Eingabeaufforderungen, während das OpenAI-Modell aufgrund von Fehlern der Physik-Engine scheitert.
- Web-Entwicklung: Entwickler @Taro Bushidōs YouTube- und Spotify-Imitate werden für ihre "pixelgenaue Wiederherstellung der offiziellen Designs" gelobt.
- KI-Agenten: Erstellen Sie MCP-Protokollagenten für den Zugriff auf Airbnb und Google Maps in nur 30 Zeilen Python-Code.

2) Kostenvergleiche: eine "Preis/Leistungs-Revolution" in der KI

In der folgenden Tabelle wird die Preisstrategie von Gemini 2.5 Flash mit anderen Modellen verglichen (basierend auf Millionen von Token-Inputs und -Outputs):

Modellierung	Inputkosten ($/Million Token)	Produktionskosten (Begründung aus)	Produktionskosten (Begründung)
Zwilling 2.5 Blitz	$0.15	$0.60	$3.50
GPT-4o Mini	$0.10	$1.10	$4.40
Claude 3.7 Sonett	$3.00	$15.00	–
DeepSeek R1	$3.00	$15.00	–

Hinweis: Bei einem Verhältnis von 3:1 von Eingängen zu Ausgängen betragen die Gesamtkosten des Gemini 2.5 Flash nur 1/30 des Claude 3.7.

Die Veröffentlichung von Gemini 2.5 Flash markiert den Beginn des Wandels der KI-Modelle vom "Laborspielzeug" zum "Produktivitätswerkzeug". Seine hybride Inferenzarchitektur löst nicht nur den Widerspruch zwischen Kosten und Leistung, sondern gibt auch einen Hinweis auf die künftige Richtung der KI-Evolution: die Realisierung unendlicher Möglichkeiten mit begrenzter Arithmetik. Mit weiteren Iterationen von Google (z. B. dem kommenden Plug-in für die Videogenerierung) könnte diese kosteneffiziente Revolution, die von Gemini angeführt wird, die globale KI-Entwicklungslandschaft neu gestalten.

Wenn Sie GPT Plus, Claude Pro, Grok Super offizielles bezahltes exklusives Konto benutzen wollen, können Sie unser professionelles Team (wx: abch891) kontaktieren, wenn Sie nicht wissen, wie Sie Ihr Konto aufladen können.

Weitere Produkte finden Sie unter	Siehe mehr unter
ShirtAI - Durchdringende Intelligenz	Das AIGC Big Model: der Beginn einer Ära der doppelten Revolution in Technik und Wissenschaft - Penetrating Intelligence
1:1 Wiederherstellung von Claude und GPT Offizielle Website - AI Cloud Native	Live Match App Global HD Sports Viewing Player (empfohlen) - Blueshirt Technology
Transitdienst auf der Grundlage der offiziellen API - GPTMeta API	Hilfe, kann jemand von Ihnen Tipps geben, wie man Fragen auf GPT stellt? - Wissen
Global Virtual Goods Digital Store - Global SmarTone (Feng Ling Ge)	Wie leistungsfähig ist Claude airtfacts, dass GPT sofort nicht mehr gut riecht? -BeepBeep

GPTMeta-API

Google veröffentlicht Gemini 2.5 Flash: Ermöglicht flexiblere Gedankenkontrollen

I. Performance Rampage: Neudefinition der Grenzen von Coding und Reasoning

1. der Galton-Board-Test: erstaunliche Leistung, die OpenAI übertrifft

II. technologischer Kern: Hybride Reasoning-Architektur und die "Thinking Budget"-Revolution

1. hybride Inferenzmodelle: ein doppelter Durchbruch bei Leistung und Effizienz

2. der Arena-Test: ähnliche Modelle umfassend zerschlagen

III. Entwicklerwahn: Effizienzsprung und Kostenrevolution

1. rasche Entwicklungserfahrung: vom Prototyp zum fertigen Produkt in wenigen Codezeilen

2) Kostenvergleiche: eine "Preis/Leistungs-Revolution" in der KI

Weitere Produkte finden Sie unter

Siehe mehr unter

Werbefläche

GPTMeta-API

Transit Agent Service basierend auf offiziellen APIs

Website-Navigation

Abb. Anfang

Andocken von Dritten

Konsolen

Anweisungen für den Gebrauch

Online-Überwachung

Freundlicher Link

OpenAI

Zwillinge

GPT-Metaversum

Claude Metaverse

ShirtAI

blaublütige Wolke

Kontakt