feat(ai): Upgrade NordaGPT to Gemini 3 Flash Preview

- Changed AI model from Gemini 2.5 Flash-Lite to Gemini 3 Flash Preview - Added Gemini 3 models (3-flash, 3-pro) to GEMINI_MODELS config - Updated GEMINI_PRICING with current 2026 prices - Updated chat UI: badge, model info modal, specs, timeline - Benefits: 7x better reasoning, thinking mode, 78% SWE-bench Cost estimate: ~$40/month at 1000x current usage (Tier 1) Co-Authored-By: Claude Opus 4.5 <noreply@anthropic.com>
2026-01-29 08:38:02 +01:00 · 2026-01-29 08:38:02 +01:00 · e0df7f2adf
commit e0df7f2adf
parent c8f70dc2cf
3 changed files with 46 additions and 34 deletions
--- a/app.py
+++ b/app.py
@ -282,7 +282,7 @@ login_manager.login_message = 'Zaloguj się, aby uzyskać dostęp do tej strony.

 # Initialize Gemini service
 try:
-    gemini_service.init_gemini_service(model='flash-lite')  # Gemini 2.5 Flash-Lite (DARMOWY, 1000 RPD)
+    gemini_service.init_gemini_service(model='3-flash')  # Gemini 3 Flash Preview - najnowszy model, 7x lepszy reasoning
    logger.info("Gemini service initialized successfully")
 except Exception as e:
    logger.error(f"Failed to initialize Gemini service: {e}")
--- a/gemini_service.py
+++ b/gemini_service.py
@ -34,20 +34,24 @@ except ImportError:
    logger.warning("Database not available - cost tracking disabled")
    DB_AVAILABLE = False

-# Available Gemini models (2025 - Gemini 1.5 retired April 29, 2025)
+# Available Gemini models (2026 - Gemini 3 generation available)
 GEMINI_MODELS = {
    'flash': 'gemini-2.5-flash',           # Best for general use - balanced cost/quality
    'flash-lite': 'gemini-2.5-flash-lite', # Ultra cheap - $0.10/$0.40 per 1M tokens
    'pro': 'gemini-2.5-pro',               # High quality - best reasoning/coding
-    'flash-2.0': 'gemini-2.0-flash',       # Second generation - 1M context window
+    'flash-2.0': 'gemini-2.0-flash',       # Second generation - 1M context window (wycofywany 31.03.2026)
+    '3-flash': 'gemini-3-flash-preview',   # Gemini 3 Flash - 7x lepszy reasoning, thinking mode
+    '3-pro': 'gemini-3-pro-preview',       # Gemini 3 Pro - najlepszy reasoning, 2M context
 }

-# Pricing per 1M tokens (USD) - updated 2025-10-18
+# Pricing per 1M tokens (USD) - updated 2026-01-29
 GEMINI_PRICING = {
-    'gemini-2.5-flash': {'input': 0.075, 'output': 0.30},
+    'gemini-2.5-flash': {'input': 0.30, 'output': 2.50},
    'gemini-2.5-flash-lite': {'input': 0.10, 'output': 0.40},
-    'gemini-2.5-pro': {'input': 1.25, 'output': 5.00},
-    'gemini-2.0-flash': {'input': 0.075, 'output': 0.30},
+    'gemini-2.5-pro': {'input': 1.25, 'output': 10.00},
+    'gemini-2.0-flash': {'input': 0.10, 'output': 0.40},
+    'gemini-3-flash-preview': {'input': 0.50, 'output': 3.00},
+    'gemini-3-pro-preview': {'input': 2.00, 'output': 12.00},
 }

 class GeminiService:
--- a/templates/chat.html
+++ b/templates/chat.html
@ -977,7 +977,7 @@
                </button>
                <span style="font-size: 1.5rem;">🤖</span>
                <h1>NordaGPT</h1>
-                <span class="chat-header-badge">Gemini 2.5</span>
+                <span class="chat-header-badge">Gemini 3</span>
                <button class="model-info-btn" onclick="openModelInfoModal()" title="Informacje o modelu AI">
                    <svg fill="none" stroke="currentColor" viewBox="0 0 24 24" width="16" height="16">
                        <path stroke-linecap="round" stroke-linejoin="round" stroke-width="2" d="M13 16h-1v-4h-1m1-4h.01M21 12a9 9 0 11-18 0 9 9 0 0118 0z"/>
@ -1002,12 +1002,12 @@
                <div class="model-current">
                    <h3>Aktualny model AI</h3>
                    <div class="model-badge-large">
-                        <span class="model-name">Gemini 2.5 Flash-Lite</span>
-                        <span class="model-provider">Google AI</span>
+                        <span class="model-name">Gemini 3 Flash</span>
+                        <span class="model-provider">Google AI (Preview)</span>
                    </div>
                    <p class="model-description">
-                        Najnowszy model Google zoptymalizowany pod kątem szybkości i przepustowości.
-                        Oferuje do 65 000 tokenów w odpowiedzi (8x więcej niż poprzedni model).
+                        Najnowsza generacja modeli Google z zaawansowanym rozumowaniem (thinking mode).
+                        7x lepsze reasoning, 78% na SWE-bench (kodowanie), 90% na GPQA Diamond (nauka).
                    </p>
                </div>

@ -1020,27 +1020,27 @@
                        </tr>
                        <tr>
                            <td>Max. odpowiedź:</td>
-                            <td><strong>65 536 tokenów</strong> <span class="spec-change">↑ było 8 192</span></td>
+                            <td><strong>65 536 tokenów</strong></td>
                        </tr>
                        <tr>
-                            <td>Limit dzienny (RPD):</td>
-                            <td><strong>1 000 zapytań/dzień</strong> <span class="spec-change">↑ było 250</span></td>
-                        </tr>
-                        <tr>
-                            <td>Limit minutowy (RPM):</td>
-                            <td><strong>15 zapytań/minutę</strong></td>
-                        </tr>
-                        <tr>
-                            <td>Tokeny/minutę (TPM):</td>
-                            <td><strong>250 000 tokenów/min</strong></td>
+                            <td>Reasoning:</td>
+                            <td><strong>7x lepszy</strong> <span class="spec-change">↑ vs 2.5</span></td>
                        </tr>
                        <tr>
                            <td>Thinking mode:</td>
-                            <td><strong>Pełny</strong> <span class="spec-change">↑ był eksperymentalny</span></td>
+                            <td><strong>Zaawansowany (configurable)</strong> <span class="spec-change">↑ nowy</span></td>
                        </tr>
                        <tr>
-                            <td>Koszt:</td>
-                            <td><strong>Bezpłatny (Free Tier)</strong></td>
+                            <td>Kodowanie (SWE-bench):</td>
+                            <td><strong>78%</strong> <span class="spec-change">↑ najlepszy w klasie</span></td>
+                        </tr>
+                        <tr>
+                            <td>Nauka (GPQA Diamond):</td>
+                            <td><strong>90.4%</strong></td>
+                        </tr>
+                        <tr>
+                            <td>Tier:</td>
+                            <td><strong>Tier 1 (płatny)</strong> <span class="spec-change">↑ był Free</span></td>
                        </tr>
                    </table>
                </div>
@ -1049,11 +1049,19 @@
                    <h3>📜 Historia rozwoju NordaGPT</h3>
                    <div class="timeline">
                        <div class="timeline-item current">
+                            <div class="timeline-date">29.01.2026</div>
+                            <div class="timeline-content">
+                                <strong>Gemini 3 Flash (Preview)</strong>
+                                <p>Najnowsza generacja AI od Google. 7x lepsze rozumowanie, zaawansowany thinking mode, 78% na benchmarku kodowania.</p>
+                                <span class="timeline-badge upgrade">Aktualna wersja</span>
+                            </div>
+                        </div>
+                        <div class="timeline-item">
                            <div class="timeline-date">14.01.2026</div>
                            <div class="timeline-content">
                                <strong>Gemini 2.5 Flash-Lite</strong>
-                                <p>Upgrade do najnowszego modelu. 8x dłuższe odpowiedzi, pełny thinking mode, 4x większy limit dzienny.</p>
-                                <span class="timeline-badge upgrade">Aktualna wersja</span>
+                                <p>8x dłuższe odpowiedzi, pełny thinking mode, 4x większy limit dzienny.</p>
+                                <span class="timeline-badge">Poprzednia wersja</span>
                            </div>
                        </div>
                        <div class="timeline-item">
@ -1068,7 +1076,7 @@
                            <div class="timeline-date">Grudzień 2025</div>
                            <div class="timeline-content">
                                <strong>Gemini 2.0 Flash</strong>
-                                <p>Pierwszy model AI w NordaGPT. Kontekst 1M tokenów, limit 8192 tokenów na odpowiedź.</p>
+                                <p>Pierwszy model AI w NordaGPT. Kontekst 1M tokenów.</p>
                                <span class="timeline-badge">Poprzednia wersja</span>
                            </div>
                        </div>
@ -1086,11 +1094,11 @@
                <div class="model-benefits">
                    <h3>✨ Co zyskaliśmy przy ostatniej aktualizacji?</h3>
                    <ul>
-                        <li><strong>8x dłuższe odpowiedzi</strong> — z 8 192 → 65 536 tokenów (szczegółowe analizy)</li>
-                        <li><strong>4x większy limit dzienny</strong> — z 250 → 1 000 zapytań/dzień</li>
-                        <li><strong>Pełny thinking mode</strong> — zamiast eksperymentalnego (lepsze rozumowanie)</li>
-                        <li><strong>Szybsza odpowiedź</strong> — Flash-Lite zoptymalizowany pod przepustowość</li>
-                        <li><strong>Nadal bezpłatny</strong> — pełny Free Tier Google bez ukrytych kosztów</li>
+                        <li><strong>7x lepsze rozumowanie</strong> — zaawansowany reasoning dla złożonych pytań biznesowych</li>
+                        <li><strong>Thinking mode</strong> — AI "myśli" przed odpowiedzią (lepsza jakość)</li>
+                        <li><strong>Najnowsza generacja</strong> — Gemini 3 to flagowy model Google z 2025/2026</li>
+                        <li><strong>78% na SWE-bench</strong> — najlepszy w klasie w zadaniach programistycznych</li>
+                        <li><strong>Lepsze odpowiedzi strategiczne</strong> — analiza biznesowa, rekomendacje, planowanie</li>
                    </ul>
                </div>
            </div>