feat(ai): Upgrade NordaGPT to Gemini 3 Flash Preview

- Changed AI model from Gemini 2.5 Flash-Lite to Gemini 3 Flash Preview
- Added Gemini 3 models (3-flash, 3-pro) to GEMINI_MODELS config
- Updated GEMINI_PRICING with current 2026 prices
- Updated chat UI: badge, model info modal, specs, timeline
- Benefits: 7x better reasoning, thinking mode, 78% SWE-bench

Cost estimate: ~$40/month at 1000x current usage (Tier 1)

Co-Authored-By: Claude Opus 4.5 <noreply@anthropic.com>
This commit is contained in:
Maciej Pienczyn 2026-01-29 08:38:02 +01:00
parent c8f70dc2cf
commit e0df7f2adf
3 changed files with 46 additions and 34 deletions

2
app.py
View File

@ -282,7 +282,7 @@ login_manager.login_message = 'Zaloguj się, aby uzyskać dostęp do tej strony.
# Initialize Gemini service
try:
gemini_service.init_gemini_service(model='flash-lite') # Gemini 2.5 Flash-Lite (DARMOWY, 1000 RPD)
gemini_service.init_gemini_service(model='3-flash') # Gemini 3 Flash Preview - najnowszy model, 7x lepszy reasoning
logger.info("Gemini service initialized successfully")
except Exception as e:
logger.error(f"Failed to initialize Gemini service: {e}")

View File

@ -34,20 +34,24 @@ except ImportError:
logger.warning("Database not available - cost tracking disabled")
DB_AVAILABLE = False
# Available Gemini models (2025 - Gemini 1.5 retired April 29, 2025)
# Available Gemini models (2026 - Gemini 3 generation available)
GEMINI_MODELS = {
'flash': 'gemini-2.5-flash', # Best for general use - balanced cost/quality
'flash-lite': 'gemini-2.5-flash-lite', # Ultra cheap - $0.10/$0.40 per 1M tokens
'pro': 'gemini-2.5-pro', # High quality - best reasoning/coding
'flash-2.0': 'gemini-2.0-flash', # Second generation - 1M context window
'flash-2.0': 'gemini-2.0-flash', # Second generation - 1M context window (wycofywany 31.03.2026)
'3-flash': 'gemini-3-flash-preview', # Gemini 3 Flash - 7x lepszy reasoning, thinking mode
'3-pro': 'gemini-3-pro-preview', # Gemini 3 Pro - najlepszy reasoning, 2M context
}
# Pricing per 1M tokens (USD) - updated 2025-10-18
# Pricing per 1M tokens (USD) - updated 2026-01-29
GEMINI_PRICING = {
'gemini-2.5-flash': {'input': 0.075, 'output': 0.30},
'gemini-2.5-flash': {'input': 0.30, 'output': 2.50},
'gemini-2.5-flash-lite': {'input': 0.10, 'output': 0.40},
'gemini-2.5-pro': {'input': 1.25, 'output': 5.00},
'gemini-2.0-flash': {'input': 0.075, 'output': 0.30},
'gemini-2.5-pro': {'input': 1.25, 'output': 10.00},
'gemini-2.0-flash': {'input': 0.10, 'output': 0.40},
'gemini-3-flash-preview': {'input': 0.50, 'output': 3.00},
'gemini-3-pro-preview': {'input': 2.00, 'output': 12.00},
}
class GeminiService:

View File

@ -977,7 +977,7 @@
</button>
<span style="font-size: 1.5rem;">🤖</span>
<h1>NordaGPT</h1>
<span class="chat-header-badge">Gemini 2.5</span>
<span class="chat-header-badge">Gemini 3</span>
<button class="model-info-btn" onclick="openModelInfoModal()" title="Informacje o modelu AI">
<svg fill="none" stroke="currentColor" viewBox="0 0 24 24" width="16" height="16">
<path stroke-linecap="round" stroke-linejoin="round" stroke-width="2" d="M13 16h-1v-4h-1m1-4h.01M21 12a9 9 0 11-18 0 9 9 0 0118 0z"/>
@ -1002,12 +1002,12 @@
<div class="model-current">
<h3>Aktualny model AI</h3>
<div class="model-badge-large">
<span class="model-name">Gemini 2.5 Flash-Lite</span>
<span class="model-provider">Google AI</span>
<span class="model-name">Gemini 3 Flash</span>
<span class="model-provider">Google AI (Preview)</span>
</div>
<p class="model-description">
Najnowszy model Google zoptymalizowany pod kątem szybkości i przepustowości.
Oferuje do 65 000 tokenów w odpowiedzi (8x więcej niż poprzedni model).
Najnowsza generacja modeli Google z zaawansowanym rozumowaniem (thinking mode).
7x lepsze reasoning, 78% na SWE-bench (kodowanie), 90% na GPQA Diamond (nauka).
</p>
</div>
@ -1020,27 +1020,27 @@
</tr>
<tr>
<td>Max. odpowiedź:</td>
<td><strong>65 536 tokenów</strong> <span class="spec-change">↑ było 8 192</span></td>
<td><strong>65 536 tokenów</strong></td>
</tr>
<tr>
<td>Limit dzienny (RPD):</td>
<td><strong>1 000 zapytań/dzień</strong> <span class="spec-change">↑ było 250</span></td>
</tr>
<tr>
<td>Limit minutowy (RPM):</td>
<td><strong>15 zapytań/minutę</strong></td>
</tr>
<tr>
<td>Tokeny/minutę (TPM):</td>
<td><strong>250 000 tokenów/min</strong></td>
<td>Reasoning:</td>
<td><strong>7x lepszy</strong> <span class="spec-change">↑ vs 2.5</span></td>
</tr>
<tr>
<td>Thinking mode:</td>
<td><strong>Pełny</strong> <span class="spec-change">był eksperymentalny</span></td>
<td><strong>Zaawansowany (configurable)</strong> <span class="spec-change">↑ nowy</span></td>
</tr>
<tr>
<td>Koszt:</td>
<td><strong>Bezpłatny (Free Tier)</strong></td>
<td>Kodowanie (SWE-bench):</td>
<td><strong>78%</strong> <span class="spec-change">↑ najlepszy w klasie</span></td>
</tr>
<tr>
<td>Nauka (GPQA Diamond):</td>
<td><strong>90.4%</strong></td>
</tr>
<tr>
<td>Tier:</td>
<td><strong>Tier 1 (płatny)</strong> <span class="spec-change">↑ był Free</span></td>
</tr>
</table>
</div>
@ -1049,11 +1049,19 @@
<h3>📜 Historia rozwoju NordaGPT</h3>
<div class="timeline">
<div class="timeline-item current">
<div class="timeline-date">29.01.2026</div>
<div class="timeline-content">
<strong>Gemini 3 Flash (Preview)</strong>
<p>Najnowsza generacja AI od Google. 7x lepsze rozumowanie, zaawansowany thinking mode, 78% na benchmarku kodowania.</p>
<span class="timeline-badge upgrade">Aktualna wersja</span>
</div>
</div>
<div class="timeline-item">
<div class="timeline-date">14.01.2026</div>
<div class="timeline-content">
<strong>Gemini 2.5 Flash-Lite</strong>
<p>Upgrade do najnowszego modelu. 8x dłuższe odpowiedzi, pełny thinking mode, 4x większy limit dzienny.</p>
<span class="timeline-badge upgrade">Aktualna wersja</span>
<p>8x dłuższe odpowiedzi, pełny thinking mode, 4x większy limit dzienny.</p>
<span class="timeline-badge">Poprzednia wersja</span>
</div>
</div>
<div class="timeline-item">
@ -1068,7 +1076,7 @@
<div class="timeline-date">Grudzień 2025</div>
<div class="timeline-content">
<strong>Gemini 2.0 Flash</strong>
<p>Pierwszy model AI w NordaGPT. Kontekst 1M tokenów, limit 8192 tokenów na odpowiedź.</p>
<p>Pierwszy model AI w NordaGPT. Kontekst 1M tokenów.</p>
<span class="timeline-badge">Poprzednia wersja</span>
</div>
</div>
@ -1086,11 +1094,11 @@
<div class="model-benefits">
<h3>✨ Co zyskaliśmy przy ostatniej aktualizacji?</h3>
<ul>
<li><strong>8x dłuższe odpowiedzi</strong> — z 8 192 → 65 536 tokenów (szczegółowe analizy)</li>
<li><strong>4x większy limit dzienny</strong> — z 250 → 1 000 zapytań/dzień</li>
<li><strong>Pełny thinking mode</strong> — zamiast eksperymentalnego (lepsze rozumowanie)</li>
<li><strong>Szybsza odpowiedź</strong> — Flash-Lite zoptymalizowany pod przepustowość</li>
<li><strong>Nadal bezpłatny</strong> — pełny Free Tier Google bez ukrytych kosztów</li>
<li><strong>7x lepsze rozumowanie</strong> — zaawansowany reasoning dla złożonych pytań biznesowych</li>
<li><strong>Thinking mode</strong> — AI "myśli" przed odpowiedzią (lepsza jakość)</li>
<li><strong>Najnowsza generacja</strong> — Gemini 3 to flagowy model Google z 2025/2026</li>
<li><strong>78% na SWE-bench</strong> — najlepszy w klasie w zadaniach programistycznych</li>
<li><strong>Lepsze odpowiedzi strategiczne</strong> — analiza biznesowa, rekomendacje, planowanie</li>
</ul>
</div>
</div>