nordabiz

Author	SHA1	Message	Date
Maciej Pienczyn	55088f0ccb	fix: ZOPK knowledge base image display and data quality issues Some checks are pending NordaBiz Tests / Smoke Tests (Production) (push) Blocked by required conditions Details NordaBiz Tests / Unit & Integration Tests (push) Waiting to run Details NordaBiz Tests / E2E Tests (Playwright) (push) Blocked by required conditions Details NordaBiz Tests / Send Failure Notification (push) Blocked by required conditions Details - Fix broken news thumbnails by adding og:image extraction during content scraping (replaces Brave proxy URLs that block hotlinking) - Add image onerror fallback in templates showing domain favicon when original image fails to load - Decode Brave proxy image URLs to original source URLs before saving - Enforce English-only entity types in AI extraction prompt to prevent mixed Polish/English type names - Add migration 083 to normalize 14 existing Polish entity types and clean up 5 stale fetch jobs stuck in 'running' status - Add backfill script for existing articles with broken image URLs Co-Authored-By: Claude Opus 4.6 (1M context) <noreply@anthropic.com>	2026-03-15 08:57:41 +01:00
Maciej Pienczyn	3bc69f9455	feat: update Gemini models — migrate 3-pro to 3.1-pro, add 3.1-flash-lite, remove old SDK Some checks are pending NordaBiz Tests / Unit & Integration Tests (push) Waiting to run Details NordaBiz Tests / E2E Tests (Playwright) (push) Blocked by required conditions Details NordaBiz Tests / Smoke Tests (Production) (push) Blocked by required conditions Details NordaBiz Tests / Send Failure Notification (push) Blocked by required conditions Details - Replace gemini-3-pro-preview with gemini-3.1-pro-preview (old deprecated March 9) - Add gemini-3.1-flash-lite-preview as quality fallback in chain - Remove last google.generativeai import from zopk_knowledge_service.py - Update pricing, thinking models, and preview models sets - Keep '3-pro' alias for backward compatibility across codebase Co-Authored-By: Claude Opus 4.6 <noreply@anthropic.com>	2026-03-07 19:45:33 +01:00
Maciej Pienczyn	3fb1a23546	fix(zopk): Use GeminiService instead of raw genai for AI roadmap analysis Some checks are pending NordaBiz Tests / Unit & Integration Tests (push) Waiting to run Details NordaBiz Tests / E2E Tests (Playwright) (push) Blocked by required conditions Details NordaBiz Tests / Smoke Tests (Production) (push) Blocked by required conditions Details NordaBiz Tests / Send Failure Notification (push) Blocked by required conditions Details The analyze_roadmap_with_ai() was using google.generativeai directly which bypasses API key configuration. Switch to GeminiService which has the key pre-configured via init_gemini_service(). Co-Authored-By: Claude Opus 4.6 <noreply@anthropic.com>	2026-02-09 17:13:21 +01:00
Maciej Pienczyn	99dd628d4a	feat(zopk): Add AI-powered roadmap analysis with status updates and gap detection Some checks are pending NordaBiz Tests / Unit & Integration Tests (push) Waiting to run Details NordaBiz Tests / E2E Tests (Playwright) (push) Blocked by required conditions Details NordaBiz Tests / Smoke Tests (Production) (push) Blocked by required conditions Details NordaBiz Tests / Send Failure Notification (push) Blocked by required conditions Details New analyze_roadmap_with_ai() function sends existing milestones and recent knowledge facts to Gemini for comprehensive analysis. Returns new milestone suggestions, status update recommendations, and identified roadmap gaps. Adds PATCH endpoint for milestone status updates and tabbed UI modal. Co-Authored-By: Claude Opus 4.6 <noreply@anthropic.com>	2026-02-09 17:10:28 +01:00
Maciej Pienczyn	3b3bb7bdd7	fix(zopk): Polish error messages and show failures as skipped, not errors Some checks are pending NordaBiz Tests / Unit & Integration Tests (push) Waiting to run Details NordaBiz Tests / E2E Tests (Playwright) (push) Blocked by required conditions Details NordaBiz Tests / Smoke Tests (Production) (push) Blocked by required conditions Details NordaBiz Tests / Send Failure Notification (push) Blocked by required conditions Details Admin was confused by red "Błędy: 2" when scraping/extraction had expected issues (403, content too short). Changes: - All scraper/extractor messages translated to Polish - HTTP 403/404/429 get specific descriptive messages - Expected failures shown as yellow "Pominięte" instead of red "Błędy" - "No chunks created" → "Treść za krótka do ekstrakcji" - Summary label "Błędy" → "Pominięte" Co-Authored-By: Claude Opus 4.6 <noreply@anthropic.com>	2026-02-09 15:36:00 +01:00
Maciej Pienczyn	e718d96a7d	fix(security): Resolve 1 HIGH and 7 MEDIUM vulnerabilities from code review Some checks are pending NordaBiz Tests / Unit & Integration Tests (push) Waiting to run Details NordaBiz Tests / E2E Tests (Playwright) (push) Blocked by required conditions Details NordaBiz Tests / Smoke Tests (Production) (push) Blocked by required conditions Details NordaBiz Tests / Send Failure Notification (push) Blocked by required conditions Details - HIGH: Fix SQL injection in ZOPK knowledge service (3 functions) — replace f-strings with parameterized queries - MEDIUM: Sanitize tsquery/LIKE input in SearchService to prevent injection - MEDIUM: Add @login_required + @role_required(ADMIN) to /health/full endpoint - MEDIUM: Add @role_required(ADMIN) to ZOPK knowledge search API - MEDIUM: Add bleach HTML sanitization on write for announcements, events, board proceedings (stored XSS via \|safe) - MEDIUM: Remove partial API key from Gemini service logs - MEDIUM: Remove @csrf.exempt from chat endpoints, add X-CSRFToken headers in JS - MEDIUM: Add missing CSRF tokens to 3 POST forms (data_request, benefits_form, benefits_list) Co-Authored-By: Claude Opus 4.6 <noreply@anthropic.com>	2026-02-06 05:25:18 +01:00
Maciej Pienczyn	bc58d31c4d	fix: Aktualizacja pozostałych odniesień do Gemini 3 - zopk_knowledge_service.py: model dla kategoryzacji milestone'ów - database.py: przykłady modeli w komentarzach kolumn Co-Authored-By: Claude Opus 4.5 <noreply@anthropic.com>	2026-01-29 14:21:00 +01:00
Maciej Pienczyn	cebe52f303	refactor: Rebranding i aktualizacja modelu AI - Zmiana nazwy: "Norda Biznes Hub" → "Norda Biznes Partner" - Aktualizacja modelu AI: Gemini 2.0 Flash → Gemini 3 Flash - Zachowano historyczne odniesienia w timeline i dokumentacji Co-Authored-By: Claude Opus 4.5 <noreply@anthropic.com>	2026-01-29 14:08:39 +01:00
Maciej Pienczyn	7a6631881f	fix: Naprawiono błąd składni f-string w _extract_date_from_text - Przeniesiono logikę kwartału z inline dict do funkcji _quarter_to_date() - f-string z dict literal nie jest wspierany w Python 3.11 Co-Authored-By: Claude Opus 4.5 <noreply@anthropic.com>	2026-01-17 17:34:44 +01:00
Maciej Pienczyn	40116d3321	feat(zopk): Timeline auto-populate + fix /zopk 500 + rozszerzony health check - Dodano funkcje automatycznego uzupełniania Timeline z bazy wiedzy: - get_timeline_suggestions() - pobiera milestone facts jako sugestie - create_milestone_from_suggestion() - tworzy milestone z faktu - categorize_milestones_with_ai() - kategoryzacja AI (nuclear/offshore/etc) - Auto-detekcja kategorii, dat i statusu z tekstu polskiego - API endpoints: - GET /api/zopk/timeline/suggestions - lista sugestii z bazy wiedzy - POST /api/zopk/timeline/suggestions/approve - zatwierdź sugestię - Fix: /zopk zwracał 500 (nieistniejąca kolumna is_verified) - Dodano kolumnę is_verified do modelu ZOPKMilestone - Usunięto filtr is_verified z query (do migracji) - Health check rozszerzony z 15 do 55+ endpointów: - Public pages, Raporty, ZOPK, Chat, IT Audit - API publiczne, Admin Core, Admin Audits, Admin ZOPK Co-Authored-By: Claude Opus 4.5 <noreply@anthropic.com>	2026-01-17 17:32:54 +01:00
Maciej Pienczyn	43c22650f1	feat(zopk): Modal przeglądu wyników uczenia z weryfikacji - Backend zwraca teraz pełne dane zweryfikowanych faktów (nie tylko count) - Nowy modal pokazuje listę zweryfikowanych faktów z: - Tekstem faktu i typem - Procentem podobieństwa do wzorca - Fragmentem wzorca który dopasował - Możliwość cofnięcia weryfikacji dla pojedynczych faktów - Statystyki: zweryfikowane / wzorce użyte / cofnięte - Stylizowane karty z animacjami Co-Authored-By: Claude Opus 4.5 <noreply@anthropic.com>	2026-01-17 16:33:39 +01:00
Maciej Pienczyn	f126341eed	fix(zopk): Naprawka importu func + ładne toasty/modale w UI Poprawki: - Dodano brakujący import `func` w find_similar_to_verified_facts() - Dodano brakujący import `func` w auto_verify_similar_to_verified() UI/UX: - Zamieniono brzydkie alert() na stylizowane toasty - Zamieniono confirm() na ładne modale z ikonami - Dodano animacje slideIn/slideOut dla toastów - Dodano animacje fadeIn/scaleIn dla modali Co-Authored-By: Claude Opus 4.5 <noreply@anthropic.com>	2026-01-17 16:29:20 +01:00
Maciej Pienczyn	818ddd96eb	feat(zopk-knowledge): Dodanie funkcji uczenia się z weryfikacji - Nowa funkcja find_similar_to_verified_facts() w zopk_knowledge_service.py używa pg_trgm do wyszukiwania podobnych faktów - Nowa funkcja auto_verify_similar_to_verified() automatycznie weryfikuje fakty podobne do już zweryfikowanych (próg 80% podobieństwa) - Nowy endpoint POST /api/zopk/knowledge/auto-verify/similar - Nowy endpoint GET /api/zopk/knowledge/suggest-similar-facts - Przycisk "Ucz się z weryfikacji" na dashboardzie bazy wiedzy ZOPK Co-Authored-By: Claude Opus 4.5 <noreply@anthropic.com>	2026-01-17 16:21:08 +01:00
Maciej Pienczyn	121fb593db	fix(zopk): Poprawka nazwy kolumny confidence_score w auto_verify_top_facts - Funkcja używała nieistniejącej kolumny importance_score - Zmieniono na confidence_score (rzeczywista nazwa w tabeli) - Poprawka analogiczna do wcześniejszej w find_duplicate_facts	2026-01-17 11:31:35 +01:00
Maciej Pienczyn	0adb9bed0e	fix(zopk): Poprawka nazwy kolumny confidence_score w deduplikacji faktów	2026-01-17 11:16:53 +01:00
Maciej Pienczyn	b3249f5b22	fix(zopk): Użycie operatora % z indeksem GiST dla deduplikacji faktów Zapytanie similarity() bez indeksu powodowało timeout przy 3414 faktach. Teraz używamy SET pg_trgm.similarity_threshold + operator % który wykorzystuje indeks GiST (idx_facts_fulltext_trgm). Co-Authored-By: Claude Opus 4.5 <noreply@anthropic.com>	2026-01-17 11:09:01 +01:00
Maciej Pienczyn	96fa0058c2	feat(zopk): Rozbudowa bazy wiedzy ZOPK - Dodano skrypt cron do automatycznej ekstrakcji wiedzy (scripts/cron_extract_knowledge.py) - Dodano panel deduplikacji faktów (/admin/zopk/knowledge/fact-duplicates) - Dodano API i funkcje auto-weryfikacji encji i faktów - Dodano panel Timeline ZOPK (/admin/zopk/timeline) z CRUD - Rozszerzono dashboard bazy wiedzy o statystyki weryfikacji i przyciski auto-weryfikacji - Dodano migrację 016_zopk_milestones.sql dla tabeli kamieni milowych - Naprawiono duplikat modelu ZOPKMilestone w database.py Co-Authored-By: Claude Opus 4.5 <noreply@anthropic.com>	2026-01-17 10:57:11 +01:00
Maciej Pienczyn	51378176c9	fix(zopk): Prawidłowe nazwy kolumn w ZOPKKnowledgeRelation Model używa entity_a_id/entity_b_id, nie source_entity_id/target_entity_id. Naprawione miejsca: - get_entity_merge_preview(): zliczanie relacji - merge_entities(): przenoszenie relacji Co-Authored-By: Claude Opus 4.5 <noreply@anthropic.com>	2026-01-17 10:29:57 +01:00
Maciej Pienczyn	4dcfc1b8e8	fix(zopk): Naprawa błędu JSONB cast w SQLAlchemy Problem: `:entity_json::jsonb` było interpretowane przez SQLAlchemy jako parametr `:entity_json` z dodatkowym `:jsonb` (błąd składni SQL) Rozwiązanie: Użycie CAST(:entity_json AS jsonb) zamiast ::jsonb Naprawione miejsca: - get_entity_merge_preview() - linia 1919 - merge_entities() - linia 1831 Co-Authored-By: Claude Opus 4.5 <noreply@anthropic.com>	2026-01-17 10:22:58 +01:00
Maciej Pienczyn	8bdbd04c8c	fix(zopk): Sortowanie duplikatów encji od największego podobieństwa Zmiana kolejności ORDER BY w find_duplicate_entities(): - Teraz: sim DESC, entity_type, mentions DESC - Wcześniej: entity_type, mentions DESC, sim DESC Co-Authored-By: Claude Opus 4.5 <noreply@anthropic.com>	2026-01-17 10:19:16 +01:00
Maciej Pienczyn	9ae72bb2fa	fix(zopk): Naprawa łączenia encji - brak kolumn subject_entity_id/object_entity_id Problem: ZOPKKnowledgeFact nie ma kolumn subject_entity_id i object_entity_id. Zamiast tego używa entities_involved (JSONB array). Zmiany: - get_entity_merge_preview(): użycie JSONB @> query do liczenia faktów - merge_entities(): użycie JSONB update do zamiany entity ID w facts Co-Authored-By: Claude Opus 4.5 <noreply@anthropic.com>	2026-01-17 09:57:30 +01:00
Maciej Pienczyn	143f5c674a	feat(zopk): Implementacja łączenia duplikatów encji (Priorytet 4) Nowe funkcje w zopk_knowledge_service.py: - find_duplicate_entities() - wyszukiwanie podobnych encji (pg_trgm) - merge_entities() - łączenie encji z transferem relacji - get_entity_merge_preview() - podgląd przed połączeniem Nowe endpointy w app.py: - GET /admin/zopk/knowledge/duplicates - panel zarządzania duplikatami - POST /api/zopk/knowledge/duplicates/preview - podgląd merge - POST /api/zopk/knowledge/duplicates/merge - wykonanie merge Nowy szablon: - templates/admin/zopk_knowledge_duplicates.html - UI z kartami encji Dodatkowo: - Aktualizacja CLAUDE.md z procedurą wdrażania - Skrypt scripts/run_migration.py do uruchamiania migracji SQL Co-Authored-By: Claude Opus 4.5 <noreply@anthropic.com>	2026-01-17 09:09:22 +01:00
Maciej Pienczyn	d0dda10bd7	feat(zopk): Panel admina bazy wiedzy, poprawa odpowiedzi AI, timeline Priorytet 1 - Panel admina bazy wiedzy ZOPK: - /admin/zopk/knowledge - dashboard ze statystykami - /admin/zopk/knowledge/chunks - lista chunks z filtrowaniem - /admin/zopk/knowledge/facts - lista faktów z typami - /admin/zopk/knowledge/entities - lista encji z mentions - CRUD operacje: weryfikacja, usuwanie Priorytet 2 - Poprawa jakości odpowiedzi NordaGPT: - Linki markdown do źródeł w kontekście ZOPK - Ulepszone formatowanie (bold, listy, nagłówki) - Sekcja "Źródła" na końcu odpowiedzi - Instrukcje w system prompt dla lepszej prezentacji Priorytet 3 - Timeline ZOPK: - Model ZOPKMilestone w database.py - Migracja 016_zopk_milestones.sql z sample data - Sekcja "Roadmapa ZOPK" na stronie /zopk - Pionowa oś czasu z markerami lat - Statusy: completed, in_progress, planned, delayed Co-Authored-By: Claude Opus 4.5 <noreply@anthropic.com>	2026-01-17 08:56:55 +01:00
Maciej Pienczyn	37af8abc73	feat(admin): Paski postępu dla operacji AI w panelu ZOPK Dodano Server-Sent Events (SSE) dla śledzenia postępu w czasie rzeczywistym: - Scraping treści artykułów - Ekstrakcja wiedzy przez Gemini AI - Generowanie embeddingów Funkcje: - Modal z paskiem postępu i statystykami - Live log operacji z kolorowaniem statusów - Podsumowanie na zakończenie (sukces/błędy/czas) - Możliwość zamknięcia modalu po zakończeniu Zmiany techniczne: - 3 nowe SSE endpointy (/stream) - ProgressUpdate dataclass w scraperze - Callback pattern w batch_scrape, batch_extract, generate_chunk_embeddings Co-Authored-By: Claude Opus 4.5 <noreply@anthropic.com>	2026-01-16 23:23:05 +01:00
Maciej Pienczyn	31d5a112b8	feat(admin): Sekcja Baza Wiedzy AI w panelu ZOPK - Dodano sekcję "🧠 Baza Wiedzy AI" do /admin/zopk - Statystyki scrapingu: zatwierdzonych, zescrapowanych, oczekujących - Statystyki wiedzy: chunks, fakty, encje - Statystyki embeddingów: z/bez embeddingów - Przyciski: Scrapuj treść, Ekstrakcja AI, Generuj embeddingi - Top encje z kolorowymi pillami (firmy, osoby, miejsca, projekty) - Rozszerzono get_extraction_statistics() o pending_scrape i embeddings Co-Authored-By: Claude Opus 4.5 <noreply@anthropic.com>	2026-01-16 22:17:44 +01:00
Maciej Pienczyn	41141eb540	fix: Remove is_verified filter from get_relevant_facts All 328 auto-extracted facts had is_verified=False, causing empty results. Changed to confidence_score >= 0.3 filter instead. Co-Authored-By: Claude Opus 4.5 <noreply@anthropic.com>	2026-01-16 22:03:15 +01:00
Maciej Pienczyn	9421f2847f	fix: Improve extraction prompt with JSON structure and fix fact parsing - Updated prompt to specify expected JSON structure for facts and entities - Added 'text' field support in fact parsing (alongside 'full_text') - Listed explicit type values for facts and entities Co-Authored-By: Claude Opus 4.5 <noreply@anthropic.com>	2026-01-16 21:14:56 +01:00
Maciej Pienczyn	624114d443	fix: Remove max_tokens parameter that triggered Gemini safety filters Testing revealed that max_tokens=2000 parameter causes Gemini to block requests with safety filters, even for safe content. Removed max_tokens from generate_text() call - Gemini will use default. Co-Authored-By: Claude Opus 4.5 <noreply@anthropic.com>	2026-01-16 21:10:45 +01:00
Maciej Pienczyn	ac0aceb30e	fix: Reduce chunk size and truncate prompts for Gemini safety filters Testing revealed that Gemini 2.5 safety filters block texts longer than ~2000 chars. Applied two fixes: 1. Truncate chunk text to 2000 chars in _extract_with_ai() as safety net 2. Reduce MAX_CHUNK_SIZE from 1000 to 500 tokens (~2000 chars) This ensures all AI extraction requests stay within Gemini's safe limits. Co-Authored-By: Claude Opus 4.5 <noreply@anthropic.com>	2026-01-16 21:05:48 +01:00
Maciej Pienczyn	4045106b3c	fix: Ultra-simplified extraction prompt to avoid Gemini safety filters The complex JSON schema with pipe characters was triggering Gemini 2.5's safety filters. Simplified to minimal prompt that still produces valid output. Co-Authored-By: Claude Opus 4.5 <noreply@anthropic.com>	2026-01-16 20:59:00 +01:00
Maciej Pienczyn	e1f29229a3	fix(zopk): Uproszczone prompty ekstrakcji - rozwiązanie safety filters Problem: Połączenie skomplikowanego system_prompt + user_prompt wyzwalało safety filters Gemini mimo płatnego API Rozwiązanie: - Usunięto system_prompt (pusty string) - Uproszczono user_prompt do minimum - Zachowano niezbędny format JSON Testowane: prosty prompt działa, pełny przebieg do weryfikacji Co-Authored-By: Claude Opus 4.5 <noreply@anthropic.com>	2026-01-16 20:54:22 +01:00
Maciej Pienczyn	27b03eb051	fix(zopk): Neutralne prompty ekstrakcji - unikanie safety filters Problem: Gemini blokował ekstrakcję z artykułów o energetyce Rozwiązanie: Bardziej neutralne sformułowania promptów - Podkreślono że to analiza PUBLICZNYCH artykułów prasowych - Usunięto wrażliwe słowa kluczowe (nuclear, defense) - Zmieniono 'extract' na 'identify' Co-Authored-By: Claude Opus 4.5 <noreply@anthropic.com>	2026-01-16 20:42:05 +01:00
Maciej Pienczyn	cd2db86a95	fix(zopk): Naprawiono błąd system_prompt w AI extraction Problem: GeminiService.generate_text() nie obsługuje parametru system_prompt Rozwiązanie: Połączono system_prompt z user_prompt w jeden full_prompt Dotyczy: ekstrakcji faktów, encji i relacji z artykułów ZOPK Co-Authored-By: Claude Opus 4.5 <noreply@anthropic.com>	2026-01-16 20:37:09 +01:00
Maciej Pienczyn	1b4cd31c41	feat(zopk): Knowledge Base + NordaGPT integration (FAZY 0-3) FAZA 0 - Web Scraping: - Migracja 015: pola full_content, scrape_status w zopk_news - zopk_content_scraper.py: scraper z rate limiting i selektorami FAZA 1 - Knowledge Extraction: - zopk_knowledge_service.py: chunking, facts, entities extraction - Endpointy /admin/zopk/knowledge/extract FAZA 2 - Embeddings: - gemini_service.py: generate_embedding(), generate_embeddings_batch() - Model text-embedding-004 (768 dimensions) FAZA 3 - NordaGPT Integration: - nordabiz_chat.py: _is_zopk_query(), _get_zopk_knowledge_context() - System prompt z bazą wiedzy ZOPK - Semantic search w kontekście chatu Co-Authored-By: Claude Opus 4.5 <noreply@anthropic.com>	2026-01-16 20:15:30 +01:00

34 Commits