Penelusuran Dokumen
Dashboard Ingest — memuat…
Penelusuran — Eksplorasi Tematik
URL: /ingest/telusur
Tujuan
Halaman ini menjawab pertanyaan: "Apa yang bisa saya tanyakan?"
Setelah dokumen masuk basis data vektor (RAG), halaman ini menyajikan panel facet sebagai pintu masuk eksplorasi tematik. Pengguna melihat jenis dokumen, tahun, format, serta kata kunci dan konsep dominan hasil enrichment — lalu klik sebuah nilai untuk membuka Chat Facet: tanya-jawab AI yang mencakup semua dokumen pada kelompok facet itu sekaligus.
Daftar dokumen per-berkas + Chat Dokumen (per dokumen tunggal) bukan di sini — ada di Penyimpanan. Halaman ini fokus pada discoverability tematik + chat lintas dokumen.
Tata Letak
Facet tidak diperlakukan setara — dipisah jadi filter struktural vs eksplorasi tematik:
1. Filter Struktural (bar ringkas)
Jenis dokumen, tahun, dan format tampil sebagai chip ringkas dalam satu bar. Nilainya sedikit, berperan sebagai filter cepat. Klik chip → Chat Facet untuk kelompok itu.
2. Kata Kunci (tag cloud)
Kata kunci dominan hasil enrichment LLM ditampilkan sebagai tag cloud — ukuran chip mengikuti frekuensi kemunculan (chunk). Ada kotak saring untuk memfilter cloud. Sumber: rag_chunks.keywords.
3. Konsep (dikelompokkan per kategori)
Konsep tata kelola hasil enrichment LLM, dikelompokkan per kategori label: INDIKATOR, PROGRAM, KEBIJAKAN, SEKTOR, ANGGARAN, LAINNYA. Sumber: rag_chunks.entities → 'CONCEPT'.
Hanya menampilkan CONCEPT (ekstraksi LLM, presisi tinggi). Entitas Spacy mentah (PER/ORG/LOC) sengaja tidak ditampilkan — masih noisy sampai refactor IndoBERT-NER (Lebah #5092).
Behavior Klik Facet
- Klik nilai facet (chip apa pun) → buka Chat Facet di panel samping.
- Retrieval RAG dikirim dengan konteks
{instansi_slug, facet_type, facet_value, facet_category, filter_mode: 'facet'}— mencakup semua dokumen dalam kelompok facet tersebut. - Suggested queries menyesuaikan tipe facet. Untuk konsep, pertanyaan di-route per kategori label (mis. ANGGARAN → "berapa alokasi & realisasi…", INDIKATOR → "berapa target & capaian…"). Template
template_pertanyaan_facet.json. - Sifat pertanyaan: eksploratif lintas dokumen (membandingkan/meringkas), bukan penilaian SAKIP berbasis kriteria.
Catatan teknis (sementara). Dukungan
filter_mode=facetuntuk keyword/konsep di sisi retrieval guritasakip-chatsedang dikoordinasikan (Lebah #5090). Sampai aktif, chat tetap berfungsi namun retrieval bisa jatuh ke cakupan instansi-wide (graceful fallback).
Batas Keahlian AI Agent
Penting. AI agent di halaman ini belum dibekali persona asesor — agent belum memahami kriteria penilaian SAKIP. Keahlian agent murni terbatas pada eksplorasi relevansi dokumen. Tidak memberi penilaian, tidak menyimpulkan kepatuhan, tidak merekomendasikan skor.
Penilaian kualitas SAKIP berdasarkan kriteria PermenPANRB ada di Evaluasi (Pipeline SAKIP, sisi PENILAIAN).
Data
Facet di-query live dari gajah RAG via /ingest/telusur/facets (3 facet doc-level dari rag_documents + 2 facet enrichment chunk-level dari rag_chunks). Selalu mencerminkan kondisi vector DB terkini.
Roadmap
v1 (Lebah #5075 + #5094): facet doc-level (jenis/tahun/format) + Chat Facet lintas dokumen.
v2 (Lebah #5078): facet kata kunci + konsep hasil enrichment NER+keyword. Konsep = ekstraksi LLM CONCEPT, di-route suggested query per kategori label. Entitas Spacy mentah ditunda ke #5092.
Swap #5098: facet pindah dari /ingest/simpan ke /ingest/telusur (telusur = eksplorasi tematik, simpan = inventaris dokumen) + tata letak filter bar + tag cloud + konsep grouped (kurangi clutter dari 5 box seragam).
Wire ongoing (Lebah #5090): auto-fill enrichment untuk ingest baru via queue + dukungan filter_mode=facet di retrieval gurita.