A kihívás#
Egy vállalkozás belső tudásbázisa általában szétszórtan létezik: Google Docs-ban, PDF-ekben, email szálakban, Slack üzenetekben, régi Notion oldalakban. Amikor egy ügyfél kérdez, a csapatnak perceket — néha tíz perceket — kell töltenie a válasz megkeresésével. A probléma a cég növekedésével nem javul, hanem exponenciálisan romlik.
A 10-50 fős vállalkozásoknál ez különösen fájó pont. Nincs dedikált tudásmenedzsment csapat, nincs enterprise szintű belső wiki, és az informális tudásátadás — a "kérdezd meg Pistát, ő tudja" kultúra — a legfőbb módszer. Ez addig működik, amíg Pista elérhető. Amikor szabadságon van, beteg, vagy éppen máshol dolgozik, az egész csapat megáll.
Ez több, egymást erősítő probléma:
- Lassú válaszidő: A vevő vár, miközben a kolléga keresgél három különböző rendszerben. Előfordul, hogy a választ végül meg sem találja, és fejből próbál emlékezni
- Inkonzisztens válaszok: Két kolléga más-más verzióját találja meg ugyanannak az információnak, ami az ügyfélnél bizalomvesztést okoz
- Tudásvesztés: Amikor egy tapasztalt kolléga elmegy, a fejében lévő tudás elmegy vele. Hetekbe, hónapokba telhet, mire az új ember pótolni tudja ezt a hiányt
- Nem skálázható: Ahogy nő a csapat és a dokumentáció, a keresés egyre lassabb. Ami 5 főnél 2 perces keresgélés, az 30 főnél napi szintű frusztrációvá válik
- Betanítási költség: Minden új kolléga betanítása ugyanazoknak a kérdéseknek a megválaszolását jelenti, újra és újra — elvonva a senior csapattagok idejét a produktív munkától
A cél: egy chatbot, ami a cég saját dokumentumaiból válaszol — pontosan, gyorsan, és hivatkozással a forrásra.
A RAG (Retrieval-Augmented Generation) egy AI technika, ami ötvözi a keresést és a szöveggenerálást. A koncepció lényege, hogy az AI modellt nem önmagában használjuk, hanem előbb megkeressük a releváns információt, és csak utána kérjük a modellt, hogy abból fogalmazzon választ.
A folyamat lépésről lépésre:
- A felhasználó feltesz egy kérdést természetes nyelven, pontosan úgy, ahogy egy kollégától kérdezné
- A rendszer megkeresi a releváns dokumentumrészleteket egy vektoros adatbázisból — ez a "retrieval" rész. A keresés nem kulcsszó alapú, hanem szemantikus: a rendszer a kérdés értelmét hasonlítja össze a dokumentumok értelmével
- Az AI a megtalált kontextus alapján fogalmazza meg a választ — ez a "generation" rész. A modell csak azt az információt használhatja, amit a keresés visszaadott
- A válasz tartalmazza a forrás hivatkozást, hogy ellenőrizhető legyen. A felhasználó mindig vissza tudja keresni az eredeti dokumentumot
A lényeg: az AI nem a saját (néha téves) tudásából válaszol, hanem kizárólag a megadott dokumentumokból. Ha nincs releváns információ, azt mondja: "Erre a kérdésre nem találtam választ a tudásbázisban." Ez a viselkedés beépített — a rendszer inkább nem válaszol, minthogy kitaláljon valamit.
Ez a ChatGPT-vel szembeni legnagyobb előny: a RAG chatbot nem hallucinál, mert nem találja ki a válaszokat. Míg a ChatGPT az interneten tanult általános tudásából generál választ (ami lehet pontos, de lehet teljesen téves), a RAG chatbot csak a te dokumentumaidra támaszkodik.
A megoldás részletesen#
Dokumentum import és előkészítés
A cég dokumentumait összegyűjtöttük és feldolgoztuk. Ez a lépés kritikus, mert a chatbot minősége közvetlenül a dokumentáció minőségétől függ. A rendszer az alábbi formátumokat kezeli:
- PDF dokumentumokat (kézikönyvek, eljárásrendek, szerződésminták)
- Google Docs és Notion oldalakat (API-n keresztül szinkronizálva, így a frissítések automatikusan bekerülnek)
- Markdown fájlokat (technikai dokumentáció, fejlesztői útmutatók)
- Egyszerű szöveges fájlokat (FAQ listák, email sablonok, termékleírások)
A dokumentumokat intelligens szegmensekre bontjuk: nem soronként, hanem tartalmi egységenként. Egy fejezet, egy kérdés-válasz pár, egy eljárás leírása — ezek lesznek a keresési egységek. A szegmentálás minősége közvetlenül befolyásolja a válaszok pontosságát, ezért ezt minden projektnél egyedileg hangoljuk.
Vektorizálás — a keresés alapja
Minden szegmenst az OpenAI embedding modell vektorrá alakít, és eltároljuk Supabase pgvector-ban. A vektor egy matematikai reprezentáció, ami leírja a szöveg jelentését — nem csak a szavakat, hanem az értelmet. Egy 1536 dimenziós számsorozat, ami megragadja a szöveg szemantikus tartalmát.
Ennek köszönhetően a keresés szemantikus: ha a felhasználó azt kérdezi "hogyan adjunk hozzá új felhasználót?", a rendszer megtalálja a "Felhasználó kezelés → Új felhasználó létrehozása" szekciót, még ha a pontos szavak nem is egyeznek. A pgvector cosine similarity algoritmusa rangsorolja a találatokat relevancia szerint, így mindig a leginkább odaillő szegmensek kerülnek a válasz alapjába.
Kérdés feldolgozás — 3 másodperc alatt
Amikor a felhasználó kérdést tesz fel, a rendszer az alábbi pipeline-on fut végig, teljes egészében automatizáltan:
- A kérdés vektorrá alakul (ugyanazzal az embedding modellel, mint a dokumentumok)
- A pgvector megkeresi a legközelebb eső dokumentum szegmenseket (top 3-5 releváns találat)
- A szegmenseket kontextusként adjuk az OpenAI GPT modellnek, egy gondosan megírt system prompt-tal együtt
- A modell a kontextus alapján fogalmazza meg a természetes nyelvű választ, figyelembe véve a magyar nyelvi sajátosságokat
- A válasz tartalmazza a forrás dokumentum nevét és szekciót, hogy bárki ellenőrizhesse
Az egész < 3 másodperc, még komplex kérdéseknél is. A válaszidő nagyrészt az OpenAI API hívástól függ — maga a vektoros keresés milliszekundumok alatt lefut.
Forrás megjelölés — bizalom és ellenőrzés
Minden válasz tartalmazza a forrás hivatkozást: melyik dokumentumból, melyik szekcióból származik az információ. A felhasználó egy kattintással megnézheti az eredeti dokumentumot, így bármikor ellenőrizheti a chatbot által adott információt.
Ez kritikus a bizalom szempontjából: a csapat tudja, hogy a chatbot válaszai ellenőrizhetők, nem pedig "véleményei" vannak. A forrás megjelölés emellett arra is jó, hogy kiderüljön, ha egy dokumentum elavult — ha a chatbot egy régi verziójú eljárásrendet idéz, az azonnali jelzés, hogy frissíteni kell. Így a chatbot közvetve a dokumentáció karbantartását is ösztönzi.
Előtte–utána#
- Válaszkeresés: 3-10 perc kézi keresgélés
- Inkonzisztens: két kolléga más választ ad
- Csak az tudja, aki régen van a cégnél
- Dokumentáció elavult, senki nem frissíti
- Új kolléga betanítása: hetekig tart
- < 3 mp AI válasz, forrás hivatkozással
- Konzisztens: mindig a legfrissebb dokumentumból
- Bárki kérdezheti, 0 előzetes tudás kell
- A chatbot motiválja a dokumentáció frissítését
- Új kolléga napok alatt produktív
RAG Chatbot — Chat interface
Felhasználó: Hogyan kell új ügyfelet felvenni a CRM-be?
AI válasz: Az új ügyfél felvételéhez kövesd ezeket a lépéseket:
- Nyisd meg az Airtable CRM nézetet
- Kattints a "+ Új sor" gombra
- Töltsd ki a kötelező mezőket: cégnév, kapcsolattartó neve, email, telefon
- Válaszd ki a státuszt: "Új lead"
- Mentés után a rendszer automatikusan küld üdvözlő emailt
📄 Forrás: Ügyfélkezelési kézikönyv > Új ügyfél felvétele (3. fejezet)
A RAG chatbot nem minden helyzetre ideális. Fontos tisztán látni a korlátait, mielőtt bevezeted:
- Nem helyettesíti a komplex döntéshozatalt. Ha a kérdésre a válasz "attól függ", a chatbot nem tudja mérlegelni a körülményeket. Például egy árajánlat kalkuláció, ahol az ár függ a mennyiségtől, a határidőtől és az ügyfél státuszától, túl összetett a RAG számára
- Csak annyira jó, mint a dokumentáció. Ha a dokumentáció elavult vagy hiányos, a chatbot válaszai is azok lesznek. Ha a szállítási szabályzat tavaly óta nem frissült, a chatbot a régi feltételeket fogja idézni — magabiztosan
- Nem kezeli a bizalmas információkat automatikusan. Ha a dokumentáció tartalmaz belső árazást, HR adatokat vagy bérlistát, gondoskodni kell a hozzáférés-kezelésről. Alapesetben minden felhasználó minden dokumentumhoz hozzáfér — jogosultsági szinteket külön kell beállítani
- Nem tanul a beszélgetésekből. Ha a felhasználó javítja a chatbotot, az nem frissíti automatikusan a dokumentációt — azt manuálisan kell megtenni. A chatbot nem "okosodik" a használattól, csak a dokumentáció frissítésétől
- Nem kezel többlépéses folyamatokat. Ha a válasz attól függ, hogy a felhasználó milyen lépéseknél tart (pl. egy jóváhagyási folyamatban), a chatbot nem tud állapotot követni — minden kérdést önállóan kezel
- Nyelvi korlátok. Ha a dokumentáció vegyes nyelvű (pl. magyar és angol műszaki szövegek keveréke), a keresés pontossága csökkenhet, mert a szemantikus hasonlóság nyelven belül működik a legjobban
A RAG a legjobb: gyakori, ismétlődő kérdésekre, ahol a válasz egyértelműen megtalálható a dokumentációban, és a sebesség kritikus. Gondolj az ügyfélszolgálati kérdések 80%-ára — azokra, amikre a csapat már százszor válaszolt.
Az eredmény számokban#
| Metrika | Korábban | Most |
|---|---|---|
| Válaszidő (ügyfélszolgálat) | 3-10 perc | < 3 másodperc |
| Konzisztencia | Változó (kolléga függő) | 100% (dokumentum alapú) |
| Új kolléga betanulás | 2-4 hét | 3-5 nap |
| Tudásvesztés kockázat | Magas (kulcsember függ) | Alacsony (dokumentált) |
Az ügyfélszolgálat válaszideje töredékére csökkent. A leggyakoribb kérdésekre a chatbot azonnal válaszol, a komplexebb eseteket pedig a megfelelő kontextussal adja tovább a csapatnak.
Hogyan alkalmazd a saját cégedben#
Nem kell a teljes céges tudásbázist egyszerre betölteni. A legjobb megközelítés fokozatos, és már az első héten mérhető eredményt hoz:
-
Térképezd fel a leggyakoribb kérdéseket. Kérd meg a csapatot, hogy egy hétig jegyezze fel, milyen kérdésekre keresik a választ. Általában 10-15 témakör fedi le a kérdések 80%-át — ezekhez kell először dokumentáció.
-
Gyűjtsd össze az alap dokumentumokat. Kezdd 10-20 dokumentummal: eljárásrendek, termékleírások, GYIK, onboarding útmutatók. Ha nincsenek formális dokumentumok, kérd meg a senior kollégákat, hogy diktálják le a legfontosabb tudnivalókat — akár hangfelvétel formájában, amit utána szöveggé alakítunk.
-
Teszteld kis csoporttal. Adj hozzáférést 3-5 kollégának egy kéthetes próbaidőre. Kérd, hogy minden belső kérdésnél először a chatbotot használják, és jelezzék, ha a válasz hiányos vagy pontatlan. Ez egyben a dokumentáció minőségének auditja is.
-
Iterálj a visszajelzések alapján. A tesztidőszak visszajelzései megmutatják, hol hiányos a dokumentáció. Pótold a hiányokat, finomhangold a szegmentálást, és adj hozzá a felmerült témákhoz új dokumentumokat.
-
Bővítsd fokozatosan. Ha a chatbot jól működik az alap dokumentációval, adj hozzá újabb területeket: pénzügyi folyamatok, HR szabályzatok, műszaki dokumentáció. A vektorizálás pár perc dokumentumonként — a bővítés nem igényel leállást.
A tapasztalatunk: a legtöbb csapat a második hétre már önmagától kéri, hogy töltsünk be több dokumentumot, mert megtapasztalják, mennyi időt spórolnak. A chatbot a dokumentáció frissítésére is motivál — ha a csapat látja, hogy elavult információt kap vissza, gyorsabban frissítik az eredeti dokumentumot.
Ha szeretnél RAG chatbotot a cégednek, foglalj egy ingyenes konzultációt.
Tech stack#
| Eszköz | Szerepe |
|---|---|
| n8n | Dokumentum import workflow, kérdés-válasz pipeline |
| OpenAI API | Embedding (vektorizálás) és válasz generálás |
| Supabase | PostgreSQL adatbázis + pgvector kiegészítő |
| pgvector | Vektoros keresés a dokumentum szegmensek között |