Főoldal
Rólunk
Kapcsolat
Összes projekt
RAG Chatbot

n8n RAG Chat · Tudásbázis chatbot

Chatbot, ami a cég saját dokumentumaiból válaszol

RAG alapú chatbot, ami a vállalkozás belső tudásbázisából dolgozik. Nem hallucinál, nem találja ki a válaszokat. Csak azt mondja, ami a dokumentumokban van.

RAG
tudásbázis
< 3 mp
válaszidő

A kihívás#

Egy vállalkozás belső tudásbázisa általában szétszórtan létezik: Google Docs-ban, PDF-ekben, email szálakban, Slack üzenetekben, régi Notion oldalakban. Amikor egy ügyfél kérdez, a csapatnak perceket — néha tíz perceket — kell töltenie a válasz megkeresésével. A probléma a cég növekedésével nem javul, hanem exponenciálisan romlik.

A 10-50 fős vállalkozásoknál ez különösen fájó pont. Nincs dedikált tudásmenedzsment csapat, nincs enterprise szintű belső wiki, és az informális tudásátadás — a "kérdezd meg Pistát, ő tudja" kultúra — a legfőbb módszer. Ez addig működik, amíg Pista elérhető. Amikor szabadságon van, beteg, vagy éppen máshol dolgozik, az egész csapat megáll.

Ez több, egymást erősítő probléma:

  • Lassú válaszidő: A vevő vár, miközben a kolléga keresgél három különböző rendszerben. Előfordul, hogy a választ végül meg sem találja, és fejből próbál emlékezni
  • Inkonzisztens válaszok: Két kolléga más-más verzióját találja meg ugyanannak az információnak, ami az ügyfélnél bizalomvesztést okoz
  • Tudásvesztés: Amikor egy tapasztalt kolléga elmegy, a fejében lévő tudás elmegy vele. Hetekbe, hónapokba telhet, mire az új ember pótolni tudja ezt a hiányt
  • Nem skálázható: Ahogy nő a csapat és a dokumentáció, a keresés egyre lassabb. Ami 5 főnél 2 perces keresgélés, az 30 főnél napi szintű frusztrációvá válik
  • Betanítási költség: Minden új kolléga betanítása ugyanazoknak a kérdéseknek a megválaszolását jelenti, újra és újra — elvonva a senior csapattagok idejét a produktív munkától

A cél: egy chatbot, ami a cég saját dokumentumaiból válaszol — pontosan, gyorsan, és hivatkozással a forrásra.

iMi az a RAG?

A RAG (Retrieval-Augmented Generation) egy AI technika, ami ötvözi a keresést és a szöveggenerálást. A koncepció lényege, hogy az AI modellt nem önmagában használjuk, hanem előbb megkeressük a releváns információt, és csak utána kérjük a modellt, hogy abból fogalmazzon választ.

A folyamat lépésről lépésre:

  1. A felhasználó feltesz egy kérdést természetes nyelven, pontosan úgy, ahogy egy kollégától kérdezné
  2. A rendszer megkeresi a releváns dokumentumrészleteket egy vektoros adatbázisból — ez a "retrieval" rész. A keresés nem kulcsszó alapú, hanem szemantikus: a rendszer a kérdés értelmét hasonlítja össze a dokumentumok értelmével
  3. Az AI a megtalált kontextus alapján fogalmazza meg a választ — ez a "generation" rész. A modell csak azt az információt használhatja, amit a keresés visszaadott
  4. A válasz tartalmazza a forrás hivatkozást, hogy ellenőrizhető legyen. A felhasználó mindig vissza tudja keresni az eredeti dokumentumot

A lényeg: az AI nem a saját (néha téves) tudásából válaszol, hanem kizárólag a megadott dokumentumokból. Ha nincs releváns információ, azt mondja: "Erre a kérdésre nem találtam választ a tudásbázisban." Ez a viselkedés beépített — a rendszer inkább nem válaszol, minthogy kitaláljon valamit.

Ez a ChatGPT-vel szembeni legnagyobb előny: a RAG chatbot nem hallucinál, mert nem találja ki a válaszokat. Míg a ChatGPT az interneten tanult általános tudásából generál választ (ami lehet pontos, de lehet teljesen téves), a RAG chatbot csak a te dokumentumaidra támaszkodik.

A megoldás részletesen#

1

Dokumentum import és előkészítés

A cég dokumentumait összegyűjtöttük és feldolgoztuk. Ez a lépés kritikus, mert a chatbot minősége közvetlenül a dokumentáció minőségétől függ. A rendszer az alábbi formátumokat kezeli:

  • PDF dokumentumokat (kézikönyvek, eljárásrendek, szerződésminták)
  • Google Docs és Notion oldalakat (API-n keresztül szinkronizálva, így a frissítések automatikusan bekerülnek)
  • Markdown fájlokat (technikai dokumentáció, fejlesztői útmutatók)
  • Egyszerű szöveges fájlokat (FAQ listák, email sablonok, termékleírások)

A dokumentumokat intelligens szegmensekre bontjuk: nem soronként, hanem tartalmi egységenként. Egy fejezet, egy kérdés-válasz pár, egy eljárás leírása — ezek lesznek a keresési egységek. A szegmentálás minősége közvetlenül befolyásolja a válaszok pontosságát, ezért ezt minden projektnél egyedileg hangoljuk.

2

Vektorizálás — a keresés alapja

Minden szegmenst az OpenAI embedding modell vektorrá alakít, és eltároljuk Supabase pgvector-ban. A vektor egy matematikai reprezentáció, ami leírja a szöveg jelentését — nem csak a szavakat, hanem az értelmet. Egy 1536 dimenziós számsorozat, ami megragadja a szöveg szemantikus tartalmát.

Ennek köszönhetően a keresés szemantikus: ha a felhasználó azt kérdezi "hogyan adjunk hozzá új felhasználót?", a rendszer megtalálja a "Felhasználó kezelés → Új felhasználó létrehozása" szekciót, még ha a pontos szavak nem is egyeznek. A pgvector cosine similarity algoritmusa rangsorolja a találatokat relevancia szerint, így mindig a leginkább odaillő szegmensek kerülnek a válasz alapjába.

3

Kérdés feldolgozás — 3 másodperc alatt

Amikor a felhasználó kérdést tesz fel, a rendszer az alábbi pipeline-on fut végig, teljes egészében automatizáltan:

  1. A kérdés vektorrá alakul (ugyanazzal az embedding modellel, mint a dokumentumok)
  2. A pgvector megkeresi a legközelebb eső dokumentum szegmenseket (top 3-5 releváns találat)
  3. A szegmenseket kontextusként adjuk az OpenAI GPT modellnek, egy gondosan megírt system prompt-tal együtt
  4. A modell a kontextus alapján fogalmazza meg a természetes nyelvű választ, figyelembe véve a magyar nyelvi sajátosságokat
  5. A válasz tartalmazza a forrás dokumentum nevét és szekciót, hogy bárki ellenőrizhesse

Az egész < 3 másodperc, még komplex kérdéseknél is. A válaszidő nagyrészt az OpenAI API hívástól függ — maga a vektoros keresés milliszekundumok alatt lefut.

4

Forrás megjelölés — bizalom és ellenőrzés

Minden válasz tartalmazza a forrás hivatkozást: melyik dokumentumból, melyik szekcióból származik az információ. A felhasználó egy kattintással megnézheti az eredeti dokumentumot, így bármikor ellenőrizheti a chatbot által adott információt.

Ez kritikus a bizalom szempontjából: a csapat tudja, hogy a chatbot válaszai ellenőrizhetők, nem pedig "véleményei" vannak. A forrás megjelölés emellett arra is jó, hogy kiderüljön, ha egy dokumentum elavult — ha a chatbot egy régi verziójú eljárásrendet idéz, az azonnali jelzés, hogy frissíteni kell. Így a chatbot közvetve a dokumentáció karbantartását is ösztönzi.

Előtte–utána#

Előtte
  • Válaszkeresés: 3-10 perc kézi keresgélés
  • Inkonzisztens: két kolléga más választ ad
  • Csak az tudja, aki régen van a cégnél
  • Dokumentáció elavult, senki nem frissíti
  • Új kolléga betanítása: hetekig tart
Utána
  • < 3 mp AI válasz, forrás hivatkozással
  • Konzisztens: mindig a legfrissebb dokumentumból
  • Bárki kérdezheti, 0 előzetes tudás kell
  • A chatbot motiválja a dokumentáció frissítését
  • Új kolléga napok alatt produktív
chat.cegnev.hu

RAG Chatbot — Chat interface

Felhasználó: Hogyan kell új ügyfelet felvenni a CRM-be?

AI válasz: Az új ügyfél felvételéhez kövesd ezeket a lépéseket:

  1. Nyisd meg az Airtable CRM nézetet
  2. Kattints a "+ Új sor" gombra
  3. Töltsd ki a kötelező mezőket: cégnév, kapcsolattartó neve, email, telefon
  4. Válaszd ki a státuszt: "Új lead"
  5. Mentés után a rendszer automatikusan küld üdvözlő emailt

📄 Forrás: Ügyfélkezelési kézikönyv > Új ügyfél felvétele (3. fejezet)

!RAG korlátai — mikor NE használd

A RAG chatbot nem minden helyzetre ideális. Fontos tisztán látni a korlátait, mielőtt bevezeted:

  • Nem helyettesíti a komplex döntéshozatalt. Ha a kérdésre a válasz "attól függ", a chatbot nem tudja mérlegelni a körülményeket. Például egy árajánlat kalkuláció, ahol az ár függ a mennyiségtől, a határidőtől és az ügyfél státuszától, túl összetett a RAG számára
  • Csak annyira jó, mint a dokumentáció. Ha a dokumentáció elavult vagy hiányos, a chatbot válaszai is azok lesznek. Ha a szállítási szabályzat tavaly óta nem frissült, a chatbot a régi feltételeket fogja idézni — magabiztosan
  • Nem kezeli a bizalmas információkat automatikusan. Ha a dokumentáció tartalmaz belső árazást, HR adatokat vagy bérlistát, gondoskodni kell a hozzáférés-kezelésről. Alapesetben minden felhasználó minden dokumentumhoz hozzáfér — jogosultsági szinteket külön kell beállítani
  • Nem tanul a beszélgetésekből. Ha a felhasználó javítja a chatbotot, az nem frissíti automatikusan a dokumentációt — azt manuálisan kell megtenni. A chatbot nem "okosodik" a használattól, csak a dokumentáció frissítésétől
  • Nem kezel többlépéses folyamatokat. Ha a válasz attól függ, hogy a felhasználó milyen lépéseknél tart (pl. egy jóváhagyási folyamatban), a chatbot nem tud állapotot követni — minden kérdést önállóan kezel
  • Nyelvi korlátok. Ha a dokumentáció vegyes nyelvű (pl. magyar és angol műszaki szövegek keveréke), a keresés pontossága csökkenhet, mert a szemantikus hasonlóság nyelven belül működik a legjobban

A RAG a legjobb: gyakori, ismétlődő kérdésekre, ahol a válasz egyértelműen megtalálható a dokumentációban, és a sebesség kritikus. Gondolj az ügyfélszolgálati kérdések 80%-ára — azokra, amikre a csapat már százszor válaszolt.

Az eredmény számokban#

MetrikaKorábbanMost
Válaszidő (ügyfélszolgálat)3-10 perc< 3 másodperc
KonzisztenciaVáltozó (kolléga függő)100% (dokumentum alapú)
Új kolléga betanulás2-4 hét3-5 nap
Tudásvesztés kockázatMagas (kulcsember függ)Alacsony (dokumentált)

Az ügyfélszolgálat válaszideje töredékére csökkent. A leggyakoribb kérdésekre a chatbot azonnal válaszol, a komplexebb eseteket pedig a megfelelő kontextussal adja tovább a csapatnak.

Hogyan alkalmazd a saját cégedben#

Kezdd kicsiben — egy mappányi dokumentummal

Nem kell a teljes céges tudásbázist egyszerre betölteni. A legjobb megközelítés fokozatos, és már az első héten mérhető eredményt hoz:

  1. Térképezd fel a leggyakoribb kérdéseket. Kérd meg a csapatot, hogy egy hétig jegyezze fel, milyen kérdésekre keresik a választ. Általában 10-15 témakör fedi le a kérdések 80%-át — ezekhez kell először dokumentáció.

  2. Gyűjtsd össze az alap dokumentumokat. Kezdd 10-20 dokumentummal: eljárásrendek, termékleírások, GYIK, onboarding útmutatók. Ha nincsenek formális dokumentumok, kérd meg a senior kollégákat, hogy diktálják le a legfontosabb tudnivalókat — akár hangfelvétel formájában, amit utána szöveggé alakítunk.

  3. Teszteld kis csoporttal. Adj hozzáférést 3-5 kollégának egy kéthetes próbaidőre. Kérd, hogy minden belső kérdésnél először a chatbotot használják, és jelezzék, ha a válasz hiányos vagy pontatlan. Ez egyben a dokumentáció minőségének auditja is.

  4. Iterálj a visszajelzések alapján. A tesztidőszak visszajelzései megmutatják, hol hiányos a dokumentáció. Pótold a hiányokat, finomhangold a szegmentálást, és adj hozzá a felmerült témákhoz új dokumentumokat.

  5. Bővítsd fokozatosan. Ha a chatbot jól működik az alap dokumentációval, adj hozzá újabb területeket: pénzügyi folyamatok, HR szabályzatok, műszaki dokumentáció. A vektorizálás pár perc dokumentumonként — a bővítés nem igényel leállást.

A tapasztalatunk: a legtöbb csapat a második hétre már önmagától kéri, hogy töltsünk be több dokumentumot, mert megtapasztalják, mennyi időt spórolnak. A chatbot a dokumentáció frissítésére is motivál — ha a csapat látja, hogy elavult információt kap vissza, gyorsabban frissítik az eredeti dokumentumot.

Ha szeretnél RAG chatbotot a cégednek, foglalj egy ingyenes konzultációt.

Tech stack#

EszközSzerepe
n8nDokumentum import workflow, kérdés-válasz pipeline
OpenAI APIEmbedding (vektorizálás) és válasz generálás
SupabasePostgreSQL adatbázis + pgvector kiegészítő
pgvectorVektoros keresés a dokumentum szegmensek között
Felhasznált technológiák
n8n
OpenAI API
Supabase
pgvector