n8n RAG Chat · Tudásbázis chatbot · AI és automatizáció projekt

A kihívás#

Egy vállalkozás belső tudásbázisa általában szétszórtan létezik: Google Docs-ban, PDF-ekben, email szálakban, Slack üzenetekben, régi Notion oldalakban. Amikor egy ügyfél kérdez, a csapatnak perceket — néha tíz perceket — kell töltenie a válasz megkeresésével. A probléma a cég növekedésével nem javul, hanem exponenciálisan romlik.

A 10-50 fős vállalkozásoknál ez különösen fájó pont. Nincs dedikált tudásmenedzsment csapat, nincs enterprise szintű belső wiki, és az informális tudásátadás — a "kérdezd meg Pistát, ő tudja" kultúra — a legfőbb módszer. Ez addig működik, amíg Pista elérhető. Amikor szabadságon van, beteg, vagy éppen máshol dolgozik, az egész csapat megáll.

Ez több, egymást erősítő probléma:

Lassú válaszidő: A vevő vár, miközben a kolléga keresgél három különböző rendszerben. Előfordul, hogy a választ végül meg sem találja, és fejből próbál emlékezni
Inkonzisztens válaszok: Két kolléga más-más verzióját találja meg ugyanannak az információnak, ami az ügyfélnél bizalomvesztést okoz
Tudásvesztés: Amikor egy tapasztalt kolléga elmegy, a fejében lévő tudás elmegy vele. Hetekbe, hónapokba telhet, mire az új ember pótolni tudja ezt a hiányt
Nem skálázható: Ahogy nő a csapat és a dokumentáció, a keresés egyre lassabb. Ami 5 főnél 2 perces keresgélés, az 30 főnél napi szintű frusztrációvá válik
Betanítási költség: Minden új kolléga betanítása ugyanazoknak a kérdéseknek a megválaszolását jelenti, újra és újra — elvonva a senior csapattagok idejét a produktív munkától

A cél: egy chatbot, ami a cég saját dokumentumaiból válaszol — pontosan, gyorsan, és hivatkozással a forrásra.

iMi az a RAG?

A RAG (Retrieval-Augmented Generation) egy AI technika, ami ötvözi a keresést és a szöveggenerálást. A koncepció lényege, hogy az AI modellt nem önmagában használjuk, hanem előbb megkeressük a releváns információt, és csak utána kérjük a modellt, hogy abból fogalmazzon választ.

A folyamat lépésről lépésre:

A felhasználó feltesz egy kérdést természetes nyelven, pontosan úgy, ahogy egy kollégától kérdezné
A rendszer megkeresi a releváns dokumentumrészleteket egy vektoros adatbázisból — ez a "retrieval" rész. A keresés nem kulcsszó alapú, hanem szemantikus: a rendszer a kérdés értelmét hasonlítja össze a dokumentumok értelmével
Az AI a megtalált kontextus alapján fogalmazza meg a választ — ez a "generation" rész. A modell csak azt az információt használhatja, amit a keresés visszaadott
A válasz tartalmazza a forrás hivatkozást, hogy ellenőrizhető legyen. A felhasználó mindig vissza tudja keresni az eredeti dokumentumot

A lényeg: az AI nem a saját (néha téves) tudásából válaszol, hanem kizárólag a megadott dokumentumokból. Ha nincs releváns információ, azt mondja: "Erre a kérdésre nem találtam választ a tudásbázisban." Ez a viselkedés beépített — a rendszer inkább nem válaszol, minthogy kitaláljon valamit.

Ez a ChatGPT-vel szembeni legnagyobb előny: a RAG chatbot nem hallucinál, mert nem találja ki a válaszokat. Míg a ChatGPT az interneten tanult általános tudásából generál választ (ami lehet pontos, de lehet teljesen téves), a RAG chatbot csak a te dokumentumaidra támaszkodik.

A megoldás részletesen#

Dokumentum import és előkészítés

A cég dokumentumait összegyűjtöttük és feldolgoztuk. Ez a lépés kritikus, mert a chatbot minősége közvetlenül a dokumentáció minőségétől függ. A rendszer az alábbi formátumokat kezeli:

PDF dokumentumokat (kézikönyvek, eljárásrendek, szerződésminták)
Google Docs és Notion oldalakat (API-n keresztül szinkronizálva, így a frissítések automatikusan bekerülnek)
Markdown fájlokat (technikai dokumentáció, fejlesztői útmutatók)
Egyszerű szöveges fájlokat (FAQ listák, email sablonok, termékleírások)

A dokumentumokat intelligens szegmensekre bontjuk: nem soronként, hanem tartalmi egységenként. Egy fejezet, egy kérdés-válasz pár, egy eljárás leírása — ezek lesznek a keresési egységek. A szegmentálás minősége közvetlenül befolyásolja a válaszok pontosságát, ezért ezt minden projektnél egyedileg hangoljuk.

Vektorizálás — a keresés alapja

Minden szegmenst az OpenAI embedding modell vektorrá alakít, és eltároljuk Supabase pgvector-ban. A vektor egy matematikai reprezentáció, ami leírja a szöveg jelentését — nem csak a szavakat, hanem az értelmet. Egy 1536 dimenziós számsorozat, ami megragadja a szöveg szemantikus tartalmát.

Ennek köszönhetően a keresés szemantikus: ha a felhasználó azt kérdezi "hogyan adjunk hozzá új felhasználót?", a rendszer megtalálja a "Felhasználó kezelés → Új felhasználó létrehozása" szekciót, még ha a pontos szavak nem is egyeznek. A pgvector cosine similarity algoritmusa rangsorolja a találatokat relevancia szerint, így mindig a leginkább odaillő szegmensek kerülnek a válasz alapjába.

Kérdés feldolgozás — 3 másodperc alatt

Amikor a felhasználó kérdést tesz fel, a rendszer az alábbi pipeline-on fut végig, teljes egészében automatizáltan:

A kérdés vektorrá alakul (ugyanazzal az embedding modellel, mint a dokumentumok)
A pgvector megkeresi a legközelebb eső dokumentum szegmenseket (top 3-5 releváns találat)
A szegmenseket kontextusként adjuk az OpenAI GPT modellnek, egy gondosan megírt system prompt-tal együtt
A modell a kontextus alapján fogalmazza meg a természetes nyelvű választ, figyelembe véve a magyar nyelvi sajátosságokat
A válasz tartalmazza a forrás dokumentum nevét és szekciót, hogy bárki ellenőrizhesse

Az egész < 3 másodperc, még komplex kérdéseknél is. A válaszidő nagyrészt az OpenAI API hívástól függ — maga a vektoros keresés milliszekundumok alatt lefut.

Forrás megjelölés — bizalom és ellenőrzés

Minden válasz tartalmazza a forrás hivatkozást: melyik dokumentumból, melyik szekcióból származik az információ. A felhasználó egy kattintással megnézheti az eredeti dokumentumot, így bármikor ellenőrizheti a chatbot által adott információt.

Ez kritikus a bizalom szempontjából: a csapat tudja, hogy a chatbot válaszai ellenőrizhetők, nem pedig "véleményei" vannak. A forrás megjelölés emellett arra is jó, hogy kiderüljön, ha egy dokumentum elavult — ha a chatbot egy régi verziójú eljárásrendet idéz, az azonnali jelzés, hogy frissíteni kell. Így a chatbot közvetve a dokumentáció karbantartását is ösztönzi.

Előtte–utána#

Előtte

Válaszkeresés: 3-10 perc kézi keresgélés
Inkonzisztens: két kolléga más választ ad
Csak az tudja, aki régen van a cégnél
Dokumentáció elavult, senki nem frissíti
Új kolléga betanítása: hetekig tart

Utána

< 3 mp AI válasz, forrás hivatkozással
Konzisztens: mindig a legfrissebb dokumentumból
Bárki kérdezheti, 0 előzetes tudás kell
A chatbot motiválja a dokumentáció frissítését
Új kolléga napok alatt produktív

chat.cegnev.hu

RAG Chatbot — Chat interface

Felhasználó: Hogyan kell új ügyfelet felvenni a CRM-be?

AI válasz: Az új ügyfél felvételéhez kövesd ezeket a lépéseket:

Nyisd meg az Airtable CRM nézetet
Kattints a "+ Új sor" gombra
Töltsd ki a kötelező mezőket: cégnév, kapcsolattartó neve, email, telefon
Válaszd ki a státuszt: "Új lead"
Mentés után a rendszer automatikusan küld üdvözlő emailt

📄 Forrás: Ügyfélkezelési kézikönyv > Új ügyfél felvétele (3. fejezet)

!RAG korlátai — mikor NE használd

A RAG chatbot nem minden helyzetre ideális. Fontos tisztán látni a korlátait, mielőtt bevezeted:

Nem helyettesíti a komplex döntéshozatalt. Ha a kérdésre a válasz "attól függ", a chatbot nem tudja mérlegelni a körülményeket. Például egy árajánlat kalkuláció, ahol az ár függ a mennyiségtől, a határidőtől és az ügyfél státuszától, túl összetett a RAG számára
Csak annyira jó, mint a dokumentáció. Ha a dokumentáció elavult vagy hiányos, a chatbot válaszai is azok lesznek. Ha a szállítási szabályzat tavaly óta nem frissült, a chatbot a régi feltételeket fogja idézni — magabiztosan
Nem kezeli a bizalmas információkat automatikusan. Ha a dokumentáció tartalmaz belső árazást, HR adatokat vagy bérlistát, gondoskodni kell a hozzáférés-kezelésről. Alapesetben minden felhasználó minden dokumentumhoz hozzáfér — jogosultsági szinteket külön kell beállítani
Nem tanul a beszélgetésekből. Ha a felhasználó javítja a chatbotot, az nem frissíti automatikusan a dokumentációt — azt manuálisan kell megtenni. A chatbot nem "okosodik" a használattól, csak a dokumentáció frissítésétől
Nem kezel többlépéses folyamatokat. Ha a válasz attól függ, hogy a felhasználó milyen lépéseknél tart (pl. egy jóváhagyási folyamatban), a chatbot nem tud állapotot követni — minden kérdést önállóan kezel
Nyelvi korlátok. Ha a dokumentáció vegyes nyelvű (pl. magyar és angol műszaki szövegek keveréke), a keresés pontossága csökkenhet, mert a szemantikus hasonlóság nyelven belül működik a legjobban

A RAG a legjobb: gyakori, ismétlődő kérdésekre, ahol a válasz egyértelműen megtalálható a dokumentációban, és a sebesség kritikus. Gondolj az ügyfélszolgálati kérdések 80%-ára — azokra, amikre a csapat már százszor válaszolt.

Az eredmény számokban#

Metrika	Korábban	Most
Válaszidő (ügyfélszolgálat)	3-10 perc	< 3 másodperc
Konzisztencia	Változó (kolléga függő)	100% (dokumentum alapú)
Új kolléga betanulás	2-4 hét	3-5 nap
Tudásvesztés kockázat	Magas (kulcsember függ)	Alacsony (dokumentált)

Az ügyfélszolgálat válaszideje töredékére csökkent. A leggyakoribb kérdésekre a chatbot azonnal válaszol, a komplexebb eseteket pedig a megfelelő kontextussal adja tovább a csapatnak.

Hogyan alkalmazd a saját cégedben#

✓Kezdd kicsiben — egy mappányi dokumentummal

Nem kell a teljes céges tudásbázist egyszerre betölteni. A legjobb megközelítés fokozatos, és már az első héten mérhető eredményt hoz:

Térképezd fel a leggyakoribb kérdéseket. Kérd meg a csapatot, hogy egy hétig jegyezze fel, milyen kérdésekre keresik a választ. Általában 10-15 témakör fedi le a kérdések 80%-át — ezekhez kell először dokumentáció.
Gyűjtsd össze az alap dokumentumokat. Kezdd 10-20 dokumentummal: eljárásrendek, termékleírások, GYIK, onboarding útmutatók. Ha nincsenek formális dokumentumok, kérd meg a senior kollégákat, hogy diktálják le a legfontosabb tudnivalókat — akár hangfelvétel formájában, amit utána szöveggé alakítunk.
Teszteld kis csoporttal. Adj hozzáférést 3-5 kollégának egy kéthetes próbaidőre. Kérd, hogy minden belső kérdésnél először a chatbotot használják, és jelezzék, ha a válasz hiányos vagy pontatlan. Ez egyben a dokumentáció minőségének auditja is.
Iterálj a visszajelzések alapján. A tesztidőszak visszajelzései megmutatják, hol hiányos a dokumentáció. Pótold a hiányokat, finomhangold a szegmentálást, és adj hozzá a felmerült témákhoz új dokumentumokat.
Bővítsd fokozatosan. Ha a chatbot jól működik az alap dokumentációval, adj hozzá újabb területeket: pénzügyi folyamatok, HR szabályzatok, műszaki dokumentáció. A vektorizálás pár perc dokumentumonként — a bővítés nem igényel leállást.

A tapasztalatunk: a legtöbb csapat a második hétre már önmagától kéri, hogy töltsünk be több dokumentumot, mert megtapasztalják, mennyi időt spórolnak. A chatbot a dokumentáció frissítésére is motivál — ha a csapat látja, hogy elavult információt kap vissza, gyorsabban frissítik az eredeti dokumentumot.

Ha szeretnél RAG chatbotot a cégednek, foglalj egy ingyenes konzultációt.

Tech stack#

Eszköz	Szerepe
n8n	Dokumentum import workflow, kérdés-válasz pipeline
OpenAI API	Embedding (vektorizálás) és válasz generálás
Supabase	PostgreSQL adatbázis + pgvector kiegészítő
pgvector	Vektoros keresés a dokumentum szegmensek között

n8n RAG Chat · Tudásbázis chatbot

A kihívás#

A megoldás részletesen#

Dokumentum import és előkészítés

Vektorizálás — a keresés alapja

Kérdés feldolgozás — 3 másodperc alatt

Forrás megjelölés — bizalom és ellenőrzés

Előtte–utána#

Az eredmény számokban#

Hogyan alkalmazd a saját cégedben#

Tech stack#

Kapcsolódó cikkek

Mikor éri meg AI-t használni egy kisvállalkozásnak?

Kapcsolódó szolgáltatásaink

AI eszközök bevezetése a cégedbe

Egyedi szoftverfejlesztés

Hasonló megoldásra van szükséged?