A kihívás#
A Murabau Kft. egy regionális építőipari vállalkozás, amely lakóépületek és ipari létesítmények kivitelezésével foglalkozik. Egy tipikus projektben 8-12 alvállalkozóval dolgoznak párhuzamosan — villanyszerelő, burkoló, festő, gépészeti csapat, daruzás, földmunka — és mindegyikük saját számlázási rendszert használ. Ehhez jönnek a beszállítók (építőanyag kereskedők, gépbérlők, szállítmányozók), akik szintén havi rendszerességgel küldenek dokumentumokat. Összességében a cég havi szinten 60-80 bejövő dokumentumot kezel: számlákat, teljesítési igazolásokat, szállítóleveleket és részszámla-mellékleteket.
A dokumentumok formátuma rendkívül változatos. Van, aki a Billingo-ból generál PDF-et, van, aki a Számlázz.hu-t használja, és akad olyan alvállalkozó is, aki kézzel kitöltött, beszkennelt számlát küld email mellékletként. A teljesítési igazolások még kiszámíthatatlanabbak: ezeket gyakran Word-ben vagy kézzel készítik, a formátumuk projektenként és alvállalkozónként eltér, és sokszor tartalmazzák a részletes tételes munkalapot is.
A feldolgozás korábban teljesen kézi volt. A pénzügyi munkatárs megnyitotta a dokumentumot, kikereste az adatokat — kiállító neve, adószáma, tételek, egységárak, végösszeg, fizetési határidő — majd begépelte egy Excel táblába. Egy átlagos számla feldolgozása 5-10 percet vett igénybe, de a bonyolultabb teljesítési igazolások akár 15-20 percig is tarthattak, mert azokban a munkafázisokat, készültségi fokokat és korábbi részszámlákat is egyeztetni kellett.
A valódi probléma nem is csupán az idő volt, hanem a hibák. Elgépelt adószámok, félrenézett összegek, rossz kategóriába sorolt dokumentumok, összecserélt részszámla-sorszámok. Ezek a hibák később a könyvelésben okoztak komoly fejtörést: az SZJA bevalláskor vagy egy NAV-ellenőrzés során derültek ki — a lehető legrosszabb pillanatban. Ráadásul az építőipari dokumentumok különösen összetettek: szakterületi szakkifejezések, tételes munkalapok, részszámlák és végszámlák bonyolult hierarchiája, valamint a teljesítés igazolásához kötött kifizetési feltételek mind növelik a hibázás esélyét.
Az OCR (Optical Character Recognition) a szövegfelismerés technológiája: a gép "elolvassa" a dokumentumot és szöveggé alakítja. A hagyományos OCR jól működik egyszerű dokumentumoknál, de építőipari számláknál gyakran hibázik.
Az AI OCR egy lépéssel tovább megy: nem csak felismeri a szöveget, hanem érti a kontextust. Tudja, hogy az "Összesen" után következő szám az összeg, a "Határidő" után a dátum, és a "Kiállító" után a cég neve. A Mistral AI-t használtuk, mert kiválóan kezeli a magyar nyelvű dokumentumokat.
Miért pont ez a megoldás?#
Három opciót mérlegeltünk a Murabau-val közösen, és mindegyiket teszteltük egy 20 darabos mintadokumentum-csomaggal, amely vegyes formátumú számlákat és teljesítési igazolásokat tartalmazott:
- Hagyományos OCR szoftver — Olcsó volt, de az építőipari dokumentumok változatos formátuma, a szkennelt képek eltérő minősége és a magyar szakkifejezések miatt mindössze 60-70%-os pontossággal működött. Minden harmadik dokumentumot kézzel kellett javítani, ami alig csökkentette a munkaterheket. Nem elég.
- Nagy felhős OCR szolgáltatás (Google Document AI, AWS Textract) — Technológiailag pontos, de a feldolgozásonkénti költség nagy volumen esetén gyorsan felszaladt. Ezen felül a magyar nyelvi támogatás korlátozott volt: különösen az építőipari szakkifejezéseknél — zsaluzás, kötésidő, vasmennyiség — gyengébben teljesített, mint amire szükségünk volt.
- Mistral AI + n8n — A legjobb ár-érték arány: a Mistral kiválóan érti a magyart, az n8n-nel pedig rugalmasan testreszabható a feldolgozási logika. A Mistral modell natívan képes PDF-eket kezelni, nem igényel előzetes képkonverziót, és strukturált JSON kimenetet ad, amit az n8n workflow azonnal fel tud dolgozni.
A harmadik opciót választottuk, mert nemcsak az általános mezőket (összeg, dátum, partner) ismerte fel pontosan, hanem az építőipari specifikus tételeket — betonozás, zsaluzás, szigetelés, vasalás — is meg tudtuk tanítani a rendszernek felismerni és kategorizálni. Emellett a Mistral API-jának dokumentumonkénti költsége a többi megoldás töredéke volt, így a megtérülés egyértelmű.
A megoldás részletesen#
Dokumentum feltöltés — egyszerű webes felület
A felhasználó egy letisztult, egyszerű webes űrlapon keresztül tölti fel a dokumentumokat. Az űrlap mindössze két elemet tartalmaz: egy fájlválasztó mező és egy "Feltöltés" gomb — semmi felesleges, semmi ami megzavarhatná a felhasználót. A rendszer elfogad PDF-et, szkennelt képet (JPG, PNG), és közvetlenül email mellékletből kimásolt fájlokat is. Nem szükséges előzetesen átnevezni vagy konvertálni a fájlokat, a rendszer bármilyen fájlnévvel dolgozik.
Lehetőség van tömeges feltöltésre is: a hónap végén egyszerre akár 20-30 dokumentumot is fel lehet húzni drag-and-drop módszerrel, és a rendszer sorban, automatikusan feldolgozza mindet. Egy feldolgozási folyamatjelző mutatja, melyik dokumentumnál tart a rendszer, így a felhasználó valós időben követheti az állapotot. Az egész feltöltési folyamat dokumentumonként 10-15 másodpercet vesz igénybe emberi oldalon.
Mistral AI feldolgozás — kontextus-alapú felismerés
A feltöltés után a dokumentum a Mistral AI OCR modellhez kerül, amely nem egyszerűen karaktereket olvas — hanem megérti a dokumentum logikai szerkezetét. A modell a PDF-et vizuálisan elemzi, azonosítja a fejlécet, a tételes részt, az összesítő blokkot, majd ebből kinyeri a strukturált adatokat:
- A kiállító nevét, címét és adószámát — bármilyen formátumban is szerepeljenek
- A számla számát, keltét és teljesítési dátumát
- Az összes tételt mennyiséggel, egységárral és nettó értékkel
- A végösszeget (nettó, bruttó, ÁFA) és az alkalmazott ÁFA kulcsot
- A fizetési határidőt és fizetési módot (átutalás, készpénz, kompenzáció)
- Teljesítési igazolásoknál a munkafázist, készültségi fokot és a referencia részszámla sorszámát
A modell az építőipari szakkifejezésekre is fel lett készítve: zsaluzás, vasalás, betonozás, szigetelés, aljzatbeton, vízszigetelés — ezeket is pontosan felismeri és a megfelelő költségkategóriába sorolja. A kimenet minden esetben strukturált JSON, ami garantálja, hogy a következő lépésben az automatizáció zavartalanul dolgozhasson az adatokkal.
Automatikus iktatás — minden a helyére kerül
A kinyert JSON adatok az n8n workflow-n keresztül automatikusan bekerülnek az Airtable nyilvántartásba, ahol a rendszer több logikai lépést hajt végre. Először kategorizálja a dokumentumot típus szerint: anyagszámla, alvállalkozói díj, gépbérleti díj, szállítási költség vagy teljesítési igazolás. Ezután a kiállító adószáma alapján azonosítja a partnert — ha korábban már érkezett tőle dokumentum, automatikusan hozzárendeli; ha új partner, létrehozza a rekordot.
A rendszer a számla tételeit is elemzi és a megfelelő projekthez rendeli a költségeket. Ha a rendszer bizonytalan egy adatban — például 80% alatti konfidenciával ismerte fel az összeget vagy az adószámot —, sárgával megjelöli ellenőrzésre. A felhasználó ilyenkor egy áttekintő nézetben látja a jelölt mezőket, és egy kattintással jóváhagyja vagy javítja az adatot. A tapasztalatok szerint ez az esetek mindössze 5%-ánál fordul elő, és jellemzően szkennelt, gyengébb minőségű dokumentumoknál. Az iktatott dokumentumok azonnal kereshetők partner, összeg, dátum vagy projektnév alapján.
Előtte–utána#
- 5-10 perc kézi adatbevitel dokumentumonként
- Elgépelések, rossz kategóriák — havi 4-5 hiba
- Hónap végi csúcs: egy teljes nap adminisztráció
- Csak egy kolléga ismerte a rendszert
- Papír alapú iktatás, nehéz visszakeresés
- < 1 perc automatikus feldolgozás
- 95%+ pontosság, gépi konzisztencia
- Hónap végi csúcs: 30 perc felügyelt feldolgozás
- Bárki tudja használni — feltölt és kész
- Digitális nyilvántartás, azonnali keresés
Dokumentum feltöltés és feldolgozás
| Dokumentum | Típus | Kiállító | Összeg | Státusz |
|---|---|---|---|---|
| SZ-2026/0847 | Anyagszámla | Tüzép Kft. | 847 200 Ft | ✅ Feldolgozva |
| TI-2026/023 | Teljesítési ig. | Beton Mix Kft. | 2 340 000 Ft | ✅ Feldolgozva |
| SZ-2026/0848 | Alvállalkozói | Villszer Bt. | 456 000 Ft | ⚠️ Ellenőrzés |
| SZ-2026/0849 | Bérleti díj | Daru Rent Kft. | 180 000 Ft | ✅ Feldolgozva |
A sárga jelölés azt mutatja, hogy a rendszer bizonytalan az alvállalkozói számla egy tételében — egy kattintással ellenőrizhető és jóváhagyható.
Az eredmény számokban#
| Metrika | Korábban | Most |
|---|---|---|
| Feldolgozási idő/dokumentum | 5-10 perc | < 1 perc |
| Adatbeviteli hibák/hó | 4-5 | < 1 (gépi jelöléssel) |
| Hónap végi adminisztráció | ~8 óra | ~30 perc |
| Visszakeresési idő | 5-15 perc (mappák) | < 10 másodperc (keresés) |
| Felismerési pontosság | — | 95%+ |
"A számlákat korábban kézzel vittük be. Most feltöltöm a PDF-et és kész. Hihetetlen, mennyit egyszerűsödött."
Hogyan alkalmazd a saját cégedben#
Az AI OCR technológia bármilyen iparágban alkalmazható, ahol rendszeresen kell dokumentumokat feldolgozni. A lényeg nem az iparág, hanem a minta: ha ismétlődően, hasonló struktúrájú dokumentumokból kell adatokat kinyerni és rögzíteni, akkor az AI OCR szinte biztosan megéri.
Néhány konkrét példa, ahol ügyfeleink már alkalmazzák vagy tervezik:
- Könyvelő irodák: bejövő számlák automatikus feldolgozása és könyvelési rendszerbe töltése — különösen hatékony, ha több ügyfél számláit kezeled, akik mind más számlázó programot használnak
- Logisztikai cégek: fuvarlevek, CMR-ek, vámáru nyilatkozatok feldolgozása — a fuvarozási dokumentumok többnyelvűsége különösen jó példa arra, ahol az AI OCR felülmúlja a hagyományos megoldásokat
- Egészségügy: leletek, zárójelentések digitalizálása és rendszerezése — itt a pontosság kritikus, és az AI jelölőrendszere biztosítja, hogy egyetlen adat se csússzon át ellenőrizetlenül
- Kereskedelem: beszállítói számlák, szállítólevelek automatikus iktatása — webshopok és nagykereskedők esetében a napi dokumentumszám könnyen elérheti a 20-30-at
A kulcs: nem kell tökéletesnek lennie. Ha a rendszer az esetek 95%-ában pontos, és a maradék 5%-ot megjelöli ellenőrzésre, már óriási időt spóroltál. A legfontosabb szempont, hogy a rutin adatbevitelt vegye le a csapat válláról, és a munkatársak a szakmai munkájukra — legyen az építésvezetés, ügyfélkezelés vagy pénzügyi elemzés — fordíthassák az idejüket.
Hogyan érdemes elkezdeni? Első lépésként gyűjtsd össze egy hónapnyi dokumentumot — számlákat, igazolásokat, bármit, amit kézzel rögzítesz — és számold meg, hány darab van és mennyi időt töltesz velük. Ha havi 10 dokumentum felett vagy, a megtérülés szinte garantált. Ha havi 50 felett, az ROI már az első hónapban megjelenik.
Ha hasonló dokumentumfeldolgozási kihívásokkal küzdesz, foglalj egy ingyenes konzultációt — megmutatjuk, milyen megtérülésre számíthatsz a te konkrét eseted alapján.
Tech stack#
| Eszköz | Szerepe |
|---|---|
| n8n | Workflow automatizáció, a feldolgozási pipeline motorja |
| Mistral AI | OCR és dokumentum értelmezés, magyar nyelvi támogatással |
| Airtable | Központi nyilvántartás és dokumentum adatbázis |
| Cloudflare | Webes feltöltési felület hosting |