Főoldal
Rólunk
Kapcsolat
Összes projekt
AI OCR

Murabau Kft. · AI dokumentumfeldolgozás

Számlák és teljesítési igazolások feldolgozása másodpercek alatt

Építőipari dokumentumok automatikus feldolgozása Mistral AI OCR-rel. Feltöltés, felismerés, iktatás. Ami korábban órákba telt, most percek alatt megvan.

95%+
felismerési pontosság
< 1 perc
feldolgozási idő
0
kézi adatbevitel

A kihívás#

A Murabau Kft. egy regionális építőipari vállalkozás, amely lakóépületek és ipari létesítmények kivitelezésével foglalkozik. Egy tipikus projektben 8-12 alvállalkozóval dolgoznak párhuzamosan — villanyszerelő, burkoló, festő, gépészeti csapat, daruzás, földmunka — és mindegyikük saját számlázási rendszert használ. Ehhez jönnek a beszállítók (építőanyag kereskedők, gépbérlők, szállítmányozók), akik szintén havi rendszerességgel küldenek dokumentumokat. Összességében a cég havi szinten 60-80 bejövő dokumentumot kezel: számlákat, teljesítési igazolásokat, szállítóleveleket és részszámla-mellékleteket.

A dokumentumok formátuma rendkívül változatos. Van, aki a Billingo-ból generál PDF-et, van, aki a Számlázz.hu-t használja, és akad olyan alvállalkozó is, aki kézzel kitöltött, beszkennelt számlát küld email mellékletként. A teljesítési igazolások még kiszámíthatatlanabbak: ezeket gyakran Word-ben vagy kézzel készítik, a formátumuk projektenként és alvállalkozónként eltér, és sokszor tartalmazzák a részletes tételes munkalapot is.

A feldolgozás korábban teljesen kézi volt. A pénzügyi munkatárs megnyitotta a dokumentumot, kikereste az adatokat — kiállító neve, adószáma, tételek, egységárak, végösszeg, fizetési határidő — majd begépelte egy Excel táblába. Egy átlagos számla feldolgozása 5-10 percet vett igénybe, de a bonyolultabb teljesítési igazolások akár 15-20 percig is tarthattak, mert azokban a munkafázisokat, készültségi fokokat és korábbi részszámlákat is egyeztetni kellett.

A valódi probléma nem is csupán az idő volt, hanem a hibák. Elgépelt adószámok, félrenézett összegek, rossz kategóriába sorolt dokumentumok, összecserélt részszámla-sorszámok. Ezek a hibák később a könyvelésben okoztak komoly fejtörést: az SZJA bevalláskor vagy egy NAV-ellenőrzés során derültek ki — a lehető legrosszabb pillanatban. Ráadásul az építőipari dokumentumok különösen összetettek: szakterületi szakkifejezések, tételes munkalapok, részszámlák és végszámlák bonyolult hierarchiája, valamint a teljesítés igazolásához kötött kifizetési feltételek mind növelik a hibázás esélyét.

iMi az AI OCR?

Az OCR (Optical Character Recognition) a szövegfelismerés technológiája: a gép "elolvassa" a dokumentumot és szöveggé alakítja. A hagyományos OCR jól működik egyszerű dokumentumoknál, de építőipari számláknál gyakran hibázik.

Az AI OCR egy lépéssel tovább megy: nem csak felismeri a szöveget, hanem érti a kontextust. Tudja, hogy az "Összesen" után következő szám az összeg, a "Határidő" után a dátum, és a "Kiállító" után a cég neve. A Mistral AI-t használtuk, mert kiválóan kezeli a magyar nyelvű dokumentumokat.

Miért pont ez a megoldás?#

Három opciót mérlegeltünk a Murabau-val közösen, és mindegyiket teszteltük egy 20 darabos mintadokumentum-csomaggal, amely vegyes formátumú számlákat és teljesítési igazolásokat tartalmazott:

  1. Hagyományos OCR szoftver — Olcsó volt, de az építőipari dokumentumok változatos formátuma, a szkennelt képek eltérő minősége és a magyar szakkifejezések miatt mindössze 60-70%-os pontossággal működött. Minden harmadik dokumentumot kézzel kellett javítani, ami alig csökkentette a munkaterheket. Nem elég.
  2. Nagy felhős OCR szolgáltatás (Google Document AI, AWS Textract) — Technológiailag pontos, de a feldolgozásonkénti költség nagy volumen esetén gyorsan felszaladt. Ezen felül a magyar nyelvi támogatás korlátozott volt: különösen az építőipari szakkifejezéseknél — zsaluzás, kötésidő, vasmennyiség — gyengébben teljesített, mint amire szükségünk volt.
  3. Mistral AI + n8n — A legjobb ár-érték arány: a Mistral kiválóan érti a magyart, az n8n-nel pedig rugalmasan testreszabható a feldolgozási logika. A Mistral modell natívan képes PDF-eket kezelni, nem igényel előzetes képkonverziót, és strukturált JSON kimenetet ad, amit az n8n workflow azonnal fel tud dolgozni.

A harmadik opciót választottuk, mert nemcsak az általános mezőket (összeg, dátum, partner) ismerte fel pontosan, hanem az építőipari specifikus tételeket — betonozás, zsaluzás, szigetelés, vasalás — is meg tudtuk tanítani a rendszernek felismerni és kategorizálni. Emellett a Mistral API-jának dokumentumonkénti költsége a többi megoldás töredéke volt, így a megtérülés egyértelmű.

A megoldás részletesen#

1

Dokumentum feltöltés — egyszerű webes felület

A felhasználó egy letisztult, egyszerű webes űrlapon keresztül tölti fel a dokumentumokat. Az űrlap mindössze két elemet tartalmaz: egy fájlválasztó mező és egy "Feltöltés" gomb — semmi felesleges, semmi ami megzavarhatná a felhasználót. A rendszer elfogad PDF-et, szkennelt képet (JPG, PNG), és közvetlenül email mellékletből kimásolt fájlokat is. Nem szükséges előzetesen átnevezni vagy konvertálni a fájlokat, a rendszer bármilyen fájlnévvel dolgozik.

Lehetőség van tömeges feltöltésre is: a hónap végén egyszerre akár 20-30 dokumentumot is fel lehet húzni drag-and-drop módszerrel, és a rendszer sorban, automatikusan feldolgozza mindet. Egy feldolgozási folyamatjelző mutatja, melyik dokumentumnál tart a rendszer, így a felhasználó valós időben követheti az állapotot. Az egész feltöltési folyamat dokumentumonként 10-15 másodpercet vesz igénybe emberi oldalon.

2

Mistral AI feldolgozás — kontextus-alapú felismerés

A feltöltés után a dokumentum a Mistral AI OCR modellhez kerül, amely nem egyszerűen karaktereket olvas — hanem megérti a dokumentum logikai szerkezetét. A modell a PDF-et vizuálisan elemzi, azonosítja a fejlécet, a tételes részt, az összesítő blokkot, majd ebből kinyeri a strukturált adatokat:

  • A kiállító nevét, címét és adószámát — bármilyen formátumban is szerepeljenek
  • A számla számát, keltét és teljesítési dátumát
  • Az összes tételt mennyiséggel, egységárral és nettó értékkel
  • A végösszeget (nettó, bruttó, ÁFA) és az alkalmazott ÁFA kulcsot
  • A fizetési határidőt és fizetési módot (átutalás, készpénz, kompenzáció)
  • Teljesítési igazolásoknál a munkafázist, készültségi fokot és a referencia részszámla sorszámát

A modell az építőipari szakkifejezésekre is fel lett készítve: zsaluzás, vasalás, betonozás, szigetelés, aljzatbeton, vízszigetelés — ezeket is pontosan felismeri és a megfelelő költségkategóriába sorolja. A kimenet minden esetben strukturált JSON, ami garantálja, hogy a következő lépésben az automatizáció zavartalanul dolgozhasson az adatokkal.

3

Automatikus iktatás — minden a helyére kerül

A kinyert JSON adatok az n8n workflow-n keresztül automatikusan bekerülnek az Airtable nyilvántartásba, ahol a rendszer több logikai lépést hajt végre. Először kategorizálja a dokumentumot típus szerint: anyagszámla, alvállalkozói díj, gépbérleti díj, szállítási költség vagy teljesítési igazolás. Ezután a kiállító adószáma alapján azonosítja a partnert — ha korábban már érkezett tőle dokumentum, automatikusan hozzárendeli; ha új partner, létrehozza a rekordot.

A rendszer a számla tételeit is elemzi és a megfelelő projekthez rendeli a költségeket. Ha a rendszer bizonytalan egy adatban — például 80% alatti konfidenciával ismerte fel az összeget vagy az adószámot —, sárgával megjelöli ellenőrzésre. A felhasználó ilyenkor egy áttekintő nézetben látja a jelölt mezőket, és egy kattintással jóváhagyja vagy javítja az adatot. A tapasztalatok szerint ez az esetek mindössze 5%-ánál fordul elő, és jellemzően szkennelt, gyengébb minőségű dokumentumoknál. Az iktatott dokumentumok azonnal kereshetők partner, összeg, dátum vagy projektnév alapján.

Előtte–utána#

Előtte
  • 5-10 perc kézi adatbevitel dokumentumonként
  • Elgépelések, rossz kategóriák — havi 4-5 hiba
  • Hónap végi csúcs: egy teljes nap adminisztráció
  • Csak egy kolléga ismerte a rendszert
  • Papír alapú iktatás, nehéz visszakeresés
Utána
  • < 1 perc automatikus feldolgozás
  • 95%+ pontosság, gépi konzisztencia
  • Hónap végi csúcs: 30 perc felügyelt feldolgozás
  • Bárki tudja használni — feltölt és kész
  • Digitális nyilvántartás, azonnali keresés
murabau-docs.makeden.hu

Dokumentum feltöltés és feldolgozás

DokumentumTípusKiállítóÖsszegStátusz
SZ-2026/0847AnyagszámlaTüzép Kft.847 200 Ft✅ Feldolgozva
TI-2026/023Teljesítési ig.Beton Mix Kft.2 340 000 Ft✅ Feldolgozva
SZ-2026/0848AlvállalkozóiVillszer Bt.456 000 Ft⚠️ Ellenőrzés
SZ-2026/0849Bérleti díjDaru Rent Kft.180 000 Ft✅ Feldolgozva

A sárga jelölés azt mutatja, hogy a rendszer bizonytalan az alvállalkozói számla egy tételében — egy kattintással ellenőrizhető és jóváhagyható.

Az eredmény számokban#

MetrikaKorábbanMost
Feldolgozási idő/dokumentum5-10 perc< 1 perc
Adatbeviteli hibák/hó4-5< 1 (gépi jelöléssel)
Hónap végi adminisztráció~8 óra~30 perc
Visszakeresési idő5-15 perc (mappák)< 10 másodperc (keresés)
Felismerési pontosság95%+

"A számlákat korábban kézzel vittük be. Most feltöltöm a PDF-et és kész. Hihetetlen, mennyit egyszerűsödött."

Hogyan alkalmazd a saját cégedben#

Nem csak építőipari cégeknek

Az AI OCR technológia bármilyen iparágban alkalmazható, ahol rendszeresen kell dokumentumokat feldolgozni. A lényeg nem az iparág, hanem a minta: ha ismétlődően, hasonló struktúrájú dokumentumokból kell adatokat kinyerni és rögzíteni, akkor az AI OCR szinte biztosan megéri.

Néhány konkrét példa, ahol ügyfeleink már alkalmazzák vagy tervezik:

  • Könyvelő irodák: bejövő számlák automatikus feldolgozása és könyvelési rendszerbe töltése — különösen hatékony, ha több ügyfél számláit kezeled, akik mind más számlázó programot használnak
  • Logisztikai cégek: fuvarlevek, CMR-ek, vámáru nyilatkozatok feldolgozása — a fuvarozási dokumentumok többnyelvűsége különösen jó példa arra, ahol az AI OCR felülmúlja a hagyományos megoldásokat
  • Egészségügy: leletek, zárójelentések digitalizálása és rendszerezése — itt a pontosság kritikus, és az AI jelölőrendszere biztosítja, hogy egyetlen adat se csússzon át ellenőrizetlenül
  • Kereskedelem: beszállítói számlák, szállítólevelek automatikus iktatása — webshopok és nagykereskedők esetében a napi dokumentumszám könnyen elérheti a 20-30-at

A kulcs: nem kell tökéletesnek lennie. Ha a rendszer az esetek 95%-ában pontos, és a maradék 5%-ot megjelöli ellenőrzésre, már óriási időt spóroltál. A legfontosabb szempont, hogy a rutin adatbevitelt vegye le a csapat válláról, és a munkatársak a szakmai munkájukra — legyen az építésvezetés, ügyfélkezelés vagy pénzügyi elemzés — fordíthassák az idejüket.

Hogyan érdemes elkezdeni? Első lépésként gyűjtsd össze egy hónapnyi dokumentumot — számlákat, igazolásokat, bármit, amit kézzel rögzítesz — és számold meg, hány darab van és mennyi időt töltesz velük. Ha havi 10 dokumentum felett vagy, a megtérülés szinte garantált. Ha havi 50 felett, az ROI már az első hónapban megjelenik.

Ha hasonló dokumentumfeldolgozási kihívásokkal küzdesz, foglalj egy ingyenes konzultációt — megmutatjuk, milyen megtérülésre számíthatsz a te konkrét eseted alapján.

Tech stack#

EszközSzerepe
n8nWorkflow automatizáció, a feldolgozási pipeline motorja
Mistral AIOCR és dokumentum értelmezés, magyar nyelvi támogatással
AirtableKözponti nyilvántartás és dokumentum adatbázis
CloudflareWebes feltöltési felület hosting
Felhasznált technológiák
n8n
Mistral AI
OCR
Airtable