Főoldal
Rólunk
Kapcsolat
Vissza a bloghoz
AI7 perc olvasás

AI OCR: hogyan lett egy építőipari cég számlázása automatikus

BK

Kovács Bence

Amikor a papírmunka több időt visz el, mint az építkezés#

Egy építőipari vállalkozás életében dokumentumok tömkelege keletkezik: bejövő számlák, kimenő számlák, teljesítési igazolások, szerződések, ajánlatok. A Murabau Kft. csapata havi szinten több tucat ilyen dokumentumot dolgozott fel kézzel. Minden számlát meg kellett nyitni, ki kellett olvasni belőle az adatokat, majd kézzel bevinni egy táblázatba.

Ez havi szinten 8-12 munkaórát emésztett fel, ráadásul hibalehetőséggel is járt. Elgépelt számlaszám, rossz összeg, hiányzó adószám. Ha építőiparban dolgozol, ismered a helyzetet: a tényleges munkavégzés helyett adminisztrációval töltöd az időt.

A Murabau vezetése végül úgy döntött, hogy erre kell lennie jobb megoldásnak.

Mi az az AI OCR, és miért más, mint a hagyományos szkenner?#

Mielőtt rátérünk a megoldásra, érdemes tisztázni, mit jelent az OCR (Optical Character Recognition, azaz optikai karakterfelismerés), és miért lett belőle mostanra igazán használható technológia.

A hagyományos OCR szoftverek (mint amilyet a szkennerhez kapsz) karakterenként próbálják felismerni a szöveget. Ez a megközelítés sablonos, merev dokumentumoknál elfogadhatóan működik, de amint a formátum változik, gondban vagy. Egy magyar építőipari számla nem úgy néz ki, mint egy német vagy angol. Minden számlázó program más elrendezést használ, más betűtípussal, más mezőnevekkel.

Az AI-alapú OCR máshogy közelíti meg a feladatot. Az AI modell nem karaktereket keres, hanem megérti a dokumentum struktúráját. Tudja, hogy a "Bruttó összeg" felirat után álló szám az összeg, még akkor is, ha más betűtípussal, más helyen, más elrendezésben szerepel. Lényegében úgy olvassa a számlát, ahogy egy ember tenné, csak sokkal gyorsabban.

iHogyan dolgozik az AI OCR?

Az AI OCR feldolgozás három lépésben történik:

  1. Vizuális felismerés: a modell "megnézi" a PDF-et, mintha egy képet nézne
  2. Kontextus-értelmezés: azonosítja a mezőket (számlaszám, összeg, dátum, partner neve stb.)
  3. Strukturált kimenet: az adatokat rendezett JSON formátumban adja vissza, amit a rendszer automatikusan tud feldolgozni

Ez a megközelítés nem függ a számla formátumától vagy elrendezésétől. Bármilyen magyar nyelvű számlát képes kezelni.

A megoldás: n8n + Mistral AI OCR#

A Murabau Kft. számára egy három komponensből álló rendszert építettünk. Az egész lényege az egyszerűség: a felhasználónak semmilyen technikai tudásra nincs szüksége.

1

PDF feltöltés egy webes űrlapon

A felhasználó megnyit egy egyszerű webes felületet (amit az n8n biztosít), kiválasztja a PDF fájlt, és megnyomja a "Feltöltés" gombot. Választhat, hogy számláról vagy teljesítési igazolásról van szó.

Ez az egyetlen lépés, amit embernek kell elvégeznie. Minden más automatikusan történik.

2

Mistral AI feldolgozza a dokumentumot

A feltöltött PDF a Mistral AI picoVision modelljéhez kerül, amely kinyeri a következő adatokat:

  • Számla száma és kiállítás dátuma
  • Kiállító neve, címe, adószáma
  • Vevő adatai (ellenőrzés céljából)
  • Tételek listája, mennyiségekkel és egységárakkal
  • Nettó, ÁFA és bruttó összeg
  • Fizetési határidő és fizetési mód
  • Teljesítési dátum

A modell a kinyert adatokat strukturált JSON formátumban adja vissza, így azok gépileg feldolgozhatóak.

3

Automatikus iktatás Airtable-ben

Az n8n workflow a JSON adatokat átveszi, és automatikusan rögzíti az Airtable nyilvántartásban. Az iktatás során a rendszer:

  • Besorolja a dokumentumot a megfelelő kategóriába (bejövő számla, kimenő számla, teljesítési igazolás)
  • Hozzárendeli a partnert (ha már szerepel a rendszerben)
  • Kitölti az összeg mezőket
  • Beállítja a fizetési határidőt
  • Ha bizonytalan egy adatban, megjelöli ellenőrzésre (sárga jelzéssel)

Az egész folyamat kevesebb mint egy percet vesz igénybe dokumentumonként. Korábban ez 5-10 perc volt, az ellenőrzéssel együtt akár 15 perc.

Miért a Mistral AI-t választottuk?#

A piacon több AI OCR megoldás is elérhető (Google Document AI, Azure Form Recognizer, OpenAI Vision). A Murabau projekthez a Mistral picoVision modelljét választottuk, és ennek konkrét okai voltak.

Magyar nyelvi támogatás. A Mistral modell kifejezetten jól teljesít magyar nyelvű dokumentumoknál. Ez nem magától értetődő: sok AI modell angolra van optimalizálva, és a magyar szövegekkel küszködik. A Mistral esetében a magyar számlák felismerési pontossága megközelíti az angol nyelvi szintet.

PDF natív feldolgozás. Nem kell a PDF-et előbb képpé konvertálni. A Mistral közvetlenül a PDF fájlból dolgozik, ami gyorsabb és pontosabb eredményt ad.

Strukturált JSON kimenet. A modell válasza nem szabad szöveg, hanem előre definiált mezőkkel rendelkező JSON objektum. Ez azt jelenti, hogy az n8n workflow azonnal tudja kezelni az adatokat, nincs szükség további szövegfeldolgozásra.

Költséghatékonyság. Dokumentumonként néhány forintba kerül a feldolgozás. Havi 50 dokumentumnál ez havi pár száz forint, szemben egy teljes munkaidős adatrögzítő bérével.

Milyen dokumentumokkal működik?

Az AI OCR nem csak számlákkal működik. Ugyanez a technológia használható:

  • Szerződések kulcs adatainak kinyeréséhez (dátumok, összegek, felek)
  • Szállítólevelek feldolgozásához
  • Ajánlatok összehasonlításához
  • Teljesítési igazolások automatikus rögzítéséhez
  • Bármilyen strukturált dokumentumhoz, amiből ismétlődően kell adatokat kinyerni

Az eredmény számokban#

SzempontKorábbanMost
Feldolgozási idő / dokumentum5-10 perckevesebb mint 1 perc
Havi adminisztrációs idő8-12 órakevesebb mint 1 óra
Adatbeviteli hibákrendszeres elgépelések95%+ pontosság
Adatrögzítés módjakézi Excel bevitelautomatikus Airtable iktatás
Dokumentumonkénti költségemberi munkaórapár forint AI feldolgozás

A Murabau csapata most a havi szinten felszabaduló 8-12 órát tényleges munkavégzésre fordítja, nem adminisztrációra.

Hogyan néz ki ez a gyakorlatban?#

Egy tipikus nap a Murabau-nál most így néz ki: a pénzügyi munkatárs megnyitja az emailt, ahol a napi 3-4 bejövő számla vár. Egymás után feltölti a PDF-eket az űrlapra, ami dokumentumonként 10-15 másodperc. Mire végez az utolsóval, az első számla adatai már bent vannak az Airtable-ben.

Ha a rendszer egy adatot bizonytalannak ítél (például a kézzel írt számláknál), sárgával jelöli. A munkatárs ezeket átnézi, szükség esetén javítja. De a dokumentumok nagy részénél nincs szükség beavatkozásra.

A rendszer ráadásul tanul: minél több dokumentumot dolgoz fel egy adott partnertől, annál pontosabban ismeri fel az adott számlaformátumot.

Kinek érdemes?#

Neked is megéri, ha...
  • Havi szinten több mint 10 dokumentumot dolgozol fel kézzel
  • Az adatrögzítés visszatérő hibaforrás a cégednél
  • A csapatod idejét fontosabb feladatokra kellene fordítani
  • Szeretnéd, hogy a dokumentumok azonnal kereshetők legyenek a nyilvántartásban

A rendszert úgy építjük, hogy bárki tudja használni. Nem kell hozzá fejlesztői tudás, nem kell semmit telepíteni, elég egy böngésző.

Tech stack#

EszközSzerepe
n8nWorkflow motor, webes űrlap, adatáramlás vezérlése
Mistral AI (picoVision)Dokumentum felismerés, adatkinyerés, JSON kimenet
AirtableAdattárolás, nyilvántartás, keresés, szűrés

Kapcsolódó cikkek#

Ha érdekel, hogyan segíthet az automatizáció a cégednél, nézd meg ezeket a cikkeket is:

Segítségre van szükséged?

Ha kérdésed van a cikkben olvasottakkal kapcsolatban, vagy szeretnéd bevezetni ezeket a megoldásokat, beszéljünk!

Ingyenes konzultáció