Toate articolele
·8 min

Procesarea automată a documentelor cu AI: cum extragi date din facturi, contracte și PDF-uri

Problema: documentele bune ascund cele mai costisitoare procese

Într-o companie medie din România, departamentul de contabilitate procesează între 200 și 2.000 de facturi pe lună. Achizițiile gestionează contracte cu zeci de furnizori. HR-ul colectează acte de identitate, certificate, CV-uri. Logistica primește avize de expediție în 5 formate diferite.

Toate aceste documente ajung ca PDF-uri, scanări, poze făcute cu telefonul sau atașamente în email. Și aproape toate sunt procesate la fel ca acum 20 de ani: cineva le deschide, citește valorile relevante și le introduce manual într-un sistem.

Calculul: 3 minute per factură × 800 de facturi/lună = 40 ore/lună doar pe introducere de date. La 30 EUR/oră cost intern, vorbim de 14.400 EUR/an — pe o singură activitate, într-un singur departament.

Vestea bună: în 2026, AI-ul rezolvă această problemă cu o acuratețe care în sfârșit e suficient de bună pentru producție.

Ce s-a schimbat în ultimii 2 ani

Procesarea automată a documentelor nu e nouă. OCR-ul există de 30 de ani. Dar până recent, sistemele "inteligente" se loveau de aceleași limite:

  • Funcționau doar pe formate fixe (template-uri rigide)
  • Se prăbușeau la documente noi sau la mici variații
  • Necesitau săptămâni de configurare pentru fiecare furnizor nou

Combinația OCR + modele large de limbaj (LLM) schimbă fundamental ecuația. Sistemele moderne pot citi un PDF pe care nu l-au mai văzut niciodată și să extragă corect CUI-ul furnizorului, valoarea netă, TVA-ul, data scadenței și liniile de produse — fără configurare prealabilă.

Cum funcționează în practică

Un pipeline modern de procesare a documentelor are 4 etape:

1. Recepția (Intake)

Documentul intră în sistem prin:

  • O cutie poștală dedicată (facturi@firma.ro)
  • Un upload manual într-un portal intern
  • O integrare cu sistemul de email sau cu un portal de furnizori
  • API către sisteme externe (ANAF, RO e-Factura)

2. Pre-procesarea

Pentru documente scanate sau fotografiate, sistemul corectează automat:

  • Rotația și înclinarea paginii
  • Calitatea imaginii (contrast, claritate)
  • Detectează limba documentului
  • Separă paginile dacă fișierul conține mai multe documente

3. Extragerea inteligentă

Aici intervine combinația OCR + LLM:

  • OCR-ul extrage textul brut din imagine
  • LLM-ul înțelege structura semantică: "acesta este un câmp 'CUI', valoarea este RO12345678"
  • Modelul vede contextul — știe că numărul de lângă "TOTAL" este suma finală, nu un cod intern

Spre deosebire de OCR-ul tradițional, sistemul nu are nevoie să știe în avans unde e poziționat fiecare câmp. Înțelege documentul.

4. Validarea și integrarea

Datele extrase sunt:

  • Validate prin reguli de business (CUI valid, sumă pozitivă, dată plauzibilă)
  • Verificate împotriva bazelor de date existente (este acest furnizor în sistemul ERP?)
  • Marcate pentru revizie umană dacă încrederea modelului e sub un prag (ex: < 95%)
  • Introduse automat în ERP, sistem de facturare sau contabilitate

Acuratețea reală: ce să aștepți

Lucrând cu acest tip de sistem la NEXVA SYSTEM, iată cifrele pe care le vedem în producție:

| Tip de document | Acuratețe automată | Necesită revizie |

|----------------|--------------------|--------------------|

| Facturi standard (PDF nativ) | 97-99% | 1-3% |

| Facturi scanate / fotografiate | 88-94% | 6-12% |

| Contracte cu clauze specifice | 80-90% | 10-20% |

| Avize de expediție diverse | 92-96% | 4-8% |

| Bonuri de casă / chitanțe | 85-92% | 8-15% |

Important: acuratețea de 95% nu înseamnă "5% greșit". Înseamnă că modelul însuși semnalează cele 5% pe care nu le procesează cu încredere. Acestea ajung la un om pentru verificare. Restul de 95% intră direct în sistem.

Studiu de caz: distribuitor cu 1.200 de facturi/lună

Un client din distribuția B2B avea următoarea situație înainte de implementare:

  • 1.200 de facturi primite lunar de la 350 de furnizori diferiți
  • 2 angajați full-time pe introducere de date
  • 3-5 zile de la primirea facturii până la înregistrare în SAGA
  • Rate de eroare de 1.5-2% (greșeli de tastare)
  • Pierderi de discount pentru plată rapidă din cauza întârzierilor

Ce am implementat:

  • Cutie poștală dedicată conectată la pipeline-ul AI
  • Extragere automată cu validare contra catalogului de furnizori
  • Integrare cu SAGA pentru înregistrare directă
  • Dashboard de revizie pentru excepții (5-8% din facturi)
  • Alerte automate pentru anomalii (sumă neobișnuit de mare, furnizor nou)

Rezultatele după 4 luni:

  • 92% din facturi procesate complet automat
  • Timp mediu de procesare: de la 3-5 zile → 4 ore
  • Cei 2 angajați au fost realocati pe reconciliere și analiză furnizori (muncă cu valoare adăugată)
  • Recuperate 14.000 EUR/an în discount-uri pentru plată rapidă
  • ROI complet în 7 luni

Unde dă greș AI-ul (și ce să faci)

E important să fii realist: AI-ul nu rezolvă totul. Vezi unde se complică lucrurile:

Documente foarte slabe calitativ

Fotografie făcută în lumină slabă, factură mototolită, scanare la 100 DPI. Sistemul detectează singur calitatea joasă și cere o nouă copie sau marchează pentru procesare manuală.

Limbaj juridic ambiguu

Contractele cu clauze complexe sau redactate neglijent pot fi interpretate greșit. Pentru contracte, recomandăm extragere asistată (AI propune, om aprobă), nu automată completă.

Documente cu mai multe scopuri

Un PDF care conține atât o factură, cât și un proces-verbal de recepție și un certificat de conformitate poate confunda modelul. Soluția: separarea documentelor în pre-procesare.

Câmpuri rar întâlnite

Dacă ai nevoie de un câmp specific (ex: "număr de lot pentru produse farmaceutice"), modelul generic nu îl caută. Aici e nevoie de fine-tuning sau de o regulă suplimentară.

Costul real al implementării

Pentru o companie care procesează 500-2.000 documente/lună:

| Componentă | Cost |

|-----------|------|

| Setup pipeline (intake + extract + validate) | 8.000-14.000 EUR |

| Integrare cu ERP/contabilitate | 3.000-6.000 EUR |

| Interfață de revizie umană | 2.000-4.000 EUR |

| Total inițial | 13.000-24.000 EUR |

| Costuri lunare AI (per 1.000 docs) | 50-150 EUR |

| Mentenanță și ajustări | 300-600 EUR/lună |

Compară cu costul muncii manuale: 1 angajat full-time pe introducere date = 25.000-35.000 EUR/an în costuri totale (salariu + taxe + management).

Punctul de echilibru: pentru companii care procesează peste 400-500 documente/lună, investiția se amortizează în 6-12 luni.

Cum începi practic

1. Identifică cel mai mare volum: care tip de document consumă cele mai multe ore? Pentru majoritatea companiilor: facturi de furnizori.

2. Cuantifică: câte documente pe lună × câte minute per document = câte ore lunar?

3. Pilot scurt: implementează pe un singur tip de document, cu 2-3 furnizori, timp de 4-6 săptămâni

4. Măsoară acuratețea reală: nu pe benchmark-uri, ci pe documentele tale specifice

5. Extinde gradual: adaugă tipuri noi de documente după ce primul funcționează stabil

Concluzie

Procesarea automată a documentelor cu AI nu mai este o tehnologie experimentală — este un instrument productiv care, implementat corect, eliberează zeci de ore pe săptămână în orice companie cu volum mediu de back-office.

Cheia nu este să cauți "AI-ul cu cea mai mare acuratețe pe benchmark". Cheia este să construiești un pipeline robust: intake fiabil, extragere validată, integrare cu sistemele existente și un proces clar pentru cazurile în care AI-ul nu e suficient de sigur.

Vrei să evaluăm împreună unde ar avea cel mai mare impact procesarea automată în compania ta? Programează o consultanță gratuită.

Vrei să discutăm despre automatizarea proceselor tale?

Programează o consultanță