OCR locale per PDF e immagini

Questa applicazione consente di estrarre testo da immagini e PDF scansionati lavorando direttamente nel browser. Il documento viene letto sul dispositivo dell'utente e non viene caricato su un servizio esterno di OCR.

OCR locale per PDF e immagini

Guida all'utilizzo

1. Scegli uno o più documenti. Puoi caricare PDF scansionati e immagini in formato PNG, JPG, JPEG o WEBP. I documenti vengono accodati e preparati localmente nel browser. Puoi anche trascinare altri file mentre lavori: verranno aggiunti alla coda senza interrompere quelli già presenti.

Seleziona cartella documenti. Questa opzione è pensata per cartelle dense di scansioni, fascicoli esportati o gruppi di immagini da convertire. Nei browser compatibili (Chrome ed Edge aggiornati) l'app può chiederti il permesso di leggere una cartella del computer, scansionarla anche nelle sottocartelle, individuare PDF e immagini e controllare se accanto a ciascun documento esiste già un TXT OCR con lo stesso nome e la sola estensione cambiata. I PDF senza TXT vengono messi in coda da convertire; le immagini senza TXT vengono inizialmente lasciate fuori per evitare di processare automaticamente fotografie o file non testuali. Se dopo la scansione vuoi includerle, compare il pulsante Aggiungi immagini saltate; se invece nella coda ci sono immagini che non vuoi elaborare, puoi usare Rimuovi immagini. I documenti con TXT già presente vengono caricati come completati, così puoi consultarli, scaricarli o inserirli nel Markdown unico per IA. Al termine di ogni nuova conversione, se il documento proviene da una cartella selezionata, il TXT viene salvato automaticamente nella stessa posizione del file originale.

Riprocessare una cartella. Se ti accorgi che lingua, qualità OCR o trattamento immagine hanno prodotto risultati scadenti, puoi usare l'icona ↻ sulla singola riga oppure Riprocessa coda per rimettere tutti i documenti in lavorazione. In questo caso il TXT esistente non viene considerato definitivo: al completamento della nuova conversione viene riscritto con il risultato aggiornato.

2. Scegli le opzioni OCR. Le impostazioni del cruscotto si applicano a tutta la coda e restano bloccate durante l'elaborazione. La lingua regola i dati usati da Tesseract; la qualità OCR decide quanta risoluzione usare per il riconoscimento: nei PDF aumenta la definizione con cui le pagine vengono trasformate in immagine, mentre nelle foto applica automaticamente un ingrandimento analogo prima dell'OCR. Il trattamento immagine resta un tentativo utile solo su scansioni difficili. L'opzione Prova prima il testo nativo dei PDF resta separata perché non modifica l'immagine: controlla se il PDF contiene già testo selezionabile e, quando lo trova, evita un OCR più lento e meno affidabile.

3. Avvia la coda. L'elaborazione lavora sempre su un documento alla volta, in modo da non sovraccaricare memoria e processore. Mentre la coda continua puoi cliccare sulle righe per vedere l'anteprima del documento corrispondente e l'eventuale testo già riconosciuto. Puoi selezionare più righe con Shift o Ctrl/Cmd e rimuoverle insieme con Canc o con il cestino. Se la riga selezionata è anche quella in lavorazione, la sezione Documento si aggiorna in tempo reale pagina per pagina; quando scorri oltre l'anteprima, su schermi desktop compare una piccola miniatura flottante della pagina selezionata.

4. Controlla ed esporta. Terminata l'estrazione di un documento, puoi sfogliarlo con Indietro e Avanti, oppure scrivere direttamente il numero della pagina da visualizzare. A sinistra trovi l'anteprima della pagina, a destra il testo riconosciuto e modificabile. I pulsanti Copia, TXT, MD IA e PDF ricercabile agiscono sul documento selezionato; nella coda puoi scaricare i singoli risultati, scaricare tutti i TXT pronti, creare un Markdown unico per IA o scaricare i PDF con testo ricercabile.

Privacy e funzionamento locale

Il documento selezionato viene letto dal browser sul dispositivo dell'utente. Non viene caricato su un server di OCR e non viene inviato a servizi esterni per il riconoscimento del testo. Il file PHP serve soltanto a mostrare l'interfaccia: la lettura del PDF, il rendering delle pagine e l'OCR vengono eseguiti lato browser.

Al primo utilizzo può essere necessaria una connessione a Internet per scaricare le librerie JavaScript usate dall'app, i dati lingua di Tesseract.js e la libreria PDF usata per creare i PDF ricercabili. Dopo il primo caricamento, il browser può riutilizzare parte di questi file dalla cache. Questo significa che il documento resta locale, ma le componenti tecniche necessarie all'OCR possono essere recuperate dalla rete se non sono già disponibili nel browser.

PDF immagine e PDF testuali

Non tutti i PDF sono uguali. Alcuni PDF contengono già testo selezionabile: in questi casi è spesso meglio estrarre direttamente quel testo, perché il risultato è più veloce e di solito più fedele rispetto all'OCR. Per questo l'opzione Prova prima il testo nativo dei PDF è attiva di default.

Quando invece una pagina non contiene testo selezionabile, oppure ne contiene troppo poco, l'app renderizza la pagina con PDF.js come immagine e la passa a Tesseract.js per il riconoscimento ottico. Nei PDF misti può quindi accadere che alcune pagine vengano lette direttamente e altre vengano sottoposte a OCR. Questa scelta pagina per pagina riduce i tempi e limita gli errori inutili.

La qualità OCR regola la risoluzione usata prima del riconoscimento. Veloce consuma meno memoria; Normale è adatta a scansioni già buone; Alta è il compromesso consigliato; Massima può aiutare con caratteri piccoli o scansioni poco nitide, ma richiede più memoria e può rallentare molto l'elaborazione.

Il pulsante PDF ricercabile conserva le pagine del PDF originale e vi aggiunge un livello di testo invisibile ricavato dalle parole riconosciute con OCR. In questo modo il file resta visivamente uguale alla scansione, ma il testo può essere cercato, selezionato o indicizzato dai programmi compatibili. Sulle pagine che contengono già testo nativo, l'app lascia quel testo al suo posto e non aggiunge un secondo livello OCR.

Limiti dell'OCR

L'OCR non è una trascrizione garantita. La qualità dipende da risoluzione, contrasto, inclinazione della pagina, ombre, timbri, pieghe, qualità della scansione, font, colonne, tabelle e presenza di firme o annotazioni. Anche un risultato apparentemente buono può contenere errori su lettere simili, accenti, punteggiatura, spazi, importi, date, numeri di protocollo e riferimenti normativi.

Il menu Trattamento immagine è impostato su Nessuno perché i filtri possono peggiorare il riconoscimento su molte scansioni già leggibili. Contrasto forzato può aiutare con pagine grigie o sbiadite; Bianco/nero netto è un tentativo più aggressivo per scansioni molto povere. Se il risultato peggiora, ripeti l'estrazione tornando a Nessuno e Normale.

Per ottenere risultati migliori conviene partire da scansioni dritte, leggibili e con buona risoluzione. Se possibile evita fotografie storte, pagine tagliate, documenti molto compressi e immagini con forte ombra. Per documenti lunghi e pesanti può essere utile dividere il PDF in parti più piccole oppure usare una qualità OCR più bassa, così da ridurre il consumo di memoria del browser.

Prima di usare il testo in atti, comunicazioni, ricerche giuridiche, conteggi, riassunti o analisi ufficiali, rileggi sempre il risultato confrontandolo con l'anteprima della pagina originale. I punti più delicati sono nomi propri, indirizzi, codici fiscali, numeri di sentenza o protocollo, date, importi, percentuali, articoli di legge e citazioni testuali.

Uso con assistenti IA

Il pulsante MD IA crea un file Markdown pensato per essere usato con un assistente linguistico. Include i metadati del documento, una nota sui possibili errori tipici del riconoscimento automatico e il testo OCR organizzato per pagina.

Questa intestazione non corregge il documento, ma aiuta l'assistente a trattare il contenuto con prudenza. È particolarmente utile per chiedere riassunti, schemi, estrazione di punti principali, bozze di risposta o classificazioni preliminari. Resta comunque opportuno controllare manualmente il testo OCR prima di chiedere analisi delicate, soprattutto se il documento contiene informazioni personali che sarebbe opportuno eliminare.

In generale è meglio separare le fasi: prima estrai il testo, poi correggi le parti più importanti confrontandole con l'anteprima, infine usa il testo revisionato con eventuali strumenti di analisi. In questo modo riduci il rischio che un errore OCR venga interpretato come informazione corretta.

ATTENZIONE! il fatto che il testo sia stato riconosciuto localmente nel tuo browser non significa che caricarlo su un servizio online sia automaticamente sicuro. Nel momento in cui incolli o carichi il contenuto su ChatGPT, Claude, Gemini o simili, i dati possono essere conservati ed elaborati sui server del fornitore. Se il testo contiene nomi di persone, indirizzi, numeri di telefono, dati sanitari, dati bancari, riferimenti a procedimenti giudiziari, contenuti coperti da segreto professionale o qualsiasi altro dato personale o riservato, sei tu, e solo tu, che hai la responsabilità di decidere se anonimizzarli prima del caricamento, oppure se utilizzare soluzioni che garantiscano un trattamento conforme: servizi con accordo di trattamento dei dati firmato, account aziendali con clausola di non addestramento sull'input, oppure modelli ospitati su infrastrutture controllate. Questo strumento non invia nulla al tuo posto e non sostituisce il tuo giudizio professionale: il caricamento è una scelta tua e ne sei pienamente responsabile, anche ai fini della normativa sulla protezione dei dati personali e degli obblighi di riservatezza propri della tua professione.

pagina generata in 0.004 secondi in data 29 giugno 2026 (IUG:Y0-3E2812) - 1692 utenti online