konverzija .jpg u .pdf uz pretragu pojmova

Rasprave u vezi Linux aplikacija.

Moderator/ica: Moderatori/ce

Odgovori
Avatar
rudar
Postovi: 1153
Pridružen/a: 27 ruj 2012, 12:39
Spol: M
OS: Kubuntu 24.04, Debian 12

konverzija .jpg u .pdf uz pretragu pojmova

Post Postao/la rudar »

Htio sam digitalne fotografije knjige prebaciti u takav format koji mi omogućuje precizno pretraživanje teksta. To sam postigao u tri koraka:

1) konverzija .jpg u .pdf, uz prethodnu instalaciju Imagemagick

Kod: Označi sve

sudo apt install imagemagick-6.q16
mogrify -format pdf 1.jpg 2.jpg
itd; svaka digitalna fotografija snimljena je u formatu .jpg, imenovao sam njihove brojeve od 1 do n, po želji.

2) spajanje zasebnih PDF-ova u jedan

Kod: Označi sve

pdfunite 1.pdf 2.pdf output.pdf
3) omogućavanje pretraživanja riječi u tom PDF-u, uz prethodnu instalaciju OCR aplikacije

Kod: Označi sve

sudo apt install ocrmypdf
ocrmypdf output.pdf out.pdf
Zadnja inačica, ovdje označena kao out.pdf, željeni je rezultat. Knjiga snimljena mobitelom u .jpg formatu postaje pretraživi .pdf. Nije idealno, tu i tamo pobjegne poneki redak, ali snimao sam na brzinu i scanner bi sigurno donio bolji rezultat uslijed veće kvalitete snimka. Isprobao sam ovaj postupak i sa snimcima učinjenima digitalnim fotoaparatom prije dvadesetak godina i uspjelo je jednako dobro.

Meni je dobro poslužilo, uspije li još nekome, tim bolje. Pozdrav!
Avatar
Spider
Postovi: 184
Pridružen/a: 15 stu 2011, 09:00
OS: Debian 11

Re: konverzija .jpg u .pdf uz pretragu pojmova

Post Postao/la Spider »

Za takvu svrhu a i arhivu instalirao sam si paperless-ngx. Super stvar. Radi OCR, pretražuje sve dokumente kada tražiš neku riječ.
Odgovori