Htio sam digitalne fotografije knjige prebaciti u takav format koji mi omogućuje precizno pretraživanje teksta. To sam postigao u tri koraka:
1) konverzija .jpg u .pdf, uz prethodnu instalaciju Imagemagick
Kod: Označi sve
sudo apt install imagemagick-6.q16
mogrify -format pdf 1.jpg 2.jpg
itd; svaka digitalna fotografija snimljena je u formatu .jpg, imenovao sam njihove brojeve od 1 do n, po želji.
2) spajanje zasebnih PDF-ova u jedan
3) omogućavanje pretraživanja riječi u tom PDF-u, uz prethodnu instalaciju OCR aplikacije
Kod: Označi sve
sudo apt install ocrmypdf
ocrmypdf output.pdf out.pdf
Zadnja inačica, ovdje označena kao out.pdf, željeni je rezultat. Knjiga snimljena mobitelom u .jpg formatu postaje pretraživi .pdf. Nije idealno, tu i tamo pobjegne poneki redak, ali snimao sam na brzinu i scanner bi sigurno donio bolji rezultat uslijed veće kvalitete snimka. Isprobao sam ovaj postupak i sa snimcima učinjenima digitalnim fotoaparatom prije dvadesetak godina i uspjelo je jednako dobro.
Meni je dobro poslužilo, uspije li još nekome, tim bolje. Pozdrav!