Afr - Tutorijal Za Skeniranje Knjiga 2.dio

  • Uploaded by: Davor Veseljko
  • 0
  • 0
  • February 2021
  • PDF

This document was uploaded by user and they confirmed that they have the permission to share it. If you are author or own the copyright of this book, please report to us by using this DMCA report form. Report DMCA


Overview

Download & View Afr - Tutorijal Za Skeniranje Knjiga 2.dio as PDF for free.

More details

  • Words: 3,232
  • Pages: 52
Loading documents preview...
ABBYY FineReader - Scan Tutorial – Vol.2 - (Advanced)

-PozdravNAKNADNO UBACIVANJE ISTE ILI MODIFICIRANE NASLOVNE STRANE



NAPOMENA, za ovo vam je potreban vanjski program za obradu slika, ako ga nemate ili neznate ili neželite da se bakćete sa takvim stvarima, ne čitajte dalje ovaj text, ono što ste naučili do sada je više nego dovoljno



Isto tako, ako niste skinuli "vol.1" , punog naziva "AFR-Tutorijal za skeniranje knjiga", ovo vam neće biti od neke velike koristi.



Poslužiću se onim batchem "orlov dar" , nije skenirana cijela knjiga, neko samo 6 stranica, ali će poslužiti svrsi.



Pretpostavimo da je prvobitna upotreba CROP alatke mogla poprilično usrat naslovnicu AKO smo ju skenirali u AFR-u (odsjeći dio slova naslova ili bitne detalje) [ kao što znamo? Nismo tada skenirali naslovnicu (korice) knjige ...]



Ja ću se ovdje kao vanjskim programom za obradu slika postužiti Corel-om, a vi naravno svojim, koji već jest, AdobePhoto-ovo Photo-ono itd



Najprije ću otići u "batch folder" "orlovdar", gdje sam spremio batch (kao što znamo, svi imagesi su tamo već croppirani) i pogledati koja je veličina, izražena u pixelima, croppiranih imagesa. Za tu svrhu je dovoljno pokazivač miša dovesti iznad bilo kojeg " xxxx.TIF " imagea/slike (kažem svejedno iznad kojeg jer su SVI jednako kropirani i imaju iste mjere). Tamo NA DVA mjesta dobijemo nabrzak informaciju o veličini slike

SAD kad smo dobili i zapamtili tu informaciju pokrećemo program za obradu slika i iz njega ( Corela, AdobePhotosa ili koji već jest) POZIVAMO skener i skeniramo naslovnicu ... VAŽNO: Rezolucija treba biti ista kao i ona u kojoj smo skenirali tu knjigu; u većini slučajeva to će biti 300 dpi i naravno postavke skenera promijenjene u COLOR mod, osim ako baš slika nije crno bijela, tada bi ostavili "Grayscale" mod .. EVO nam skenirane slike u Corel–u (sl.62) :

- ove rubove najbrže ću sredit sa CROP alatkom, iako ima još bar 5 načina na koji se to može srediti ...



Kada je slika croppirana, idemo na IMAGE >>> RESAMPLE , čime ćemo slici promijeniti dimenzije, i to točno onakve kakve imaju sve ostale slike u batchu "orlovdar", a znamo od prije (sl.61) da su to 1079 x 1802 pixela.



Da bi uspjeli ukucati točno TE dimenzije OPCIJA "Maintain Aspect Ratio" MORA biti isključena !

NAKON resampla na onu našu 1079 x 1802 dimenziju, možemo još prepravljati sliku, npr ako je oštećena, išarana ili slično, evo ja ću maknuti onaj kvadrat u dnu slike desno sa oznakom "Drugo izdanje" , i kad konačno to sve završimo, spremimo sliku obavezno kao " .TIF " image i to recimo (da posle ne tražimo gdje je) u onaj batch folder "orlovdar", pod nekim bezveznim imenom, npr "xyz.tif "



Program AFR trebao bi biti ugašen sada kada izvodimo ovu makinaciju

SADA pokrenimo AFR ; Tamo već postoji (textualna) naslovna stranica koju smo napravili u prošlom tutorijalu, i u folderu "orlovdar" ona je pohranjena pod imenom " 0001.tif " Zato ćemo mi, da bi oslobodili to mjesto, izvesti jednu renumeraciju svih slika tako da prva slika u cijelom batchu nosi broj "2"

Sada sa CTRL+O ili preko file > Open Image idemo otvoriti onu našu xyz naslovnicu ..

Kada ju AFR otvori, DODIJELITI će joj, zadnji, najviši redni broj , stoga će se ona nalaziti NA DNU Batch prozora , no to će Vam odmah i biti predočeno ...

Npr ako je knjiga dotada imala 250 stranica, naša novootvorena xyz naslovnica imati će broj 251

U NAŠEM SLUČAJU, pošto ja nisam skenirao cijelu knjigu, nego nekoliko stranica, za potrebe tutorijala, naša xyz.tif naslovnica dobila je tako broj "7"

DA bi NASLOVNICA izbila na prvo mjesto našeg Batch-a, treba ju Renumerirati, odnosno dodijeliti joj broj 1 a prema onome otprije, ( slika 60 B ) znamo da imamo upražnjeno mjesto na poziciji 1 . . .

Kada je konačno slika dobila poziciju broj 1 , imamo više mogućnosti za njezino prepoznavanje Početi ću sa najlakšom: Uzmemo alatku "Draw Picture block" i CIJELU sliku (stvarno cijelu, potrudite se da crveni okvir rastegnete do maksimuma, jer inače zna ostati koji milimetar, što kasnije izgleda neestetski) u Image prozoru uokvirimo sa njome, te stisnemo CTRL+R

Stisnemo CTRL+R i dobijemo :

.

Spremiću sada SAMO PRVE dvije stranice knjige u PDF da vidimo kako je ispalo ..

---------------------------------------------------------------------------SADA ću opisati još jedan način na koji možemo u AFR-u urediti naslovnicu, i uštediti stotinjak kilobajta. Kao što se vidi, naslovnica se može podijeliti na tri dijela 1.) u kojem piše "Karlos Kastaneda, 2.) gdje je slika i 3.) gdje piše "ORLOV DAR" Shodno tome dio br.1 ćemo uokviriti maximalno TEXT Blokom (zeleni kvadrat), br.2 sa Slikovnim blokom (crveni kvadrat) i dio br.3 opet TextBlokom ... i to tako da se granice jedva primjetno preklapaju... U ovom slučaju, koji mi je baš dobrodošao (zbog nepravilnosti), AFR nije bio baš uspješan, tj. Napravio je sranje

U textualnom prozoru ja ću uspjeti iza slova V u riječi "ORLOV" nakon "ENTER" komande dobiti novi red i upisati riječ koja nedostaje, tj. Riječ "DAR" i sve će štimati kako treba, Međutim u bloku na vrhu, jedino mogu popraviti "Rastanjeđa" u "Kastaneda", i ma koliko se trudio, nemogu doći na vrh iznad te riječi da upišem riječ "Karlos". (neznam zašto je to tako, no TAKO JE) Zato ćemo se, kao i obično, poslužiti malim trikom Najprije ćemo u Image prozoru kliknut u onaj textualni blok na vrhu i stisnut DEL. (ili desni klik > Delete Block), čime ćemo se riješiti glupo neprepoznatog text blocka. ZATIM ćemo odmah iza riječi "Karlos" iza slova "s", u praznom prostoru, gdje je samo smeđa podloga, nacrtati jedan mali textualni blok

Te DesniKlik na taj novostvoreni TextBlock > Read Block (sl.73)

Zatim taj TextBlock mirne duše razvučemo na veličinu cijelog gornjeg područja, gdje je prvi puta bio, kada AFR nije pročitao text kako treba (sl.74)

Sada možemo na miru upisati u to područje u Text prozoru, što god treba, u ovom slučaju "Karlos Kastaneda", vodeći računa da po DEFAULTU upisivanje texta ide Times New Romanom veličine slova "10" i crnom bojom što ćemo morati promijeniti u npr. "40" da bi bili što vjerniji originalu

Desnim klikom na ta selektirana slova odaberemo "Character properties" i promijenimo boju slova u npr. Bijelu kasnije ćemo to isto ( promijeniti boju u bijelo ) napraviti i sa donjim textom ( "ORLOV DAR" ) tako da budu iste boje.

Prvo , Promijenimo boju texta "Karlos Kastaneda" u npr. Bijelu ( slika 78 )

Drugo, sada to isto napravimo sa textom "ORLOV DAR"

Nakon šta smo i to promijenili, spremimo to u PDF, da vidimo kako ispada i dali je OK

Sve je OK, slika je slika , a Text je Text, i kao što vidimo dade se selektirati kao text.

HTIO bih još napomenuti da bismo dobili boju texta i boju podloge ispod texta potrebno je u opcijama za spremanje PDF-a pod TOOLS > OPTIONS > SAVE > FORMAT SETTINGS > PDF označiti/čvrkati opciju "Retain text and background colors" to znači da će kreirani PDF iz AFR-a zadržati boju slova i pozadine. Još da dodam da je razlika debljine ovako spremljene naslovnice – 50% manja nego one kada smo cijelu stranicu uokvirili SlikovnimBlokom. NARAVNO nemaju sve naslovnice baš tako genijalno raspoređen text i sliku .. i ponekada ćemo baš morati cijeli image uokviriti SlikovnimBlokom ...

###########################################################

UBACIVANJE POTPUNO DRUGAČIJE NASLOVNICE I ovdje ću se poslužiti istim Batchem "orlovdar" iz prethodnog primjera U tu svrhu u tom batchu DELETIRAO sam staru naslovnicu sa onim mačevaocima/mačevalicama/mačevaočice (dovraga, kako se kaže kad se dve žene mačevaju?) - znači ostalo mi je prazno mjesto br.1 u BATCH prozoru Najprije ću u Corel-u kreirati novu sliku

Primijetite da sam stavio one mjere od prije kako bi se podudarale sa ostalim slikama u Batchu "orlovdar"(svaka knjiga koju obradite imati će drukčije mjere) I na taj new image ću presanjkati/ubaciti neku sliku po želji

I kada je to gotovo, spremim sliku u folder "orlovdar" pod imenom, npr. "abc.tif" Zatim u AFR-u >File>Open PDF/Image > potražim sliku abc.tif i otvorim ju.Ona se postavi, naravno na kraju Batch prozora, pod brojem 7.Otprije znamo da sam oslobodio mjesto broj 1, pa zato sada idem desnim klikom na slikicu 7 u Batch prozoru, Renumber Pages ("Selected Pages" ! ) i dam joj broj 1 ( ma sve je isto kao i u prošlom primjeru kada sam ubacivao originalnu naslovnicu...)

I sada mi preostaje da na jedan od ona dva načina obilježim Image u Image prozoru : ILI da sve uokvirim SlikovnimBlokom, ili, što je ovdje zgodno, Text-Slika-Text (vrh-sredina-dno), evo napraviću to ovom, drugom metodom (kombinacijom texta i slike)

Vidimo da je AFR otprve sve pročitao i namjestio kako treba; Sada ću to za kontrolu i za potrebe ovog tutorijala, spremit u PDF (samo prve dve strane), dakle CTRL+S :

KO' ŽIVA, JEL'DA? ( orlovica orlica )

Napomena: ako baš morate promijeniti naslovnicu, onda neka to bude nešto što ima veze sa naslovom knjige :p

A sada nešto o obradi ZADNJE STRANICE, premda biste iz ovoga do sada rečenoga, već trebali pretpostavljati kako će to ići Za ovu priliku, takođe ću se poslužiti knjigom "orlov dar" Jedina razlika je što ću sken izvesti direktno iz AFR-a, a ne iz Corel-a, slučajno zato što ZNAM kakva je zadnja stranica te knjige i da CROP alatkom neću ništa izgubiti, osim malog dijela texta na dnu stranice koji označava izdavača knjige, A TO BIH i onako izbrisao kod bilo koje knjige :p

Croppiranje ĆU POČETI ne sa njom, nego sa stranicom ispred, str.6, i tamo rastegnuti (ako već nije) ono Croppodručje maximalno do svih rubova, ČIME SAM AUTOMATSKI dobio mjeru crop-područja svih stranica knjige (znamo od prije da su sve croppirane jednako)

Nakon toga, ja želim da mi ta stranica bude druga po redu, dakle odmah iza naslovnice. Znači trebati će imati broj 2 – a on je već zauzet. Izvešću mali trik sa renumeracijom: LijeviKlik u BATCH prozoru negdje na područje između dvije slikice, zatim (oslobodi klik) stisnuti CTRL+A čime ćemo označiti SVE stranice, A ONDA – ponovno stisnuti CTRL i , DRŽEĆI CTRL stisnut, kliknut slikicu 1 , čime ju ODSELEKTIRAM , a sve ostale ostaju selektirane. Zatim, desnim Klikom, po npr. Prvoj od tih selektiranih stranica (br.2) >Renumber Pages> iskočit će mali prozorčić i tamo umjesto DVOJKE stavimo TROJKU, i izvršimo renumeraciju. Sada ćemo imati (ako je sve OK) stranice 1-3-4-5-6-7-8, a mjesto br.2 je slobodno. Naša stranica (sl.92) sada ima broj 8 (još uvijek je zadnja)

Najprije Lijevim klikom po njoj, da ostale stranice odselektiramo, a zatim i Desnim klikom po njoj (po str.8) > Renumber Pages > Selected Pages > ubacimo umjestobr.8 – broj 2.

Sada ćemo probati sa CTRL+R pročitati stranicu ...

Vidimo, u desnom dijelu slike kako je nakon rastezanja TextBlocka, CIJELA text stranica u pripadajućoj boji..

NO, POŠTO ZNAM DA JE NASLOVNICA U CRNOJ BOJI, POGOTOVO NA RUBOVIMA SA KOJIMA ĆE GRANIČITI SA OVOM SLIKOM, PROMIJENITI ĆU BOJU POZADINE U CRNO ... Desni Klik u Text windowu > Character Properties .... Kada sam to napravio, da vidim pravi rezultat, spremiti ću prve TRI stranice u PDF Najprije sa zadržanim CTRLom , mišem označim prve tri slikice u Batch prozoru, zatim CTRL+S ... ... i HOP.. iskoči PDF ... :

Pogledajmo sada prelaz između druge i treće stranice :

Pogledajmo za kraj, još i prelaz između textualnih stranica ...

..nema glupih i nepotrebnih ogromnih bijelih rubova ...

EVO - da kažem/ponovim još i jednu jaaaako bitnu stvar, koja utiče na debljinu konačnog PDF dokumenta koji ćemo kreirati. Otvorimo u AFR-u > Tools > Options > Save > Format Settingz > PDF >>> rubrika "Quality "

Cijelo ovo vrijeme, a i inače, koristim opciju MEDIUM. Ona daje optimum kvalitete i debljine završnog dokumenta. Opcija LOW dati će nenosno loše Slike u PDF dokumentu, a opcija HIGH, dati će slike gotovo neprimjetno bolje nego MEDIUM, ali će zato ENORMNO povećati debljinu fajla ! Molim Vas držite tu postavku na MEDIUM-u ! ( slika može biti mutna zato što je mutna i u knjizi, a ne zbog Medium opcije! )

OCR PDF-a Sada ćemo se pozabaviti slučajem kada imamo da je netko skenirao knjigu ili neki dokumenat ( NE sa AFR-om) čime je dobio SLIKE stranica knjige i kao SLIKE ih spremio u PDF. ( Kada se takav PDF otvori, na njemu se nemože selektirati text, jer je u PDF-u pohranjena SLIKA a ne TEXT - nije izvršen "OCR" (optical character recognizing) tj. Optičko prepoznavanje texta [sa slike] čemu AFR i služi) OBIČNO su takvi PDF-ovi debeli 30 -100 Mb jer su skenirani u "sivoj skali" (grayscale) ili koloru ili nekim kombiniranim prilagođenim postavkama ----------------------------------------------------------------------------------VAŽNO: IZUZETAK u takvom načinu rada čine oni rijetki, koji imaju malo više znanja o tome, pa kada skeniraju knjigu (ne radeći OCR) u postavkama stave da se skenira u crno-bijelom (C/B) modu, tj. u postavkama skenera (na engleskom) –" Black and White" (B&W) ili "Newspaper" modu, čime se dobije najmanja moguća debljina slike. - { dodatno smanjenje može se postići smanjivanjem rezolucije na manje od 300 dpi, ali to je dvosjekli mač, jer u konačnici može ispasti da ćemo pokvariti vid čitajući takav rad } Taj je modus idealan za knjige koje ne sadrže fotografije, no ako ih ima, a želimo ih, moraćemo promijeniti modus skeniranja barem u "Grayscale". Mudrost se sastoji u tome, da, npr. Ako knjiga ima 200 stranica, od toga njih 50 sadrži fotografije, NEMORAMO svih 200 stranica skenirati u "GrayScale" modu, nego onih 150 stranica (bez texta) u C/B modu, a samo onih 50 stranica (sa slikama) u "Grayscale" modu. Tako napravljen PDF nije jako debeo, dakle nema 30 – 100 Mb, nego otprilike 2 - 10 Mb, zavisno koliko je bilo stranica i fotografija u knjizi. ----------------------------------------------------------------------------------VAŽNO: [ eto, kad spominjem postavke skenera, iako je o tome bilo riječ u prvom tutorijalu]- Kada stavljamo postavke skenera za AFR, onda nam je Grayscale idealan oblik, jer, pogotovo kod starih knjiga, AFR će gotovu svaku točkicu prašine u C/B modu (koja sada neće biti siva, nego crna, ili je neće biti) nastojati prepoznati kao neko malo slovo. ----------------------------------------------------------------------------------S obzirom da se mi bavimo OCR-om, vratimo se na temu. Otvoriću jedan takav PDF i izvršiti OCR VAŽNO: preduvjet uspješnog rada je da su sve slike u tom PDF-u skenirane rezolucijom ne manjom od 300 dpi. Otvoriću Sitchinovu knjigu "Divine Encounters" (na engleskom je) koja ima 40,5 Mb , pohranjena je kao slikovni PDF. Pokrenuo sam AFR, i NAJPRIJE spremio taj budući Batch ( > File > Save Batch As > TamoGdjeMiJeZgodno ) ZATIM sa CTRL+O ( ili >File>Open PDF/Image> "tražim i otvaram pdf sitchinove knjige" ) Učitavanje traje koju minutu ... na kraju kada se otvori vidim zašto je toliko trajalo – ima 396 stranica. Na sličicama u Batch prozoru vidim žute trokutiće upozorenja, kad prislonim miša iznad njih, vidim o čemu se radi

To upozorenje znači da AFR nije splittao/podijelio sliku na dva dijela, a to je ZATO JER SAM ZABORAVIO u postavkama isključiti opciju "Split dual pages" PRIJE POČETKA RADA. S obzirom da to nikako neće utjecati na daljni rad, praviću se da to ne vidim. Sada ću malo prevrtiti sve sličice u Batch prozoru da steknem predodžbu o tome ima li u knjizi slika, kako su raspoređene, kako je text prosječno raspoređen, itd. Cilje je utvrditi koliko maximalno možemo croppirati stranicu, tj. Da se ne desi da počnemo croppiranje,a ono •

naleti stranica na kojoj text ili slika izlazi iz okvira kojim je croppirano prethodnih 234 stranice ...

PRIJE nego što izgubimo 30-60 minuta na croppiranje cijele knjige, izvešćemo jedan "Reading" CTRL+R, za probu, npr. One stranice 192, da se ne bi desilo da je kvaliteta skeniranja TE knjige tako loša da imamo milion grešaka po stranici tako da NA VRIJEME odustanemo od čitavog posla . . .

Vidimo da ima svega par greški, i to je prihvatljivo . . . možemo nastaviti rad sa cijelom knjigom Dalje znate kako ide, pa ću zaključiti ovaj slučaj. -----------------------------------------------------------------------------------

TABELARNI BLOKOVI - ( Table Blocks ) Neki puta će u knjizi biti tabela sa nekim vrijednostima. AFR će ju najčešće i prepoznati kao tablicu, te će tako biti i označena u IMAGE prozoru (nakon "Readinga"). Prpajući po tim ćelijama te table, u image prozoru AFR-a , desnim klikovima, pojavljivaće Vam se opcije koje možete skužit i sami, pa se ja neću više upuštati u objašnjenja (mogućnosti kao spajanje dviju ili više ćelija u jednu, razdvajanje jedne na više ćelija, proširivanje, smanjivanje i sl. ) Sad nemam baš nijednu knjigu sa tablicom, no slučajno znam da je u prethodnoj Sitchinovoj knjizi, Sadržaj zabunom pročitan kao tabela - ŠTO NE ZNAČI da je to uticalo na ispravnost Texta. Evo tog primjera: (Tabelarni blokovi uvijek su ucrtani PLAVOM bojom )

Ovaj primjer je ko naručen, jer je stranicu sadržaja preporučivo obraditi kao tablicu. Zato jer se zna dogoditi da kada mijenjamo brojeve stranica, da se iz čista mira (ako je sve u TextBlock tipu – zeleni kvadrat) onda riječ, tj rečenica u istom redu u kojem je broj koji smo promijenili – neprirodno razvuče. Sada ću ovo spremiti kao PDF, da vidite kako će ispasti

Vidimo da nema problema, isto tako primijetite da nema vidljivih rubova tabele. RUBOVI Tabele biti će vidljivi AKO su vidljivi i u originalnom dokumentu Pogledajmo originalnu stranicu u AFR-u, vidićemo da i nije imala rubove (tablicu) ucrtanu : ( sl.108 ) [ zato sam i rekao na početku da je AFR tu stranicu ZABUNOM prepoznao kao tablu ]

Sada ću izmislit neku "pravu" tablicu (u Corel-u) i otvoriti stranicu u AFR-u, za potrebe ovog tutorijala :

Kako vidimo, nakon CRTL+R, imamo tablicu u text prozoru,

Sada ću je spremiti u PDF da vidite rezultat, tj. Da će se tablica sa rubovima vidjeti, jer su prisutni i u originalu:

-----------------------------------------------------------------------------------

Vratiću se sada na pojavu koju sam maločas spominjao, koja se javlja pri obradi stranice sa SADRŽAJEM. Zna se dogoditi da kada mijenjamo brojeve u sadržaju [kako bi stvarni brojevi stranica, koji su se promijenili našim deletiranjima stranica – o čemu je već bilo riječ došli u sadržaj] da se iz čista mira riječ, tj rečenica u istom redu u kojem je broj koji smo promijenili – neprirodno razvuče.

S obzirom da slika govori više nego 'iljadu riječi :

EVO, NIŠTA NISAM MIJENJAO u Text prozoru, sve nakon CTRL+R ostaje netaknuto, sada to spremim u PDF :

SVE JE OK Sada mijenjam u Text prozoru brojeve kako bi odgovarali pravom položaju stranica u dokumentu :

I KADA TO SPREMIM U PDF .... GLE :

SADA ću Vam pokazati jedan od načina da se to poboljša Tabelarni blok bi možda uspio, no ja slučajno znam da ovdje neće, pa ću: Ucrtati posebne textualne blokove za JEZGRO TEXTA, te za svaku SKUPINU brojki poseban blok ( U slučaju potrebe, možemo extremno svakoj rečenici i svakom broju dati svoj textualni blok . . . ) Evo, vidi sliku 116

. . . i SAD spremim to u PDF ...

VIDIMO DA JE SADA SVE OK!

--------------------------------------------------

SKORO ZABORAVIH JEDNU VEOMA VAŽNU NAPOMENU, ALI AKO STE SE DRŽALI POSTAVKI IZ TUTORIJALA BROJ 1, NE BI TREBALO BITI PROBLEMA. NAIME, NPR., PRETPOSTAVIMO DA STE CROPPIRALI CIJELU KNJIGU, OBRADILI JU, SPREMILI U PDF – A KAD ONO OGROMNI BIJELI RUBOVI U FINALNOM PDF-U ! TO JE ZATO JER STE MOŽDA SLUČAJNO IZMIJENILI JEDNU POSTAVKU POD FORMAT SETTINGS / PDF ---> Keep original image size [mora biti uključena ]

-------------------------------------------------–

TO BI BILO SVE -

- Pozdrav -

Related Documents

Html Tutorijal
March 2021 0
Knjiga
February 2021 14
Afr 30 Tabla Radionica
January 2021 1
Excel 2007 - Tutorijal
January 2021 1

More Documents from "Sinel Masic"