Új hozzászólás Aktív témák

  • hampidampi

    senior tag

    válasz GD #63 üzenetére

    A probléma ott kezdődik, hogy pdf-et akarsz konvertálni. A pdf alapvetően arra lett kitalálva, hogy kinyomtassák, így lapképet tárol, nem folyó szöveget. Valószínűleg minden sor végén bekezdésvége van. Ezt egy egyszerű kopipészt-a-wordbe művelettel ellenőrizheted.
    Ráadásul az egy konténer csak, amibe bármit bele lehet dobálni. És bele is dobálnak.
    Egyszóval a pdf forrás 90%-ban szívás.
    - Mindenekelőtt próbálj meg más, szerkeszthető forrást találni.
    - Vagy próbáld meg konvertáláskor a heurisztikus feldolgozást bekapcsolni és az ott található értékekkel játszani, különös tekintettel a sortörés ki.. és az üres sorok törlése a bekezdések között paraméterekre.
    - Alternatívaként érdemes kipróbálni a pdftoepub programot. Nem túl elvetemült pdf-ekkel egész jól megbírkózik.
    - Ha viszont nagyon gány a pdf (főleg a scannelt, képekből álló), akkor csak egy ocr program segíthet. Ebből a legjobb az Abbyy FineReader.
    Utómunkára, átolvasásra persze mindig szükség lesz, mert szinte lehetetlen hiba nélkül rendesen pdf-et átalakítani.
    Szóval még egyszer: a pdf szinte mindig szívás (nemcsak Calibre-rel)!

    A tartalomjegyzék generálása már egy következő "igényességi szint", ugyanis ehhez egy jól elkészített alap dokumentum szükséges. Ha pdf-ből indulsz ki, akkor előbb azt valami szerkeszthető formába konvertáld (elsősorban html, rtf vagy docx - ezeket szereti a Calibre). Ilyenkor valamilyen szövegszerkesztőben az egyes fejezeteknek megfelelő szintű címsor stílust kell beállítani. Aztán a Calibre-ben konvertáláskor a Tartalomjegyzéknél a szint beállításánál a megfelelő kifejezést kiválasztani. Pl. címsor1-nél: //h:h1. Persze a varázslóval mást is fel lehet venni, mondjuk oldaltörés figyelését stb., de az kevésbé megbízható.

Új hozzászólás Aktív témák