CÓMO CONVERTIR PDF A FORMATO DE TEXTO O HTML


Para esas veces que necesitamos editar un PDF para crear nuestros recursos, exámenes...:



Podemos PDFconvertir archivos .odt a PDF con un
sencillo click con openoffice, pero luego nos vemos en la necesidad de
hacer el paso contrario, bueno para eso no utilizaremos nada que tenga
que ver coAVrAmTAR avatarn un programa, utilizaremos la consola, para eso debemos de
instalar algunas cosillas que nos permitirán hacer la
conversión, abrimos consola y ejecutamos lo siguiente:




<i>sudo apt-get install pdfcrack poppler-utils pdfedit</i></pre>
<p>Les explicaré, el pdfcrack nos ayudará a encontrar las contraseñas o restricciones que tenga el PDF.</p>

<p><span id="more-1160"></span></p>
<p>El popplet-utils nos da un montón de acciones a ejecutar en
consola que tenga que ver con PDF, una de las que nos llama de
atención para este post es pdftohtml y pdftotext, espero no
tener que explicar para que sirve cada uno, pero si explicaré
como usar cada uno.</p>

<p>Bueno para eso nos dirigimos por medio de consola a la carpeta donde
se encuentre el PDF a convertir. Luego en consola ejecutamos lo
siguiente:</p>

<pre style="margin-bottom: 0.5cm;"><i>ferfactor@ferfactor-laptop:/media/Respaldo/Documentos/Books/Harry Potter 6$ pdftotext -layout HP6.PDF</i></pre>
<p>Tardará unos segundos y aparecerá en la carpeta la el
TXT del libro… Para hacer un HTML de un PDF debemos de hacer
exactamente la misma dinámica</p>

<pre style="margin-bottom: 0.5cm;"><i>ferfactor@ferfactor-laptop:/media/Respaldo/Documentos/Books/Harry Potter 6$ pdftohtml -q HP6.PDF</i></pre>
<p>Les daré dos tips muy importantes y púes muy ventajosos.</p>

<p>Si ejecutan simplemente en la consola pdftotext o pdftohtml o
pdfcrack aparecerán las opciones que tenemos para dicha
conversión.</p>

<pre style="margin-bottom: 0.5cm;"><i>ferfactor@ferfactor-laptop:~$ pdftohtml<br />pdftohtml version 0.36 http://pdftohtml.sourceforge.net/, based on Xpdf version 3.00<br />Copyright 1999-2003 Gueorgui Ovtcharov and Rainer Dorsch<br />Copyright 1996-2004 Glyph & Cog, LLC<br /><br />Usage: pdftohtml [options] <PDF-file> [<html-file> <xml-file>]<br />-f <int> : first page to convert<br />-l <int> : last page to convert<br />-q : don't print any messages or errors<br />-h : print usage information<br />-help : print usage information<br />-p : exchange .pdf links by .html<br />-c : generate complex document<br />-i : ignore images<br />-noframes : generate no frames<br />-stdout : use standard output<br />-zoom <fp> : zoom the pdf document (default 1.5)<br />-xml : output for XML post-processing<br />-hidden : output hidden text<br />-nomerge : do not merge paragraphs<br />-enc <string> : output text encoding name<br />-dev <string> : output device name for Ghostscript (png16m, jpeg etc)<br />-v : print copyright and version info<br />-opw <string> : owner password (for encrypted files)<br />-upw <string> : user password (for encrypted files)<br />-nodrm : override document DRM settings</i></pre>
<p>Dos una manera más fácil de abrir la carpeta en la
consola es usar las extensiones que nos brinda nautilus para
instalarlas hacemos lo siguiente:</p>

<pre style="margin-bottom: 0.5cm;"><i>sudo apt-get install nautilus-actions nautilus-open-terminal nautilus-wallpaper</i>

La próxima vez que iniciemos sesión tendremos
habilitadas las acciones de nautilus así que dando click derecho
podremos ver dichas acciones…. Muy ventajoso!!!


Made by FerFactor

No hay comentarios:

Publicar un comentario