Internet, Linux, Software, Tutoriales, Ubuntu

HTtrack, Descargar una web para consultarla OffLine

No se puede mostrar la imagen “https://i2.wp.com/thumbs1.logicielsfr.com/199-httrack/box/box.jpg” porque contiene errores.

 

En muchas ocasiones existen sitios web que quisiéramos tener siempre a la mano por aquello de las emergencias o para brindarnos soporte en algo que estemos investigando, etc, etc. HTTrack nos permite descargar un sitio web completo para poder consultarlo de manera Offline y disfrutar todo el sitio de una manera mas eficiente, ya que todos los archivos estaran en tu PC y no cargándose desde la red.

La idea es descargar todo un sitio web (con sus textos, imagenes, ficheros, etc…) a nuestro disco duro local, creando una copia-espejo del sitio pero en nuestro sistema de ficheros. Así después con nuestro browser favorito podremos navegar por ese sitio sin necesidad de tener conexión.

Para ello utilizaremos Httrack.

Realmente httrack es el programa que podríamos usar desde linea de comandos, pero para facilitar mas su uso y hacerlo mas sencillo, instalaremos webhttrack, que nos proporciona una interfase web del mismo.

Para instalar Httrack con la interface web, ejecutamos:

$ sudo apt-get install webhttrack

Si ejecutas apt-cache search podras ver que paquetes puedes instalar:

root@soledad:~# sudo apt-cache search httrack
httrack - Copy websites to your computer (Offline browser)
httrack-doc - Httrack website copier additional documentation
libhttrack-dev - Httrack website copier includes and development files
libhttrack1 - Httrack website copier library
proxytrack - Build HTTP Caches using archived websites copied by HTTrack
webhttrack - Copy websites to your computer, httrack with a Web interface
root@soledad:~# sudo apt-get install webhttrack

A nosotros solo nos interesa de momento webhttrack.

Una vez instalado, lanzamos la interfaz web con:

$ webhttrack &

Y arrancara entonces un servidor web de manera automatica que nos mostrara la primera pantalla del interface web:

track01.jpg

Para descargar una web, crearemos un proyecto. Esto es asi, pues podemos descargar mas de una web y a cada una de ellas tendremos que referenciarla por el nombre de proyecto que le asignemos, en el caso de que cancelemos una descarga de un sitio y mas tarde queramos reanudarla. Escribe por tanto un nombre para el proyecto y asignarle una categoria. por ejemplo:

track02.jpg

Ahora debes indicar la URL del sitio que quieres descargar. Para ello pulsa el boton “Añadir URL” y la escribes. En el ejemplo yo uso “http://www.ubuntulife.net”, pero tu puedes poner la de otro sitio que te interese descargar.

track03.jpg

Y poco mas. Podriamos configurar opciones para a que nivel de detalle queremos descargar los ficheros. Pero no entrare en detalles. Esas opciones no son muy complicadas y te permiten por ejemplo descargar ficheros a 1 nivel, que serian las imagenes y ficheros propiamente dichos de la propia web, o a mas niveles, por ejemplo si la web referencia (tiene links) a otras webs. Esto es un problema porque si tienes muchos niveles podrias empezar a descargar y descargar y no acabar nunca. tu web referencia a una web, esa a otra y asi sucesivamente. Por lo que las descargas de sitios web suelen cortarse a 1-3 niveles como mucho o mejor si lo que descargas son sitios web que no referencian a ningun otro (no tienen enlaces externos).

track04.jpg

Cuando pulses el boton de “comenzar” comienza la copia de ficheros del sitio web a tu equipo local. En funcion del tamaño de la web puede llegar a tardar varias horas. Ten en cuenta que se descargara imagenes, texto, videos, etc.

track05.jpg

Puedes parar el proceso y reanudarlo posteriormente si fuera necesario. Al finalizar la copia, se te mostrara el siguiente mensaje y ya podras acceder a los contenidos de la web, desde el directorio especificado.

track06.jpg

Visto en: Ubuntu LIfe

Anuncios

5 thoughts on “HTtrack, Descargar una web para consultarla OffLine”

  1. chevere esta bueno me funciono de a peluche los pasos estan bien exelente solo k no se muestran las imagenes recomiendo k las actualicen a lo mejor le sean de gran utilidad a otras persona grax 5 +5 yes….

Responder

Introduce tus datos o haz clic en un icono para iniciar sesión:

Logo de WordPress.com

Estás comentando usando tu cuenta de WordPress.com. Cerrar sesión / Cambiar )

Imagen de Twitter

Estás comentando usando tu cuenta de Twitter. Cerrar sesión / Cambiar )

Foto de Facebook

Estás comentando usando tu cuenta de Facebook. Cerrar sesión / Cambiar )

Google+ photo

Estás comentando usando tu cuenta de Google+. Cerrar sesión / Cambiar )

Conectando a %s