miércoles, febrero 18, 2009
|
Si utilizas Linux o una variante de UNIX (como el mismo OS X) en donde puedas instalar o tengas acceso al comando wget, he aquí un truco que te gustará, ya que te permite descargar un website completo (es decir, todas las páginas web dentro de un mismo dominio) con una sola linea de comando, lo que resulta bastante útil.
El comando es el siguiente y lo debes escribir en una sola linea, aunque simplemente copia-pega directamente desde aquí a tu linea de comando y cambia el final que dice foo.com (nota que como es Linux/UNIX, que debes poner atención a las mayúsculas y minúsculas): wget --random-wait --limit-rate=64k -e robots=off -r -p -U mozilla http://www.foo.com Es importante entender por qué ciertas opciones del comando wget que utilizamos: --random-wait significa que entre un pedido y otro al website, que espere un tiempo aleatorio, para así no pedir demasiadas páginas y archivos uno detrás de otro y alarmar a algún sistema de seguridad. --limit-rate=64k significa que no pase de 64 KiloBytes por segundo en transferencia de datos. Este número depende de tu conexión a Internet, y no es recomendado que lo incrementes mucho para no alarmar al website remoto. También puedes especificar el valor en MB/s sustituyendo la "k" por una "m". -e robots=off significa que wget no debe prestar atención al archivo robots.txt que indica cuáles páginas no deben accederse por un navegador web. -r significa que queremos todo de manera recursiva. -p indice que descargue todos los archivos para desplegar adecuadamente una página HTML. -U mozilla significa que impersonifique a la familia Mozilla de navegadores (como Firefox). Y finalmente sustituye http://www.foo.com por el website que deseas descargar. Noten que este truco es bastante útil para esas páginas que ofrecen miles de fotos para diseñadores gráficos, pero que te hacen moverte una página a la vez de manera manual y lenta. Mientras que con esto puedes dejar a que wget "navegue y descargue" todo por ti. Manual ("man page") de wget con las otras opciones que ofrece autor: josé elías |
12 comentarios |
Linux |
Comentarios
Añadir Comentario |
"Ese diálogo entre el racionalismo y el budismo en lo personal me suena a un cuento que leí cuando niño acerca de unos monjes ciegos que se acercaron a un elefante para saber cómo era.
Uno agarró las orejas y dijo que el elefante era como un abanico, otro agarró la cola y dijo que era una cuerda, otro agarró la trompa y dijo que era como una gran serpiente, otro agarró el lomo y dijo que era una pared.
Nunca terminaron de determinar como era el elefante porque cada uno se aferraba a su pedacito de verdad. Todos tenían razón y estaban equivocados a la vez.
Si es cierto que somos científicos, se supone que debemos aceptar el principio de que cualquier tesis es válida hasta que surja una nueva antítesis que la eche por tierra. Esto es verdad hasta con las filosofías, ¿o no?"
Uno agarró las orejas y dijo que el elefante era como un abanico, otro agarró la cola y dijo que era una cuerda, otro agarró la trompa y dijo que era como una gran serpiente, otro agarró el lomo y dijo que era una pared.
Nunca terminaron de determinar como era el elefante porque cada uno se aferraba a su pedacito de verdad. Todos tenían razón y estaban equivocados a la vez.
Si es cierto que somos científicos, se supone que debemos aceptar el principio de que cualquier tesis es válida hasta que surja una nueva antítesis que la eche por tierra. Esto es verdad hasta con las filosofías, ¿o no?"
en camino a la singularidad...
©2005-2024 josé c. elías
todos los derechos reservados
como compartir los artículos de eliax
Seguir a @eliax
y que pasa con los contenidos que estan dentro de bases de datos y que dependen de los parametros que se pasen por ejemplo
if($_request["acceso"] == true){
echo "contenido exclusibo";
}
que aria en este caso para descargar este tipo de contenido por que igual en las base de datos.