Cómo hacer un mirror (una copia) de su sitio web


Cuando se tiene acceso FTP (copia idéntica

La ventaja del acceso FTP es que copias cualquier archivo que métodos como spiders (por ejemplo wget) pueden fallar de obtener, esto ocurre mucho cuando se usa mucho javascript o imágenes cargadas via CSS. Es una ventaja en algunos casos también que accedes a los códigos fuente si eso es deseado, por ejemplo cuando se quiere conservar el sitio como dinámico.
Nota: si obtenes los códigos fuente (por ejemplo PHP) asegurate también de ver si los datos se guardan en una base de datos, si es así averigua en el código el método de acceso (username, password, etc) y utiliza la herramienta disponible para hacer un volcado de los datos.

cd /www/mirrors/
lftp -u username,password example.org
cd public_html
mirror .


Con acceso web (copia estática)

La ventaja de usar un spider o robot, como wget, es que no hace falta acceder a los datos o tener la misma plataforma para hacer el mirror, por ejemplo si queremos hacer una copia de un sitio con archivos ASP pero lo queremos hospedar en linux, esta sería la manera más apropiada, claro el sitio final en estos casos siempre es estático.
Hay varios programas que hacen esto, leen via http un sitio web y crean una copia, desde linux la utilidad de comando wget:

cd /www/mirrors/
wget --mirror --convert-links --html-extension http://example.org/


--mirror incluye varias opciones que permiten crear mirror, como recursion y conservar fecha.

--convert-links modifica los enlaces en los archivos bajados para que se puedan ver localmente.

--html-extension agrega la extension .html a los archivos que baja, especialmente util para hacer mirror de páginas que usan .php, .cgi, etc.

Nota: Lo mejor es hacer mirror en el mismo server, probarlo a distancia, y cuando se este seguro que funciona bajarlo en un .tar.gz Esto es por asuntos de velocidad en la creación misma del mirror y de transmisión hacia el cliente. Claro, cambia si se tiene una excelente conexión a Internet.
There are no comments on this page.
Valid XHTML :: Valid CSS: :: Powered by WikkaWiki