Imaginați-vă situația: creați un site web. Angajează un webmaster sau fă-o singur, cheltuind o mulțime de bani și timp personal pe el. Îți găzduiești creația și o umpli cu dragoste cu informații, fără să te gândești la necesitatea de a salva o copie a site-ului pentru a nu pierde date.
Într-o zi, nu prea grozav pentru tine, mergi pe site-ul tău, dar nu funcționează. Începi să afli care este problema și, o groază, centrul de date a ars sau găzduirea a decolat. Sau poate un virus a intrat și ți-a distrus datele. Pierderea de informații de pe un site web este comparabilă cu pierderea de informații de pe un computer. Deci, cum păstrați o copie a site-ului?
Să ne ocupăm mai întâi de definiție. Procesul de arhivare a site-ului web este păstrarea versiunii curente a unei pagini sau a unui site într-o arhivă pentru a lucra ulterioară cu aceasta. În aceste scopuri, se utilizează software specializat. Cea mai mare companie din lume este Internet Archive, despre care vom discuta mai jos.
Pentru o arhivă privată, puteți folosi browsere offline care au fost special concepute pentru a funcționa offline. Ele vor ajuta la crearecopii locale ale paginilor web individuale sau ale site-urilor întregi. Acestea includ, de exemplu:
- Un browser HTTrack multiplatformă care acceptă 29 de limbi mondiale și poate relua descărcările întrerupte, actualizați oglinda site-ului.
- Sharely gratuit Offline Explorer, care vă permite să descărcați nu numai fișiere sau pagini, ci și site-uri întregi de pe Internet prin FTP, HTTP, HTTPS, RTSP, MMS, BitTorrent.
- Download Manager Free Download Manager. Se integrează cu toate browserele, are un FTP încorporat, acceptă protocolul BitTorrent, poate crea fișiere torrent, poate intercepta link-uri din clipboard.
- Teleport Pro sursă închisă pentru Windows. Programul vă permite să descărcați site-uri întregi.
- Un program gratuit non-interactiv bazat pe consolă pentru descărcarea de fișiere și site-uri de pe Internet Wget. Programul acceptă protocoale HTTPS, HTTP, FTP și poate funcționa și prin intermediul unui server proxy HTTP. Potrivit pentru Linux.
Crearea unei copii de rezervă pe găzduire
Puteți configura o copie de rezervă a site-ului pe furnizorul dvs. de găzduire. Pentru a face acest lucru, trebuie să mergeți la panoul de administrare, la secțiunea pentru crearea de copii de rezervă. Fiecare găzduire are propriul său panou de administrare și este greu de spus exact unde al tău găzduiește această secțiune. Dacă nu vă puteți da seama, scrieți la asistența tehnică.
Crearea unei copii de rezervă cu pluginuri
Dacă site-ul dvs. este găzduit pe o platformă CMS, cum ar fi, de exemplu,WordPress, puteți salva o copie a site-ului dvs. instalând pluginul wp-db-backup (www.wordpress.org/plugins/wp-db-backup/) sau similar. Prin configurarea corectă a pluginului, veți primi o copie de rezervă a site-ului în fiecare zi sau în fiecare săptămână, după cum doriți.
Cum să salvați o copie a site-ului pe computer
Puteți salva site-ul pe computer folosind un client FTP. Dacă utilizați programul FileZilla, atunci creați un folder „Backup” pe computer (numele folderului poate fi orice). Conectați-vă la server printr-un client FTP și pur și simplu trageți și plasați pentru a face o copie de rezervă completă a site-ului în folderul „Backup”.
Pe lângă aceasta, puteți utiliza serviciul Site2ZIP (arhiva site-ul), un program pentru descărcarea WinHTTrack WebSite Copier. Cum să vizualizați copia salvată a site-ului? Pentru a face acest lucru, deschideți folderul în care a fost salvat site-ul și faceți clic pe fișierul index.html.
Arhiva Internet
În San Farncisco, în 1996, Brewster Cale a fondat Internet Archive nonprofit. Colectează copii ale tuturor paginilor web, înregistrări audio și video, fișiere grafice și programe. Arhivele materialelor colectate sunt stocate aici pentru o perioadă foarte lungă de timp și există acces gratuit la bazele de date pentru toată lumea.
Dacă vă întrebați cum să deschideți o copie salvată a unui site, atunci accesați archive.org/web/ și introduceți adresa site-ului sau a paginii în câmpul corespunzător. La sfârșitul anului 2012, Arhiva Internet avea 10 petaocteți, adică 10.000 de terabytes! Și până la jumătatea anului 2016, acumulase 502 miliarde de exemplare.pagini web.
Memorizarea site-ului în cache de către motoarele de căutare
O copie salvată a site-ului Google nu este altceva decât o memorie cache a paginilor site-ului realizată de motorul de căutare. Orice utilizator poate folosi o copie a paginii pentru nevoile sale în orice moment. Stocarea lor pe serverele motoarelor de căutare necesită o mulțime de resurse și o mulțime de bani sunt alocați pentru aceasta, dar un astfel de ajutor se plătește de la sine, deoarece încă mergem la motoarele de căutare. Adevărat, această metodă este potrivită doar pentru site-urile existente sau pentru cele care au fost eliminate recent. Dacă acest lucru s-a întâmplat cu mult timp în urmă, atunci motorul de căutare șterge datele.
Motor de căutare specializat
Pe lângă faptul că puteți căuta manual pagini stocate în cache în Google sau Yandex, puteți utiliza motorul de căutare specializat cachedview.com. Are un analog: cachedpages.com.
Dacă doriți să salvați o copie a site-ului sau a paginii sale individuale, o puteți face singur și gratuit la archive.is. În plus, există și o căutare globală a versiunilor care au fost salvate vreodată de utilizator.
Crearea unei arhive web în bibliotecile naționale
Astăzi, bibliotecile naționale se confruntă cu sarcina de a crea arhive de documente de pe Internet care fac parte din moștenirea științifică, culturală și istorică a omenirii. Dar acest lucru este foarte problematic.
Studiile au arătat că numărul de documente web de pe web crește exponențial și, în medie, un document trăieștede la una la patru luni. Cel mai convenabil este să utilizați un site web ca unitate de cont pentru o arhivă de documente web. Procesul de creare a unui fond este de a crea o copie sau „oglindă” a site-ului. Deoarece informațiile de pe acesta se modifică în timp, biblioteca trebuie să creeze oglinzi ale aceluiași site web la intervale regulate.
Astfel, există 60.000 de site-uri web în Suedia, ceea ce reprezintă de 20 de ori numărul publicațiilor tipărite tradiționale. Copiile documentelor tipărite din biblioteca Suediei ocupă 1,7 km de rafturi pe an. O arhivă web ar umple 25 km de rafturi! Acum arhiva lor conține 138 de milioane de fișiere cu o greutate totală de 4,5 gigaocteți.
Internetul crește în fiecare zi. Există multe companii și site-uri care au grijă să păstreze copii ale paginilor web în arhivele lor. Dar nu te baza doar pe ei. Faceți copii de rezervă în timp util și nu vă veți pierde niciodată site-ul.