Do czego służy plik robots.txt?

Czym jest robots.txt?

Plik robots.txt jest jednym z mechanizmów Robots Exclusion Protocol, który został stworzony w celu informowania automatów (botów) o tym, czego nie powinny robić na stronie WWW. Przykładowo, nie wszyscy właściciele stron WWW chcą, aby ich projekt WWW był widoczny w wynikach wyszukiwania (np. w wyszukiwarce Google). Plik robots.txt powinien zostać umieszczony w katalogu, do którego została przekierowana domena internetowa (jest to tzw. katalog główny domeny).

Jak działa plik robots.txt?

Do procesu wyszukiwania nowych materiałów w sieci Internet wykorzystywane są tak zwane roboty (boty), które podążają za hiperłączami (linkami) i indeksują całą zawartość danej strony WWW do katalogu wyszukiwarki. Robota indeksującego można określić jako część wyszukiwarki internetowej (np. Google), która przegląda i analizuje strony WWW, by następnie dodać o nich informacje do bazy wyszukiwarki.

WAŻNE! Plik robots.txt ogranicza dostęp do Twojej strony WWW robotom wyszukiwarek, które przeszukują Internet. Dla przykładu, możesz zabronić indeksowanie całej lub tylko wybranej części Twojej strony WWW!

Wspomniane roboty (np. roboty Google) po odwiedzeniu wybranej strony WWW analizują jej strukturę oraz treść i następnie na podstawie tajemnego algorytmu umieszczają wybraną stronę WWW w wynikach wyszukiwania na odpowiedniej pozycji.

Po utworzeniu odpowiedniego pliku robots.txt i opublikowaniu go na serwerze wszystkie zasady, które zostały w nim zdefiniowane będą natychmiast aktywne. Pamiętaj, że plik robots.txt można utworzyć w najprostszym edytorze tekstowym.

WAŻNE! Plik robots.txt jedynie informuje o odpowiednim zachowaniu, nie wymusza go zaś w żaden sposób. Wszystkie uznane roboty (np. roboty popularnych wyszukiwarek internetowych) będą przestrzegać zasad zawartych w pliku “robots.txt”, jednak niektóre roboty mogę je zignorować.

Ignorowanie zapisów zawartych w pliku “robots.txt” jest możliwe, ponieważ nie można narzucić bezwarunkowego przestrzegania zasad zawartych w pliku “robots.txt”, w związku z czym niektórzy spamerzy i inni oszuści mogą go zignorować. W tym przypadku zalecamy używanie hasła do ochrony poufnych informacji, np. za pomocą pliku .htaccess (funkcja ukrytego katalogu).

Do czego służy plik robots.txt?

Czym jest robots.txt?

Jak działa plik robots.txt?

Przykłady zawartości dla plików robots.txt

O czym należy pamiętać podczas korzystania z pliku robots.txt?

Nie znalazłeś odpowiedzi na swoje pytanie?

Do czego służy plik robots.txt?

Czym jest robots.txt?

Jak działa plik robots.txt?

Przykłady zawartości dla plików robots.txt

O czym należy pamiętać podczas korzystania z pliku robots.txt?

Powiązane artykuły

Jak przypisać własną domenę do usługi WordPress Hosting?

Jak przypisać domenę do serwera/hostingu w AZ.pl?

Jak zarządzać przypisaniem domeny?

Nie znalazłeś odpowiedzi na swoje pytanie?