Rozwiązanie problemu duplikacji treści: kanoniczne adresy URL i przekierowania 301

Pojęcie kanoniczności w ujęciu SEO dotyczy konsekwencji zarządzania adresami URL dla tworzonych stron, w tym braku przedrostka www tylko w adresach niektórych stron, podczas gdy inne go zawierają, lub dodanie znaku slash na końcu adresu tylko dla części stron. Należy upewnić się, że stosowany jest jednolity format adresów dla wszystkich stron składowych wchodzących w skład danej witryny, oraz dołożyć wszelkich starań, aby stosowane nazewnictwo katalogów oraz przekazywanych parametrów było spójne i jak najbardziej przyjazne odwiedzającym.

Dynamiczne adresy URL zawierają szereg niekoniecznie zrozumiałych dla przeciętnego użytkownika kombinacji znaków specjalnych oraz cyfr – parametry te, przekazywane w adresie, mają wpływ na automatycznie generowaną treść stron, jednak nie mają wartości semantycznej dla pająków indeksujących. Dla pozycjonowania najlepiej jest, gdy witryna składa się jedynie ze statycznych adresów URL, które nie stanowią dla botów problemu w indeksacji, jednak nierzadko jedynie przekazywanie parametrów zapewnia poprawne funkcjonowanie dokumentu.

Sposobem rozwiązującym brak konsekwencji w działaniu są stałe przekierowania 301 z jednej strony na drugą, zaimplementowane w pliku .htaccess (dla serwera Apache). Robot indeksujący uzna wtedy, że oba URL to ta sama strona. Narzędzia dla webmasterów Google umożliwiają określenie, które adresy w ramach witryny bot uznać ma za kanoniczne, a które za preferowane. Automatycznie ustandaryzowane adresy można także uzyskać poprzez odpowiednią konfigurację modułu przekształcania adresów mod_rewrite.

Mianem przekierowania określa się automatyczne przeniesienie użytkownika na nowy adres URL. Stosuje się je kiedy wersja wyświetlanej strony zależy od urządzenia lub wcześniejsza lokalizacja sieciowa zasobu została zmieniona, tak aby uniknąć wyświetlania strony błędu 404Nie odnaleziono strony. Podczas realizacji żądania przesłania dokumentu HTML lub konkretnego elementu ładowanej strony (np. skrypt, plik graficzny) odpowiedź serwera WWW z przekierowaniem oznaczona jest kodem stanu protokołu HTTP z zakresu 3xx. Jest to informacja dla przeglądarki, jakie kroki musi następnie wykonać, aby w pełni załadować dokument. Zaleca się zamieszczenie spersonalizowanej strony obsługi kodu 404, która informuje o możliwym powodzie zaistnienia błędu oraz umożliwia dalszą nawigację po witrynie.

Aktualnie najczęściej spotykanymi oznaczeniami przekierowań są kody:

  1. 301 – Przekierowanie stałe – preferowane z punktu widzenia optymalizacji, informuje pająka indeksującego, że strona trwale zmieniła lokalizację;
  2. 302 – Przekierowanie tymczasowe – oznacza dla wyszukiwarki, że zasób zostanie przywrócony pod podany adres.

Oba rodzaje w nagłówku Location odpowiedzi dla cienkiego klienta zawierają nowy URL, na który ponownie wysyłane jest żądanie wyświetlenia strony.

Przekierowania nie pozostają bez wpływu na aspekty SEO

Kod 301 Googlebot interpretuje jako sygnał to przeniesienia mocy rankingowej z wcześniej przeskanowanych stron na nowy adres witryny, co pozwala zachować większą część wartości oceny PR (następuje kilkuprocentowa strata). Adres strony zapisany w indeksie zostaje zaktualizowany. Jednocześnie, zaimplementowanie przekierowań 302 skutkuje utratą mocy rankingowej. Jeżeli nie zastosuje się przekierowań, a usunięta strona nie zostanie zgłoszona w Narzędziach dla Webmasterów jako nieaktualna, wyszukiwarka będzie nadal kierować ruch na adres zapisany w indeksach Google do momentu odnalezienia nowej witryny.

Sumy kontrolne dla każdego z dokumentów umożliwiają wyszukiwarkom weryfikowanie, czy przechowują tylko pojedynczą kopię tej samej strony, aby unikać katalogowania tego samego zasobu wielokrotnie, z przypisanymi kilkoma różnymi URL. Google może podzielić moc rankingową pomiędzy dostępne wariacje adresu, co będzie skutkować obniżeniem wartości PageRank. Aby tego uniknąć, należy stosować jednolity format adresów URL na wszystkich podstronach serwisu. Kiedy zastosowanie przekierowań 301 jest nieodpowiednie, w nagłówku dokumentu HTML umieścić należy fragment kodu wskazujący robotom, która ze stron zduplikowanych jest preferowana jako kanoniczna, jako adres URL wpisując ścieżkę dostępu do standardowej wersji zasobu:

<link rel=”cannonical” href=”adresURL“/>

Czynność tę należy powtórzyć dla wszystkich niekanonicznych podstron.

Skracanie adresów URL: goo.gl i inne narzędzia

Upraszczanie długich, trudnych do zapamiętania adresów URL z wieloma parametrami za pomocą usług takich jak bit.ly lub produkt Google – goo.gl, nie ma swojego uzasadnienia dla adresów implementowanych w kodzie. Elementem bezpośrednio widzianym przez odwiedzającego jest jedynie tekst zakotwiczony, a nie adres URL, w związku z czym jego długość nie ma wpływu na estetykę dokumentu oraz odbiór internauty, chociaż, dla robotów, zachowane parametry to informacja o kontekście strony.

Niemniej jednak, skrócone adresy zachowują swoją funkcjonalność i są znacznie łatwiejsze w zarządzaniu, szczególnie, jeśli skorzystano z narzędzia pozwalającego na umieszczenie w krótkim adresie własnych słów kluczowych, np. http://goo.gl/wybranafraza. Do upraszczania adresów stosuje się przekierowania 301, które zachowują znaczą część wartości ratingowej, skrócone odnośniki posiadają także własne, publicznie dostępne statystyki odwiedzin. Optymalne rozwiązanie zakłada więc upraszczanie adresów URL, jeśli jest to konieczne, dodając słowa kontekstowe (dla serwisów społecznościowych, gdzie adresy wyświetlane są bezpośrednio w przeglądarce) oraz zatrzymanie pełnych adresów w kodzie źródłowym dla strony pokazującej jedynie anchor tekst.