Roboty Google zostały stworzone do zbierania, przetwarzania i gromadzenia danych w sieci. Odwiedzają one nasze strony, a najczęściej robią to na trzy sposoby:
- buszujący po naszej stronie internetowej robot Google dociera do jej najdalszych zakątków poprzez linki, które znajdują się w witrynie, niczym po mapie drogowej, od punktu A do punktu B i tak dalej,
- robot Google korzysta ze spisu linków, który dostaje od nas na tacy w postaci mapy witryny (sitemapa),
- robot Google dociera do naszej strony za pomocą linków zwrotnych z innych serwisów.
Osieroconymi stronami nazywamy takie adresy, do których nie prowadzą żadne linki. Jedynym sposobem, aby się do nich dostać, jest ręczne wywołanie danego adresu URL w pasku adresu. Taka sytuacja powoduje, że roboty Google nie są w stanie dowiedzieć się o istnieniu danej podstrony, przez co może być ona całkowicie nieuwzględniona w indeksie wyszukiwarki. Strony osierocone są zjawiskiem niekorzystnym z punktu widzenia SEO, ponieważ duża ich liczba może marnować nasz crawl budget, dodatkowo cała nasza witryna może zostać ukarana przez Google (o czym ciut więcej niżej)!
Musimy wiedzieć, że istnieją niedozwolone praktyki dotyczące pozycjonowania – Black Hat SEO. Jedną z czynności należących do Black Hat SEO jest tworzenie stron ukrytych przed użytkownikami, a dostępnych jedynie dla robotów Google. Ma to na celu poprawienie widoczności serwisu. Takie strony, do których intencjonalnie nie linkujemy, nazywamy stronami duchami (ghost pages). Tworzenie takich stron, mających na celu nieuczciwe zwiększanie pozycji witryny w wynikach wyszukiwania, może skutkować nałożeniem przez Google kary na cały serwis, dlatego nie polecamy bawić się z robotami Googla w ciuciubabkę.
Nie ryzykujmy nałożenia kary na całą witrynę i starajmy się w miarę możliwości eliminować wszelkie osierocone strony!
Zdarzają się sytuacje, gdy mylimy osierocone strony ze stronami typu „ślepa uliczka”. Różnica jest bardzo prosta! Do osieroconej strony nie linkuje żadna inna strona z naszego serwisu. Natomiast w przypadku strony typu „ślepa uliczka” nie posiada ona w swojej treści żadnego linku, który pozwala przemieścić się w inne miejsce w serwisie. Jedyną czynnością, jaką możemy wykonać na stronach tego typu, jest jej zamknięcie lub cofnięcie się do poprzedniej strony poprzez użycie przycisku na naszym telefonie lub w przeglądarce.
Warto przeanalizować serwis pod kątem stron osieroconych ze względów biznesowych. Istnieje ryzyko, że osierocona strona była w przeszłości ważną podstroną generującą leady/sprzedaż lub może się nią stać. Obrazując: w wyniku błędu przy modyfikacji linkowania wewnętrznego został usunięty jedyny link prowadzący do podstrony z naszym bestsellerem. Z czasem taka podstrona znika z wyników wyszukiwania, a nasze obroty i przychody spadają.
Proponowanym przez Manisha Dudharejia (President and Founder of E2M Solutions Inc.) rozwiązaniem opublikowanym w serwisie searchenginejournal.com1 jest użycie narzędzi Screaming Frog, Google Analytics i Google Sheetsów/Excela, które pomogą nam odnaleźć osierocone strony.
Uruchamiamy narzędzie Screaming Frog (konfigurujemy je do skanowania stron indeksowanych za pomocą wyszukiwarki) i rozpoczynamy skanowanie strony głównej serwisu. Otrzymujemy wyniki skanowania:
Screaming Frog wskazał strony dostępne dla robotów, które są możliwe do indeksacji. Strony osierocone z reguły nie są dostępne dla robotów, więc należy odnaleźć je w inny sposób. Z pomocą przychodzi Google Analytics, który daje możliwość znalezienia naszych osieroconych stron. Istnieje duże prawdopodobieństwo, że Google Analytics w przeszłości odnotował wizytę użytkownika na takiej stronie i pozostał ślad po tym zdarzeniu.
Z Google Analyticsa chcemy wyeksportować adresy stron, które zanotowały odwiedziny. Interesują nas strony, które posiadają znikomą liczbę odwiedzin. Stanowi to bowiem przesłankę, że jest to strona osierocona.
Odnajdujemy w Google Analyticsa zakładkę Zachowanie, następnie Zawartość witryny i Wszystkie strony. Ustawiamy datę od początku zbierania danych przez narzędzie. Następnie sortujemy wyniki pod względem liczby odsłon, od najmniejszej do największej. Otrzymane w ten sposób adresy URL, eksportujemy do arkusza Google lub Excela. Wyniki z Google Analytics przenosimy do wcześniej utworzonego arkusza z wynikami skanu Screaming Frogiem (nasze adresy URL nie będą zawierały domeny).
Musimy pamiętać, że adresy, które nie zawierają domeny, nie będą dla nas przydatne. Dlatego warto stworzyć pełny adres z wyników Google Analytics. W tym celu tworzymy nową kolumnę między kolumną A i kolumną B, gdzie wpiszemy brakujący format naszego adresu URL:
Teraz wystarczy połączyć brakującą część adresu z wynikami z Google Analytics, czyli kolumnę B z kolumną C. Wykonamy to za pomocą reguły „=ZŁĄCZ.TEKSTY” – =ZŁĄCZ.TEKSTY(B2;C2)i przeciągamy w dół.
Gdy mamy do czynienia z niewielką liczbą adresów, widzimy już na pierwszy rzut oka, że witryny, które pojawiły się w Google Analytics, a nie pojawiły się w Screaming Frogu, mogą być witrynami osieroconymi. Niestety problem pojawia się w momencie, gdy posiadamy większą liczbę adresów. W takim wypadku z pomocą przychodzi reguła, która sprawdzi, czy dany adres z Google Analytics występuje również w Screaming Frogu.
W nowej kolumnie używamy reguły „=PODAJ.POZYCJĘ(D2;$A$2:$A$8;0)”, która pomoże wykonać opisywane sprawdzenie (przeciągamy regułę w dół).
Teraz dokładnie możemy zaobserwować, że przy adresach, które znalazły się w Google Analytics, a nie pojawiły się w Screaming Frogu, otrzymaliśmy błąd. Przy większej liczbie adresów URL, możemy wyfiltrować tylko takie adresy i zająć się ich analizą.
Warto pamiętać, że Screaming Frog posiada wbudowany „system” do wykrywania osieroconych stron, który wymaga dodatkowo płatnej licencji i połączenia Google Analyticsa i Google Search Console ze Screaming Frogiem. Pełną instrukcję znajdziecie tutaj: https://www.screamingfrog.co.uk/find-orphan-pages/
Po przeanalizowaniu adresów funkcjonujących w serwisie i określeniu stron osieroconych warto podjąć decyzję o ich dalszych losie. Pewne jest, że nie mogą one nadal pozostawać sierotami (chyba że jest to celowe i świadome działanie, np. tworzymy landing page, do którego sprowadzamy ruch z płatnych źródeł). Dlatego w pierwszej kolejności musimy odpowiedzieć sobie na pytanie, czy jest to podstrona, która jest ważna dla naszego biznesu. Jeżeli tak, to jak najszybciej trzeba ją podlinkować z innych części serwisu. Jeżeli nie, to warto dać znać robotom wyszukiwarki, że strona ta nie istnieje, ustawiając jej np. kod 410.
Problem osieroconych stron jest istotnym zagadnieniem w SEO. Stanowi niebezpieczeństwo dla naszej strony, ponieważ w pierwszej chwili jest niewidoczny. Dlatego warto kontrolować status swoich podstron regularnie, gdyż wystarczy zwykły błąd, niedopatrzenie, czy rozkojarzenie a możemy pozbawić naszą firmę źródła przychodu. Tak może się stać, gdy okaże się, że przez przypadek usunęliśmy linkowanie z serwisu do podstrony „znoszącej złote jajka”. Taka podstrona stanie się podstroną osieroconą, co w konsekwencji może prowadzić do jej usunięcia z wyników wyszukiwania i słuch o niej zaginie.
1. How to Find Every Orphan Page on Your Website, https://www.searchenginejournal.com/find-orphan-pages/276207/