12 sierpnia 2021 7 minut czytania Jacek Wawryszczuk

Osierocone strony (orphaned pages): czym są i jak sobie z nimi radzić?

Zanim wytłumaczymy sobie, czym są osierocone strony (orphaned pages) musimy odpowiedzieć na pytanie, w jaki sposób roboty Google znajdują podstrony zawarte w naszym serwisie. Z taką wiedzą będziemy mogli przyjrzeć się zagadnieniu głównemu i zweryfikować jak radzić sobie z problemem orphaned pages.

Z tego artykułu dowiesz się:

  • Czym są osierocone strony (orphaned pages)?
  • Jak znaleźć osierocone strony?
  • W jaki sposób pozbyć się osieroconych stron?

Spis treści

  1. Jak roboty Google mogą trafić na adresy naszej strony internetowej?
  2. Czym są osierocone strony?
  3. Osierocone strony a strony duchy – praktyka Black Hat SEO
  4. Czy osierocona strona to ślepa uliczka? Nie, nie, nie…
  5. Osierocone strony a utracony potencjał
  6. Jak znaleźć osierocone strony?
  7. Osierocone strony (orphaned pages) - jak je naprawić?
  8. Osierocone strony - podsumowanie

Roboty Google zostały stworzone do zbierania, przetwarzania i gromadzenia danych w sieci. Odwiedzają one nasze strony, a najczęściej robią to na trzy sposoby:

  1. buszujący po naszej stronie internetowej robot Google dociera do jej najdalszych zakątków poprzez linki, które znajdują się w witrynie, niczym po mapie drogowej, od punktu A do punktu B i tak dalej,
  2. robot Google korzysta ze spisu linków, który dostaje od nas na tacy w postaci mapy witryny (sitemapa),
  3. robot Google dociera do naszej strony za pomocą linków zwrotnych z innych serwisów.

Osieroconymi stronami nazywamy takie adresy, do których nie prowadzą żadne linki. Jedynym sposobem, aby się do nich dostać, jest ręczne wywołanie danego adresu URL w pasku adresu. Taka sytuacja powoduje, że roboty Google nie są w stanie dowiedzieć się o istnieniu danej podstrony, przez co może być ona całkowicie nieuwzględniona w indeksie wyszukiwarki. Strony osierocone są zjawiskiem niekorzystnym z punktu widzenia SEO, ponieważ duża ich liczba może marnować nasz crawl budget, dodatkowo cała nasza witryna może zostać ukarana przez Google (o czym ciut więcej niżej)!

Musimy wiedzieć, że istnieją niedozwolone praktyki dotyczące pozycjonowania – Black Hat SEO. Jedną z czynności należących do Black Hat SEO jest tworzenie stron ukrytych przed użytkownikami, a dostępnych jedynie dla robotów Google. Ma to na celu poprawienie widoczności serwisu. Takie strony, do których intencjonalnie nie linkujemy, nazywamy stronami duchami (ghost pages). Tworzenie takich stron, mających na celu nieuczciwe zwiększanie pozycji witryny w wynikach wyszukiwania, może skutkować nałożeniem przez Google kary na cały serwis, dlatego nie polecamy bawić się z robotami Googla w ciuciubabkę.

Nie ryzykujmy nałożenia kary na całą witrynę i starajmy się w miarę możliwości eliminować wszelkie osierocone strony!

Zdarzają się sytuacje, gdy mylimy osierocone strony ze stronami typu „ślepa uliczka”. Różnica jest bardzo prosta! Do osieroconej strony nie linkuje żadna inna strona z naszego serwisu. Natomiast w przypadku strony typu „ślepa uliczka” nie posiada ona w swojej treści żadnego linku, który pozwala przemieścić się w inne miejsce w serwisie. Jedyną czynnością, jaką możemy wykonać na stronach tego typu, jest jej zamknięcie lub cofnięcie się do poprzedniej strony poprzez użycie przycisku na naszym telefonie lub w przeglądarce.

Warto przeanalizować serwis pod kątem stron osieroconych ze względów biznesowych. Istnieje ryzyko, że osierocona strona była w przeszłości ważną podstroną generującą leady/sprzedaż lub może się nią stać. Obrazując: w wyniku błędu przy modyfikacji linkowania wewnętrznego został usunięty jedyny link prowadzący do podstrony z naszym bestsellerem. Z czasem taka podstrona znika z wyników wyszukiwania, a nasze obroty i przychody spadają.

Proponowanym przez Manisha Dudharejia (President and Founder of E2M Solutions Inc.) rozwiązaniem opublikowanym w serwisie searchenginejournal.com1 jest użycie narzędzi Screaming Frog, Google Analytics i Google Sheetsów/Excela, które pomogą nam odnaleźć osierocone strony.

Uruchamiamy narzędzie Screaming Frog (konfigurujemy je do skanowania stron indeksowanych za pomocą wyszukiwarki) i rozpoczynamy skanowanie strony głównej serwisu. Otrzymujemy wyniki skanowania:

Wyniki skanowania ze Screaming Froga
Wyniki skanowania ze Screaming Froga.

Screaming Frog wskazał strony dostępne dla robotów, które są możliwe do indeksacji. Strony osierocone z reguły nie są dostępne dla robotów, więc należy odnaleźć je w inny sposób. Z pomocą przychodzi Google Analytics, który daje możliwość znalezienia naszych osieroconych stron. Istnieje duże prawdopodobieństwo, że Google Analytics w przeszłości odnotował wizytę użytkownika na takiej stronie i pozostał ślad po tym zdarzeniu.

Z Google Analyticsa chcemy wyeksportować adresy stron, które zanotowały odwiedziny. Interesują nas strony, które posiadają znikomą liczbę odwiedzin. Stanowi to bowiem przesłankę, że jest to strona osierocona.

Odnajdujemy w Google Analyticsa zakładkę Zachowanie, następnie Zawartość witryny i Wszystkie strony. Ustawiamy datę od początku zbierania danych przez narzędzie. Następnie sortujemy wyniki pod względem liczby odsłon, od najmniejszej do największej. Otrzymane w ten sposób adresy URL, eksportujemy do arkusza Google lub Excela. Wyniki z Google Analytics przenosimy do wcześniej utworzonego arkusza z wynikami skanu Screaming Frogiem (nasze adresy URL nie będą zawierały domeny).

Wyniki z Google Analytics przeniesione do Excela
Wyniki z Google Analytics przeniesione do Excela.

Musimy pamiętać, że adresy, które nie zawierają domeny, nie będą dla nas przydatne. Dlatego warto stworzyć pełny adres z wyników Google Analytics. W tym celu tworzymy nową kolumnę między kolumną A i kolumną B, gdzie wpiszemy brakujący format naszego adresu URL:

Dodanie brakującej części adresu URL do Excela
Dodanie brakującej części adresu do Excela.

Teraz wystarczy połączyć brakującą część adresu z wynikami z Google Analytics, czyli kolumnę B z kolumną C. Wykonamy to za pomocą reguły „=ZŁĄCZ.TEKSTY” – =ZŁĄCZ.TEKSTY(B2;C2)i przeciągamy w dół.

Łączenie adresów URL w całość
Łączenie adresów URL w całość.

Gdy mamy do czynienia z niewielką liczbą adresów, widzimy już na pierwszy rzut oka, że witryny, które pojawiły się w Google Analytics, a nie pojawiły się w Screaming Frogu, mogą być witrynami osieroconymi. Niestety problem pojawia się w momencie, gdy  posiadamy większą liczbę adresów. W takim wypadku z pomocą przychodzi reguła, która sprawdzi, czy dany adres z Google Analytics występuje również w Screaming Frogu.

W nowej kolumnie używamy reguły „=PODAJ.POZYCJĘ(D2;$A$2:$A$8;0)”, która pomoże wykonać opisywane sprawdzenie (przeciągamy regułę w dół).

Użycie reguły wskazującej strony osierocone
Użycie reguły wskazującej potencjalnie strony osierocone.

Teraz dokładnie możemy zaobserwować, że przy adresach, które znalazły się w Google Analytics, a nie pojawiły się w Screaming Frogu, otrzymaliśmy błąd. Przy większej liczbie adresów URL, możemy wyfiltrować tylko takie adresy i zająć się ich analizą.

Warto pamiętać, że  Screaming Frog posiada wbudowany „system” do wykrywania osieroconych stron, który wymaga dodatkowo płatnej licencji i połączenia Google Analyticsa i Google Search Console ze Screaming Frogiem. Pełną instrukcję znajdziecie tutaj: https://www.screamingfrog.co.uk/find-orphan-pages/

Po przeanalizowaniu adresów funkcjonujących w serwisie i określeniu stron osieroconych warto podjąć decyzję o ich dalszych losie. Pewne jest, że nie mogą one nadal pozostawać sierotami (chyba że jest to celowe i świadome działanie, np. tworzymy landing page, do którego sprowadzamy ruch z płatnych źródeł). Dlatego w pierwszej kolejności musimy odpowiedzieć sobie na pytanie, czy jest to podstrona, która jest ważna dla naszego biznesu. Jeżeli tak, to jak najszybciej trzeba ją podlinkować z innych części serwisu. Jeżeli nie, to warto dać znać robotom wyszukiwarki, że strona ta nie istnieje, ustawiając jej np. kod 410.

Problem osieroconych stron jest istotnym zagadnieniem w SEO. Stanowi niebezpieczeństwo dla naszej strony, ponieważ w pierwszej chwili jest niewidoczny. Dlatego warto kontrolować status swoich podstron regularnie, gdyż wystarczy zwykły błąd, niedopatrzenie, czy rozkojarzenie a możemy pozbawić naszą firmę źródła przychodu. Tak może się stać, gdy okaże się, że przez przypadek usunęliśmy linkowanie z serwisu do podstrony „znoszącej złote jajka”. Taka podstrona stanie się podstroną osieroconą, co w konsekwencji może prowadzić do jej usunięcia z wyników wyszukiwania i słuch o niej zaginie.

1. How to Find Every Orphan Page on Your Website, https://www.searchenginejournal.com/find-orphan-pages/276207/

Blog
  • 11 grudnia 2023
    Link Juice – SEOwy napój mocy
    Jan Raszyński
  • 27 listopada 2023
    Pozycjonowanie strony na WordPressie. Praktyczne porady
    Jakub Iżycki
  • 13 listopada 2023
    Keyword stuffing – co to jest i jak działa na wyszukiwarkę?
    Mateusz Surowiec
  • 16 czerwca 2023
    Linkowanie wewnętrzne w SEO — klucz do sukcesu Twojej strony
    Marketing Match
  • 7 grudnia 2022
    Link kanoniczny — co to jest i kiedy używać kanonicznych adresów URL?
    Natalia Koncewicz
  • 9 listopada 2022
    Skuteczne YouTube SEO w 8 krokach
    Olga Zboina
  • 20 lipca 2022
    Raport SEO — co daje i z czego powinien się składać?
    Natalia Koncewicz
  • 6 lipca 2022
    Analiza konkurencji SEO. Jak ją znaleźć? Jaki ma wpływ na działania?
    Adriana Koczoń
  • 11 maja 2022
    Aktualizacja algorytmu Google ‘FRED’ – czyli jakość, jakość i jeszcze raz jakość
    Jan Raszyński
  • 13 kwietnia 2022
    Mobilegeddon – armagedon czy straszak Google?
    Jan Raszyński
  • 9 marca 2022
    Core Web Vitals – podstawowe wskaźniki internetowe, czy zmienią oblicze SEO? – Opinie ekspertów
    Jan Raszyński
  • 9 lutego 2022
    Pozycjonowanie stron i sklepu internetowego w Shoper
    Marketing Match
  • 12 stycznia 2022
    Jak zoptymalizować treści pod SEO dzięki Surfer?
    Natalia Koncewicz
  • 25 listopada 2021
    Czym jest lokalne SEO?
    Olga Zboina
  • 1 września 2021
    Google update – aktualizacje algorytmu w zwierzęcym wydaniu
    Jan Raszyński
  • 28 lipca 2021
    Wyszukiwanie głosowe a SEO – czy nadszedł już czas na optymalizację?
    Natalia Koncewicz
  • 13 kwietnia 2021
    SEO dla Google vs Bing vs DuckDuckGo
    Olga Zboina
  • 31 marca 2021
    23 wtyczki SEO do Google Chrome, które ułatwiają specjalistom SEO życie
    Jacek Wawryszczuk
  • 17 marca 2021
    Błędy 404 „Strona nie istnieje” – Megaporadnik SEO
    Patryk Bosek
  • 17 lutego 2021
    PageRank Google – jak ustalana była do niedawna wartość stron internetowych przez roboty Google?
    Bartłomiej Giedyk
  • 3 lutego 2021
    Przyjazne Adresy URL – jak tworzyć linki zgodne ze sztuką SEO?
    Jacek Wawryszczuk
  • 20 stycznia 2021
    Meta description – co to jest, jak je tworzyć?
    Olga Zboina
  • 10 stycznia 2021
    Nagłówki HTML – jak z nich korzystać?
    Bartłomiej Giedyk
  • 6 listopada 2020
    Jak zadbać o SEO w kontekście Black Friday?
    Bartłomiej Giedyk
  • 1 października 2020
    Nowa funkcjonalność Linkbuildingowa w Ahrefsie – Link Opportunities
    Jan Raszyński
  • 28 kwietnia 2020
    Wizytówka Google Moja Firma – jak promować firmę na rynku lokalnym?
    Jan Raszyński
  • 26 sierpnia 2019
    Optymalizacja i pozycjonowanie – podstawowe narzędzia SEO
    Jan Raszyński
  • 12 sierpnia 2019
    Linkowanie wychodzące
    Patryk Bosek