W Internecie pojawiło się mnóstwo dokumentów, które prawdopodobnie opisują sposób, w jaki Google ocenia wyniki wyszukiwania, prawdopodobnie w wyniku przypadkowej publikacji przez wewnętrznego bota.

Dokumentacja, która wyciekła, opisuje starą wersję interfejsu API hurtowni treści Google i zapewnia wgląd w wewnętrzne działanie wyszukiwarki Google.

Wygląda na to, że materiał był nieumyślnie popełniony do publicznie dostępnego repozytorium należącego do Google w GitHub około 13 marca za pomocą zautomatyzowanych narzędzi giganta internetowego. Ta automatyzacja dodała do zatwierdzenia licencję open source Apache 2.0, co jest standardem w publicznej dokumentacji Google. A dalsze zatwierdzenie 7 maja podjął próbę załatania wycieku.

Mimo to materiał został zauważony przez Erfana Azimiegozostały ujawnione w niedzielę przez innych specjalistów ds. SEO, Randa Fishkina, dyrektora generalnego SparkToro i Michaela Kinga, dyrektora generalnego iPullRank.

Dokumenty te nie zawierają kodu itp., a zamiast tego opisują sposób korzystania z interfejsu API Content Warehouse firmy Google, który prawdopodobnie jest przeznaczony wyłącznie do użytku wewnętrznego. dokumentacja, która wyciekła, zawiera liczne odniesienia do wewnętrznych systemów i projektów. Chociaż istnieje podobnie nazwane Wygląda na to, że Google Cloud API, które jest już publiczne, to, co znalazło się na GitHubie, wykracza daleko poza to.

Pliki są godne uwagi ze względu na to, co ujawniają na temat rzeczy, które Google uważa za ważne przy rankingu stron internetowych pod kątem trafności, co jest przedmiotem stałego zainteresowania wszystkich osób zajmujących się SEO i/lub każdego, kto prowadzi witrynę internetową i ma nadzieję, że Google pomoże jej pozyskać ruch.

Wśród ponad 2500 stron dokumentacji zgromadzonej dla łatwe przeglądanie tutajistnieją szczegółowe informacje na temat ponad 14 000 atrybutów dostępnych lub powiązanych z API, aczkolwiek niewiele jest informacji o tym, czy wszystkie te sygnały są wykorzystywane i jakie jest ich znaczenie. Dlatego trudno jest określić wagę, jaką Google przypisuje atrybutom w swoim algorytmie rankingu wyników wyszukiwania.

Jednak konsultanci SEO uważają, że dokumenty zawierają godne uwagi szczegóły, ponieważ różnią się od publicznych oświadczeń złożonych przez przedstawicieli Google.

„Wiele twierdzeń (Azimi) (zawartych w e-mailu opisującym wyciek) jest bezpośrednio sprzecznych z publicznymi oświadczeniami składanymi przez pracowników Google na przestrzeni lat, w szczególności z wielokrotnym zaprzeczaniem przez firmę, że wykorzystuje się sygnały użytkowników skoncentrowane na kliknięciach, zaprzeczeniem, że subdomeny są traktowane oddzielnie w rankingach, odmowy stosowania piaskownicy dla nowszych witryn internetowych, odmowy zbierania lub uwzględniania wieku domeny i nie tylko” – wyjaśnił Fishkin ze SparkToro w raport.

Król iPullRank w swoim post na dokumentach, wskazał na oświadczenie zwolennika wyszukiwarki Google, Johna Muellera, który stwierdził w wideo że „nie mamy czegoś takiego jak wskaźnik autorytetu witryny internetowej” – miara tego, czy Google uważa witrynę za wiarygodną i dlatego zasługującą na wyższą pozycję w wynikach wyszukiwania.

King zauważa jednak, że z dokumentów wynika, że ​​w ramach skompresowanych sygnałów jakości przechowywanych przez Google dla dokumentów można obliczyć wynik „siteAuthority”.

W dwóch postach przytoczono kilka innych rewelacji.

Jednym z nich jest znaczenie kliknięć – a różne rodzaje kliknięć (dobre, złe, długie itp.) – wpływają na ranking strony internetowej. Google podczas USA przeciwko Google proces antymonopolowy uznany (PDF), że uwzględnia dane o kliknięciach jako czynnik rankingowy w wyszukiwarce internetowej.

Inną sytuacją jest to, że Google wykorzystuje strony internetowe przeglądane w przeglądarce Chrome jako sygnał jakości, widziany w API jako parametr ChromeInTotal. „Jeden z modułów związanych z wynikami jakości strony zawiera pomiar wyświetleń z przeglądarki Chrome na poziomie witryny” – twierdzi King.

Ponadto dokumenty wskazują, że Google bierze pod uwagę inne czynniki, takie jak aktualność treści, autorstwo, to, czy strona jest powiązana z głównym tematem witryny, zgodność tytułu strony z treścią oraz „średnia ważona rozmiar czcionki terminu w treści dokumentu.”

Firma Google nie odpowiedziała na prośbę o komentarz. ®

źródło