Google rozwiewa wątpliwości na temat indeksowania plików PDF - Oficjalny Blog Performance Media.pdf

(696 KB) Pobierz
705048383 UNPDF
Search for:
O nas
Google
Pozycjonowanie
SEO
SEM
AdWords
PM
Google Analytics
Kontakt
Strona glówna » Google » Google rozwiewa wątpliwości na temat indeksowania plików PDF
Google rozwiewa wątpliwości na temat
indeksowania plików PDF
11 września 2011
1 osoba dała +1
Lubię to! Lubiane przez 6 osób. Rejestracja , aby zobaczyć, co lubią Twoi znajomi.
6
Like
Google rozpoczęło indeksowanie PDFów już w 2001 roku i przez te dziesięć lat nazbierało w swoim indeksie
setki milionów takich plików. Mimo zapewnień Google, że pliki PDF są indeksowane przez roboty
wyszukiwarki, wiele zagadnień dotyczących chociażby indeksowania obrazków czy tez linków
umieszczonych w plikach PDF budziło wiele wątpliwości, aż do zeszłego czwartku, kiedy to na oficjalnym
blogu Google dla Webmasterów pojawił się oficjalny wpis wyjaśniający podstawowe kwestie z tym
związane .
Indeksowanie zawartości plików PDF
Google bez problemu indeksuje zawartość tekstową plików PDF (niezależnie od języka czy rodzaju
kodowania znaków). Problem stanowią tylko te pliki, które są chronione hasłem lub są zaszyfrowane. Tak
jak wspomniano z plików PDF bez problemu wyodrębniana jest zawartość tekstowa. Natomiast obrazy
umieszczone w treści takiego dokumentu nie są jak na razie indeksowane. Aby Google było w stanie
zindeksować obrazy należy umieścić je na stronie HTML.
705048383.005.png 705048383.006.png
Indeksowanie linków występujących w dokumencie PDF
Odnośniki umieszczone w plikach PDF są traktowane podobnie jak linki HTML. Oznacza to, że przekazują
wskazywanym stronom swój PageRank, anchor tekst linku oraz inne sygnały dotyczące indeksowania.
Innymi słowy roboty wyszukiwarki Google są w stanie podążać za linkami umieszczonymi w plikach PDF i
co ważne linki te są zliczane do rankingu pozycji stron. Odnośniki umieszczone w pliku PDF posiadają
jednak również pewne ograniczenia w stosunku do linków wykorzystywanych w dokumentach HTML, a
mianowicie nie można nadawać im atrybutów, np. „ nofollow ”.
Wizytówka strony z dokumentem PDF w wynikach wyszukiwania
Tytuł prezentowany w SERP dla strony będącej piklem PDF tworzony jest na podstawie dwóch elementów,
a mianowicie: tytułu z metadanych pliku oraz anchor tekstów linków prowadzących do pliku. Aby mieć
pewność, że Google będzie pokazywało właściwy tytuł w wynikach wyszukiwania, odpowiednią treść
należy umieścić w obu wymienionych elementach.
Pliki PDF w rankingu Google
Pliki PDF zazwyczaj osiągają podobne pozycje w rankingu wyszukiwarki jak pliki HTML. Rodzaj pliku nie
ma tu żadnego znaczenia, ważna jest natomiast sama zawartość dokumentu. W przypadku niektórych
zapytań, można nawet spotkać się z przewagą w TOP10 plików PDF nad stronami HTML. Na tę wyższość
PDFów nad stronami w HTML wpływa przede wszystkim fakt, że zazwyczaj posiadają one rozbudowana i
unikalną zawartość tekstową, a to jest wysoko oceniane przez algorytmy wyszukiwarek internetowych.
Usuwanie plików PDF z indeksu wyszukiwarki
W przypadku plików HTML najprostszym sposobem na to, aby nie były indeksowane jest dodanie do nich
metatagu robots o wartości noindex . A co z plikami PDF? Kiedy zależy nam na tym, aby dany plik PDF nie
705048383.007.png
był indeksowany przez wyszukiwarkę Google wówczas najlepiej do nagłówka HTTP takiego pliku dodać
X-Robots-Tag o wartości noindex . W taki sam sposób należy postąpić w przypadku tych plików, które
znalazły się już w indeksie Google (chociaż nie powinny). Jeżeli jednak istotne jest ich szybkie usunięcie,
wówczas warto dodatkowo pokusić się o użycie narzędzia do usuwania adresów URL dostępnego w GWT.
Duplikowanie treści
Wielu webmasterów nie do końca zdając sobie sprawę z tego jak wyszukiwarka indeksuje
zawartość plików PDF tworzy i umieszcza w serwisie drugą wersję takiego dokumentu wykorzystują do
tego celu HTML. Działanie takie nie wpływa korzystnie na pozycje ani jednej ani drugiej wersji strony, czy
jednak może powodować występowanie zjawiska double content ? Prawdopodobnie tak, Google zachęca do
tego, aby zawartość udostępniać tylko w jednym wybranym formacie (oczywiście lepiej w HTML). W
sytuacji, kiedy z jakiegoś powodu obie wersje są niezbędne zalecane jest wskazanie preferowanego adresu
URL albo poprzez odpowiedni wpis w sitemapie, albo poprzez dodanie tagu kanonicznego.
Więcej na temat najlepszych praktyk dotyczących optymalizacji plików PDF można dowiedzieć się z uwag
Matta Cuttsa jakie przedstawił w zamieszczonym poniżej wideo.
Źródło: http://googlewebmastercentral.blogspot.com/2011/09/pdfs-in-google-search-results.html
Rating: 10.0/ 10 (1 vote cast)
Rating: +1 (from 1 vote)
Lubię to! Lubiane przez 6 osób. Rejestracja , aby zobaczyć, co lubią Twoi znajomi.
1 osoba dała +1
Tagi: Googleindeksowanie stronPDF Artykuł napisany przez: Ewa
Zadaj pytanie lub zgłoś uwagę
705048383.008.png
Nowy wygląd strony iGoogle
Wielokrotne linki do tej samej strony
Add a comment...
Comment using...
Waldek Dudziński · Krefeld, Germany
PDF = HTML tylko nie fotki w pdf a optymalizacja potrzebna jak wszedzie
pozdrawiam
http://praca-elektryk.pl/
Reply · Like · September 29 at 9:46am
Facebook social plugin
Dodaj komentarz
WYŚLIJ
Poinformuj mnie o nowych komentarzach na e-mail. Możesz także SUBSKRYBOWAĆ ten wpis bez
komentowania.
705048383.001.png 705048383.002.png 705048383.003.png
Performance Media na
Facebooku
Lubię to!
Liczba osób, które lubią Performance Media:
1,255.
Beata
Artur
Michał
Monika
Jacek
ﻲﻟﻮﻟ
Mateusz
Paweł
Carl
Anna
Radek
Marcin
Paulina
Doug
Asia
Dariusz
Wtyczka społecznościowa Facebooka
Poleć blog innym:
+1 od 89 osób
Statystyki
Statystyki wyszukiwarki Google
705048383.004.png
Zgłoś jeśli naruszono regulamin