Sitemap Protocol

Z funus.net

Specyfikacja Sitemap Protocol (obecnie wersja 0.9) powstała z inicjatywy firm: Google, Yahoo i Microsoft. Określa ona format plików XML-owych, tzw. sitemaps, przeznaczonych do informowania wyszukiwarek internetowych o zasobach witryny WWW.

Spis treści

[edytuj] Opis

Plik sitemap składa się z listy stron danej witryny, które powinny być uwzględnione przez roboty wyszukiwarek internetowych. Każdej pozycji listy zawiera następujące parametry:

  • URL danej strony;
  • przewidywaną częstotliwość zmian treści tej strony (always, hourly, daily, weekly, monthly, yearly, never);
  • opcjonalny priorytet strony, czyli ważność danej strony w stosunku do innych na tej witrynie, określaną jako liczbę z przedziału domkniętego od 0 do 1.

Sitemaps pozwalają webmasterom w prosty sposób zasugerować wyszukiwarkom, które strony powinny być zindeksowane, jak często zmienia się ich zawartość oraz jaka jest ich relatywna waga w danym serwisie.

Utworzenie pliku sitemap z listą URL-i nie oznacza, że roboty wyszukiwarek będą się ograniczały tylko do stron z tej listy. Na pewno jednak wezmą je pod uwagę, więc dobrym kandydatem do umieszczenia w sitemap będzie indeks stron witryny.

Specyfikacja "Sitemap Protocol" jest wykorzystywana m.in. przez wyszukiwarki Google i Ask; przypuszczam, że również Yahoo i Microsoft z niej korzystają, skoro przyczyniły się do jej powstania.

Specyfikacja została opublikowana na licencji CC-BY-SA 2.5 (Creative Commons Attribution Share-Alike 2.5).

[edytuj] Generowanie sitemap

Zgodny ze specyfikacją plik sitemap należy umieścić w takim miejscu, by był dostępny poprzez serwer WWW obsługujący witrynę; zalecaną lokalizacją jest katalog bazowy serwera WWW, (np. http://www.example.com/my_sitemap.xml).

Plik można utworzyć ręcznie bądź skorzystać z jakiegoś narzędzia; np. Google udostępnia w tym celu program Google Sitemap Generator.

[edytuj] Zgłaszanie sitemap wyszukiwarkom

Wyszukiwarki muszą się jakoś dowiedzieć, że witryna ma plik typu sitemap. W przypadku Google, za pierwszym razem trzeba mapę zgłosić za pomocą serwisu Google Webmaster Tools, później jest już automatycznie ładowana. W przypadku wyszukiwarki Ask można wykorzystać plik robots.txt, umieszczając w nim wiersz wskazujący na URL pliku z mapą, np.:

SITEMAP: http://www.example.com/my_sitemap.xml

W praktyce nie wydaje się to jednak działać.

[edytuj] Przykład

Załóżmy, że mamy witrynę pod adresem http://www.example.com/, gdzie znajduje się jej główna strona. Ponadto mamy stronę z "newsami": http://www.example.com/news.php, codziennie uaktualnianą, oraz indeks stron archiwalnych pod adresem http://www.example.com/archive.html, modyfikowany raz na parę miesięcy.

Chcąc zasugerować wyszukiwarkom, że strona główna jest dla naszego serwisu bardzo istotna i może zmieniać się codziennie, strona z newsami jest może mniej ważna, ale jej zawartość może ulec zmianie nawet co godzinę, a archiwum ─ mniej więcej raz na miesiąc, możemy utworzyć następujący plik XML:[1]

<?xml version="1.0" encoding="UTF-8"?>
<urlset
  xmlns="http://www.google.com/schemas/sitemap/0.84"
  xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance"
  xsi:schemaLocation="http://www.google.com/schemas/sitemap/0.84
                       http://www.google.com/schemas/sitemap/0.84/sitemap.xsd">
 <url>
  <loc>http://www.example.com/</loc>
  <changefreq>weekly</changefreq>
  <priority>1.0</priority>
 </url>
 <url>
  <loc>http://www.example.com/news.php</loc>
  <changefreq>hourly</changefreq>
  <priority>0.5</priority>
 </url>
 <url>
  <loc>http://www.example.com/archive.php</loc>
  <changefreq>monthly</changefreq>
  <priority>0.1</priority>
 </url>
</urlset>

[edytuj] Zobacz też

przypisy
  1. Przykład na podstawie pliku wygenerowanego przez program Google Sitemap Generator.