Sitemap Protocol
Specyfikacja Sitemap Protocol (obecnie wersja 0.9) powstała z inicjatywy firm: Google, Yahoo i Microsoft. Określa ona format plików XML-owych, tzw. sitemaps, przeznaczonych do informowania wyszukiwarek internetowych o zasobach witryny WWW.
Spis treści |
[edytuj] Opis
Plik sitemap składa się z listy stron danej witryny, które powinny być uwzględnione przez roboty wyszukiwarek internetowych. Każdej pozycji listy zawiera następujące parametry:
- URL danej strony;
- przewidywaną częstotliwość zmian treści tej strony (always, hourly, daily, weekly, monthly, yearly, never);
- opcjonalny priorytet strony, czyli ważność danej strony w stosunku do innych na tej witrynie, określaną jako liczbę z przedziału domkniętego od 0 do 1.
Sitemaps pozwalają webmasterom w prosty sposób zasugerować wyszukiwarkom, które strony powinny być zindeksowane, jak często zmienia się ich zawartość oraz jaka jest ich relatywna waga w danym serwisie.
Utworzenie pliku sitemap z listą URL-i nie oznacza, że roboty wyszukiwarek będą się ograniczały tylko do stron z tej listy. Na pewno jednak wezmą je pod uwagę, więc dobrym kandydatem do umieszczenia w sitemap będzie indeks stron witryny.
Specyfikacja "Sitemap Protocol" jest wykorzystywana m.in. przez wyszukiwarki Google i Ask; przypuszczam, że również Yahoo i Microsoft z niej korzystają, skoro przyczyniły się do jej powstania.
Specyfikacja została opublikowana na licencji CC-BY-SA 2.5 (Creative Commons Attribution Share-Alike 2.5).
[edytuj] Generowanie sitemap
Zgodny ze specyfikacją plik sitemap należy umieścić w takim miejscu, by był dostępny poprzez serwer WWW obsługujący witrynę; zalecaną lokalizacją jest katalog bazowy serwera WWW, (np. http://www.example.com/my_sitemap.xml).
Plik można utworzyć ręcznie bądź skorzystać z jakiegoś narzędzia; np. Google udostępnia w tym celu program Google Sitemap Generator.
[edytuj] Zgłaszanie sitemap wyszukiwarkom
Wyszukiwarki muszą się jakoś dowiedzieć, że witryna ma plik typu sitemap. W przypadku Google, za pierwszym razem trzeba mapę zgłosić za pomocą serwisu Google Webmaster Tools, później jest już automatycznie ładowana. W przypadku wyszukiwarki Ask można wykorzystać plik robots.txt, umieszczając w nim wiersz wskazujący na URL pliku z mapą, np.:
SITEMAP: http://www.example.com/my_sitemap.xml
W praktyce nie wydaje się to jednak działać.
[edytuj] Przykład
Załóżmy, że mamy witrynę pod adresem http://www.example.com/, gdzie znajduje się jej główna strona. Ponadto mamy stronę z "newsami": http://www.example.com/news.php, codziennie uaktualnianą, oraz indeks stron archiwalnych pod adresem http://www.example.com/archive.html, modyfikowany raz na parę miesięcy.
Chcąc zasugerować wyszukiwarkom, że strona główna jest dla naszego serwisu bardzo istotna i może zmieniać się codziennie, strona z newsami jest może mniej ważna, ale jej zawartość może ulec zmianie nawet co godzinę, a archiwum ─ mniej więcej raz na miesiąc, możemy utworzyć następujący plik XML:[1]
<?xml version="1.0" encoding="UTF-8"?>
<urlset
xmlns="http://www.google.com/schemas/sitemap/0.84"
xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance"
xsi:schemaLocation="http://www.google.com/schemas/sitemap/0.84
http://www.google.com/schemas/sitemap/0.84/sitemap.xsd">
<url>
<loc>http://www.example.com/</loc>
<changefreq>weekly</changefreq>
<priority>1.0</priority>
</url>
<url>
<loc>http://www.example.com/news.php</loc>
<changefreq>hourly</changefreq>
<priority>0.5</priority>
</url>
<url>
<loc>http://www.example.com/archive.php</loc>
<changefreq>monthly</changefreq>
<priority>0.1</priority>
</url>
</urlset>
[edytuj] Zobacz też
- ↑ Przykład na podstawie pliku wygenerowanego przez program Google Sitemap Generator.