Google Sitemaps
چيست ؟
موتورهاي جستجويي چون گوگل براي جمع آوري اطلاعات وب سايت هاي مختلف از نرم افزارهايي به نام عنكبوت (spider) استفاده مي كنند. وظيفه ي اين نرم افزارها اين است كه به هنگام ورود به يك وب سايت تمامي لينكهاي موجود در آن را شناسايي كرده و به سمت آنها هدايت شوند. بدين ترتيب تمامي صفحات لينك داده شده، مرور شده و اطلاعات آنها در بانكهاي اطلاعاتي گوگل ذخيره مي گردد. اين نرم افزارها به صورت دوره اي اين وب سايت ها را مجددا بررسي مي كنند و از آخرين تغييرات اعمال شده در آنها مطلع مي گردند.
با استفاده از Google Sitemaps كه يكي از جديدترين امكانات موتور جستجوي گوگل است، ارتباط بين وب سايت و اين موتور جستجو بسيار دقيقتر بوده و به عمل به روز رساني اطلاعات در موتور جستجوي گوگل سرعت مي بخشد.
عنكبوت هاي موتورهاي جستجو به راحتي رد لينكهاي صفحات پويا (dynamic) را نمي گيرند و اين بدان معني است كه در صورتي كه وب سايت شما شامل صفحاتي پوياست امكان ثبت نشدن بعضي از صفحات آن در موتورهاي جستجو وجود دارد. در اين هنگام است كه Google Sitemaps به كمك شما مي آيد و كار معرفي چنين لينكهايي را انجام مي دهد.
وجود چنين تكنيكي به هيچ عنوان به اين معني نيست كه نحوه كار سنتي موتور جستجوگر گوگل از بين مي رود. اين تكنيك تنها روشي براي تسريع در عمل جمع آوري اطلاعات سايتها است و مجهز نبودن سايتها به اين ابزار به عنوان ضعف وب سايت مذكور تلقي نمي شود.
برنامه Google Sitemaps به صورت مجاني عرضه شده است و بايد به اين نكته توجه نمود كه استفاده از آن به هيچ عنوان در رتبه وب سايت شما در نتايج گوگل تاثيري نخواهد داشت. اين برنامه در راستاي اهداف شركت گوگل طراحي شده است و اميد آن مي رود كه با استفاده از آن نتايج سودمندي به هنگام جستجوي وب مشاهده گردد.
نحوه استفاده از Google Sitemaps
براي استفاده از اين ابزار، طي مراحل زير الزاميست:
1. ساخت sitemap معتبر
2. اضافه كردن sitemap مذكور به حساب كاربري خود در Google Sitemaps
3. به روز نمودن فايل sitemap خود به هنگام تغيير در سايت خود
استفاده از Google Sitemaps براي همه وب سايتها امكان پذير است. لذا چه سايت شما در برگيرنده يك صفحه است و چه شامل ميليونها صفحه پوياست اين روش براي معرفي وب سايتتان به موتورهاي جستجو توصيه مي گردد.
ساخت sitemap
در اين مقاله نحوه ساخت فايل sitemap كه در واقع يك فايل xml است را شرح خواهم داد
فرمت مخصوص فايل XML مورد نياز
در فايل xmlي كه به عنوان sitemap مورد استفاده قرار مي گيرد ميبايست از كد گذاري UTF-8 استفاده شود. در زير نمونه ي يك فايل sitemap ساده كه تنها شامل يك آدرس بوده و در آن از تمامي تگهاي اختياري استفاده شده است را مشاهده مي كنيد:
|
<?xml version="1.0" encoding="UTF-8"?>
< urlset xmlns="http://www.google.com/schemas/sitemap/0.84">
< url>
< loc>http://www.example.com/</loc>
< lastmod>2005-01-01</lastmod>
< changefreq>monthly</changefreq>
< priority>0.8</priority>
</url>
</urlset>
|
نکات :
1. فايل sitemap حتما بايد با تگ آغازين <urlset> شروع شده و با تگ پاياني </urlset> خاتمه يابد.
2. تگ <url> به عنوان تگ منشاء (parent) براي هر آدرس معرفي شده استفاده گردد.
3. براي معرفي هر آدرس از تگ <loc> استفاده شود.
توضيح تگ هاي مورد استفاده
<urlset> (اجباري)
مشخص كننده نوع استاندارد مورد استفاده در فايل xml
<url> (اجباري)
تگ منشاء براي آدرس هاي معرفي شده. تگهاي بعدي در بين دو تگ ابتدايي و انتهايي اين تگ قرار مي گيرند.
<loc> (اجباري)
مشخص كننده آدرس صفحه معرفي شده. آدرس وارد شده در اين قسمت، مي بايست به صورت كامل وارد شود (پروتكل استفاده شده + آدرس) و نبايد بيش از 2048 كاراكتر باشد.
<lastmod> (اختياري)
مشخص كننده ي آخرين زمان اعمال تغييرات در صفحه معرفي شده كه با استاندارد ISO 8601 تعيين مي گردد. (الگوي كلي به شكل YYYY-MM-DDThh:mm:ss+00:00 است و در آن تعيين زمان اختياري است)
<changefreq> (اختياري)
با استفاده از اين تگ، دوره ي زماني به روز رساني صفحه معرفي شده را تعيين نماييد. براي مثال اگر آدرس صفحه مشخص شده، آدرس وبلاگ شماست، به دليل به روز رساني مداوم وبلاگ در ساعات مختلف روز و تمايل شما در به روز بودن اطلاعات ثبت شده در موتورهاي جستجو، مناسب ترين مقدار براي اين تگ مقدار always به نظر مي رسد.
به زباني ديگر اين تگ مشخص كننده ي آن است كه فايل معرفي شده در چه بازه هاي زماني اي به روز مي شود و بدين ترتيب نرم افزارهاي مرور صفحات در موتورهاي جستجو در دوره هاي زماني متناسب با مقدار تعيين شده، اين فايل را مورد بررسي قرار مي دهند.
از ديگر مقادير مورد قبول اين تگ مي توان به hourly و daily و weekly و monthly و yearly و never اشاره نمود كه به نظر نيازي به توضيح تك تك آنها نيست!
<priority> (اختياري)
با استفاده از اين تگ ارجحيت نسبي صفحه معرفي شده را نسبت به ديگر صفحات سايت خود بيان نماييد. مقدار اين تگ تاثيري در مقايسه صفحات سايت شما با صفحات ديگر سايت ها ندارد و تنها به گوگل اهميت صفحات مورد نظر شما را اطلاع مي دهد. با استفاده از اين مشخصه اولويت مرور و بازخواني صفحات را به spiderهاي موتور جستجو اطلاع دهيد.
مقدار معتبر تخصيص داده شده به اين تگ بين 0.0 و 1.0 مي باشد كه 0.0 نشان دهنده درجه پايين اهميت و 1.0 نشانه پر اهميت بودن صفحه معرفي شده است.
مجددا تاكيد ميكنم كه مقدار تخصيص داده شده به اين تگ تاثيري در محل قرارگيري سايت شما در نتايج جستجوي نمايش داده شده در موتور جستجوي گوگل نخواهد داشت.
نکات اضافي:
علاوه بر آن كه كدگذاري فايل xml بايد utf-8 باشد، براي كاراكترهاي زير نيز بايد از معادل اسكيپ كد (Escape Code) آنها استفاده شود.
|
& ---> &
' ---> '
" ---> "
> ---> >
< ---> <
|
براي مثال به آدرس زير دقت نماييد:
|
http://www.example.com/ümlat.html&q=name
|
آدرس بالا اگرچه صحيح است ولي براي استفاده در فايل sitemap ميبايست آن را به آدرس زير تبديل نماييد:
|
http://www.example.com/%C3%BCmlat.html&q=name
|
فايل sitemap نمونه :
در زير نمونه اي از يك فايل sitemap جهت آشنايي بيشتر آورده شده است.
|
<?xml version="1.0" encoding="UTF-8"?>
<urlset xmlns="www.google.com/schemas/sitemap/0.84">
<url>
<loc>http://www.example.com/</loc>
<lastmod>2005-01-01</lastmod>
<changefreq>monthly</changefreq>
<priority>0.8</priority>
</url>
<url>
<loc>http://www.example.com/catalog?item=12&desc=vacation_hawaii</loc>
<changefreq>weekly</changefreq>
</url>
<url>
<loc>http://www.example.com/catalog?item=73&desc=vacation_new_zealand</loc>
<lastmod>2004-12-23</lastmod>
<changefreq>weekly</changefreq>
</url>
<url>
<loc>http://www.example.com/catalog?item=74&desc=vacation_newfoundland</loc>
<lastmod>2004-12-23T18:00:15+00:00</lastmod>
<priority>0.3</priority>
</url>
<url>
<loc>http://www.example.com/catalog?item=83&desc=vacation_usa</loc>
<lastmod>2004-11-23</lastmod>
</url>
</urlset>
|
براي كاهش حجم فايل sitemap خود و در نتيجه استفاده كمتر از پهناي باند سايت خود ميتوانيد فايل ساخته شده را با استفاده از gzip فشرده كرده و از آن استفاده نماييد. در اينجا ذكر اين نكته مهم است كه فايل ساخته شده در حالت معمول (فشرده نشده) نبايد فضاي بيش از 10 مگابايت را اشغال كند.
منبع: Irinfotech