建立网站的目标在于提高知名度与增加用户流量。搜索引擎优化是增加网站流量的一种方法。另一种方法是使用网站地图,它允许你指定一个搜索引擎收录或索引哪些页面。网站地图这一概念最初由Google开发,最近雅虎与MSN也同意应用这一标准。本周我们对网站地图标准进行说明。
建立网站的目标在于提高知名度与增加用户流量。网站流量的一种方法。另一种方法是使用网站地图,它允许你指定一个搜索引擎收录或索引哪些页面。网站地图这一概念最初由Google开发,最近雅虎与MSN也同意应用这一标准。本周我们对网站地图标准进行说明。
建立标准的需要
搜索引擎利用蜘蛛在互联网上爬行,定位网页并将它们收录到数据库中。这一过程需要大量资源,有时,你希望索引的网页被忽略,而无用的网页却被收录。在网络上搜寻变化与新网页,收录它们并进行相应归类的Google Googlebot蜘蛛就是一个典型的例子。
网站地图为网站明确应索引哪些网页,以及网站中增加了哪些新内容提供了一种方法。基本上,它在搜索引擎与网站间提供一个通信通道。理论上,它通过减少搜索引擎蜘蛛的处理对象来缓解资源负担,但当前网站地图不能代替爬行过程。
网站地图简介
网站地图是一个XML文件,它包含一个网址URL表和相关的属性,详细说明应索引某个特定网站的哪些内容。网站地图必须为UTF-8编码。下面是网站地图文件需要的XML元素:
- <urlset>--网站地图文件以这个标签起始和结束,起始标签必须包括命名空间(xmlns)属性。
- <url>--文件中的每一个网页包含在这个元素之中。
- <loc>--文件中指定的网页的实际地址。它是<url>元素的一个子元素。
文件中还有下列可选元素:
- <lastmod>--<url>元素的一个子元素。它指定最近一次更新网页的时间。
- <changefreq>--<url>元素的一个子元素。它指定网页更新的频率(经常、每小时、每天、每周、每月、每年及从未更新)。
- <priority>--<url>元素的一个子元素。它指定网站内网页相对于其它网页的重要性,有效值为0.0-1.0,默认值为0.5。
下面的网站地图样本说明如何在一个样本网页中应用这些元素。它为一个假定的网站指定主页,以及它的更新频率,上次更新的时间和网站中的优先权。
<?xml version="1.0" encoding="UTF-8"?>
<urlsetxmlns="http://www.sitemaps.org/schemas/sitemap/0.9">
<url>
<loc>http://www.test.com/</loc>
<lastmod>2006-11-20</lastmod>
<changefreq>daily</changefreq>
<priority>0.3</priority>
</url>
</urlset>
网站地图文件的位置由你自己决定,但它的位置决定了可能包含中文件中的URL集。例如,如果上面的样本网站地图文件位于http://www.test.com/sitemap.xml,那么网站地图文件中可能包含任何以网站地图文件存放在网站的根目录下。网站地图文件的大小不得超过10MB。如果一个文件超出这个限制,就需要使用gzip进行压缩。
建立一个网站地图
既然网站地图以XML为基础,就可以方便的使用任何文本编辑器建立并编辑它们,不过也可以应用专门的工具。下面的列表提供了一些当前的工具:
- 网站地图XML文件的工具。
- 网站地图生成工具。
- 网站地图文件的Windows工具。
- 网站地图生成器。
- 网站地图文件的Python脚本。
通告搜索引擎
建立一个网站地图文件后,应该将它提交给一个搜索引擎。每个搜索都拥有自己的网站地图提交界面。Google的Webmaster工具集中包含了一个网站地图提交页面。在使用之前你必须网站地图网站地图为网站指定应收录哪些内容而进行搜索提供了一种方法。它们建立像XML一样的简单文本格式文件,但有许多工具可以帮助你建立网站地图文件。现在,它们只是对当前的处理过程进行补充。
Tony Patton拥有丰富的Java、VB、Lotus及XML方面的知识,是一个专业的应用程序开发人员。
声明:本文内容来源自网络,文字、图片等素材版权属于原作者,平台转载素材出于传递更多信息,文章内容仅供参考与学习,切勿作为商业目的使用。如果侵害了您的合法权益,请您及时与我们联系,我们会在第一时间进行处理!我们尊重版权,也致力于保护版权,站搜网感谢您的分享!