Google 如何发现网站和网页

2.1.1 Googlebot 如何发现你的网站

1.透过www.google.com/addurl提交网站
2.从其他已加入索引网站中发现导引到你网站的连结
3.注册“Google网站管理员工具”
4.已加入索引的网页重新导入另一个新的网页,透过301重定向。

2.1.2 需要多久的时间Google才会检索你的网站

使用上节其中一种方式,一个月内就会检索。透过Google网站管理员工具是最有效的。

2.1.3 Googlebot 对你的网站做了什么

到网站后检索每一网页,有内部连结纪录,然后下次再去这个连结。其检索方式就像树的方式!

2.1.4 控制Googlebot

2.1.5 网站地图

1.建立网站地图

Sitemap.org 制定了一些标准协议:

必须使用<urlset>标签开始,</urlset>结束。
必须在<urlset>内指定命名空间。命名空间是所使用的协议或规则集,其网址必须紧跟在”xmlns”之后,以表示是xml的命名空间。
每个网址都需以一个<url>标签加入为XML父标签。
每个<url>父标签都必须加入一个<loc>子项。

另外我看了自己的sitemap.xml另有一些标签:

<priority> 告诉Google这个网址与其他网址的相对重要性,有效值0.0到1.0,预设0.5。
<lastmod>定义网页的最后修订时间,以W3C日期格式撰写,例如:<lastmod>2009-12-19T14:13:11+00:00</lastmod>
<changefreq>定义网页修改的频率,有效值有:

always:每次搜寻蜘蛛来存取时,页面都有修改
hourly、daily、weekly、monthly、yearly
never:这只是用来存档的网址

<priority>标签,建议首页设定为0.9,主题页:0.8,分类页:0.7,重要内容网页:0.6(例如登录页面或付款页面),比较不重要网页:0.3,用来归档的内容网页:0.2
只对部落格或新闻相关网页使用<lastmod>,用不着加上时间标记。
<changefreq>也没什么用。
一个有用的XML网站地图验证工具:www.xml-sitemaps.com/validate-xml-sitemap.html

2.引用网站地图

robot.txt的使用,参考:www.robotstxt.org

3.提交网站地图

http://submissions.ask.com/ping?sitemap=http://job.achi.idv.tw/sitemap.xml

http://api.moreover.com/ping?u=http://job.achi.idv.tw/sitemap.xml

Google网站管理员工具:http://www.google.com.tw/webmasters

Yahoo!站长工具:http://siteexplorer.search.yahoo.com/mysites

ㄚ琪备注,上述的工具在Wordpress的‘WordPress 专用 XML 网站地图产生器 3.2.2 ’这个外挂程式可以帮助我们,应该很好便才是!