一、通过robots.txt文件定义提交
各大搜索引擎都发布了对[u][b]网站地图[/b][/u]的新的支持方式,就是在robots.txt文件里直接包括sitemap文件的链接。
就像这样:
Sitemap:http://www.startcn.net/sitemap.xml
目前对此表示支持的搜索引擎公司有Google, Yahoo, Ask and MSN。
而中文搜索引擎公司,显然不在这个圈子内。
这样做的好处就是,站长不用到每个搜索引擎的站长工具或者相似的站长部分,去提交自己的sitemap文件,搜索引擎的蜘蛛自己就会抓取robots.txt文件,读取其中的sitemap路径,接着抓取其中相链接的网页。
这里基于一个假设,robots.txt已然是一个标准,所有的网站至少都有一个,而sitemap还正在建立标准中,这样的做法,可以让站长减轻工作,而且如果他们不需要更为详细的索引和搜索的资料的话,那么就只需要包括sitemap到robots.txt就可以了。
二、登录网站提交
向Google提交网站地图:
https://www.google.com/webmasters/tools/login?hl=zh_CN
1、进入这个网址,用你的Google帐户登录,然后添加你的网址;
2、接下来按照Google的要求验证你网站,你可以选择html文件验证。
3、这时候,按照Google的要求,制作一个Google要求的文件名的html文件
4、用FTP讲这个html文件和你的xml格式的网站地图文件一起传到你网站的根目录
5、确认验证,回到控制台,添加你的地图文件就OK了。很快,Google就会根据网站地图文件来更新你的网站
向yahoo提交网站地图:
英文yahoo提交网址:
http://siteexplorer.search.yahoo.com/
首先用FTP讲你的网站地图传到网站的根目录。打开网址后,选择Submit Your Site for Free: 用yahoo帐户登录,然后输入你的网站地图的URL就可以了。
中文Yahoo的提交网址:
http://sitemap.cn.yahoo.com/mysites
这个操作和Google的差不多,登录、验证网站、提交网址地图URL。
向MSN提交网站地图Sitemap:
用URL直接提交:http://api.moreover.com/ping?u=http://your.domainname/sitemap.xml
这是向MSN直接提交网站地图的后门URL
向ASK提交网站地图Sitemap:
直接提交。http://submissions.ask.com/ping?sitemap=http://your.domainname/sitemap.xml
向百度Baidu提交网站地图Sitemap:
没办法,现在百度不支持Sitemap。但可通过http://www.baidu.com/search/url_submit.html来提交你的网址。百度会自行搜索,更新速度很快。
原来Live Search也有类似GOOGLE的网站管理员工具。
有需要的来自己研究吧。用MSN帐号登录既可。
Live Search SITEMAP提交地址http://webmaster.live.com/webmaster/ping.aspx?siteMap=http://XXXXXX.xml
“Sitemap 详细信息”页会列出 Google 通过您的 Sitemap 找到的所有错误,以及有关潜在问题的警告。看过您的 Sitemap 并进行任何更改后,请将其保存并重新提交。Google 处理重新提交的 Sitemap 最长可能需要一天时间,因此警告状态也可能持续显示一天。
重新提交 Sitemap:
错误
下面列出了最常见的 Sitemap 错误。如果您看见 XML 错误,请参阅 Sitemap 协议指南。
| 压缩错误 | Google 尝试对压缩的 Sitemap 文件解压缩时遇到了错误。重新压缩 Sitemap(使用诸如 gzip 的工具),将其上传到您的网站,然后重新提交。 |
| Sitemap 为空 | Google 下载了 Sitemap 文件,但其中不包含任何网址。请检查 Sitemap 文件,确保其不为空。如果 Sitemap 使用 Google Sitemap 协议,请进行验证以确保对网址作了正确标记。然后,重新提交 Sitemap。 |
| 属性值无效 | Google Sitemaps 支持的包含属性值的唯一文件为联合供稿。例如,在下列 Atom 供稿摘要中,href 是属性。
<link rel="alternate" type="text/html"
href="http://www.example.com/index.html"/>
例如,如果 href 属性设置为下列值,您将会看到此错误: href="htp:/www.example.com/index.html" ? 修正此值后,请重新提交 Sitemap。? |
| 日期无效 | Sitemap 包含一个或多个无效日期,可能是因为日期格式错误或日期本身无效。日期需要使用 W3C Datetime 编码,但可以忽略时间部分。例如,以下两个示例都有效:
如果指定了时间但未指定时区,格式正确的日期也可能无效。未指定时间的日期有效(取默认时间 00:00:00Z)。 |
| 标记值无效 | 标记是 XML 元素。例如,在下列摘要中,<loc> 为标记。
<url> <loc>http://www.example.com/</loc> <lastmod>2005-01-01</lastmod> <changefreq>monthly</changefreq> <priority>0.8</priority> </url> ? 标记的值即起始标记和结束标记之间的内容。在此示例中,http://www.example.com/ 位于起始标记 <loc> 和结束标记 </loc> 之间,因此它是 <loc> 标记的值。 如果您看到此错误,则表示您的 Sitemap 中包含带有无效值的标记。错误消息中会列出标记及其所在行号。有关 Sitemap 协议中有效标记值的详情,请参阅协议文档。修正此值后,请重新提交 Sitemap。 |
| 网址无效 | 所列网址无效。请更正 Sitemap 中的网址,然后重新提交。
确保 Sitemap 中列出的网址已经过编码,便于识别和正确转义。您也可以将网址复制到浏览器,看看浏览器是否能识别网址并加载网页。 确保网址中未包含额外的字符(例如,确保网址没有加引号)。 |
| 网址无效:我们检测到您列出的 Sitemap 含不完整网址。 | Sitemap 索引文件会列出 Sitemap。您应使用完整的网址(例如,http://www.example.com/sitemap.xml)列出每个 Sitemap。如果您只使用文件名(例如,sitemap.xml)列出 Sitemap,则会看到此错误。
我们将从 Sitemap 索引文件所在的同一目录检索该 Sitemap。例如,如果您的 Sitemap 索引文件位于 http://www.example.com/folder1/sitemap_index.xml 并且将 Sitemap 列为 sitemap.xml,我们会在 http://www.example.com/folder1/sitemap.xml 上检索该 Sitemap。如果在这里找不到,您会看到此次尝试出错。 |
| XML 无效:标记过多 | 标记是 XML 元素。例如,在下列摘要中,<loc> 为标记。
<url> <loc>http://www.example.com/</loc> <lastmod>2005-01-01</lastmod> <changefreq>monthly</changefreq> <priority>0.8</priority> </url> ? 如果您看见此错误,则表示您的 Sitemap 中包含重复的标记。例如,下列原因可导致此错误(因为 <loc> 标记列出了两次): <url> <loc>http://www.example.com/</loc> <loc>http://www.example.com/page1.html</loc> <lastmod>2005-01-01</lastmod> <changefreq>monthly</changefreq> <priority>0.8</priority> </url> 错误消息中会列出标记及其所在行号。修正此重复错误后,请重新提交您的 Sitemap。 |
| XML 属性缺失 | Google Sitemaps 支持的包含属性值的唯一文件为联合供稿。例如,在下列摘要中,<href> 为属性。
<link rel="alternate" type="text/html"
href="http://www.example.com/index.html"/>
? 例如,如果 href 属性缺失,您将会看到此错误。添加属性并赋予有效的值后,请重新提交 Sitemap。 |
| XML 标记缺失 | 标记是 XML 元素。例如,在下列摘要中,<loc> 为标记。
<url> <loc>http://www.example.com/</loc> <lastmod>2005-01-01</lastmod> <changefreq>monthly</changefreq> <priority>0.8</priority> </url> 如果您的 Sitemap 文件缺少必要的标记,可能会看到此错误。例如,在下列摘要中,<loc> 标记缺失,将会触发此错误。 <url> <lastmod>2005-01-01</lastmod> <changefreq>monthly</changefreq> <priority>0.8</priority> </url> 请记下列出的行号并查看协议文档,了解所需标记的详情。修正 Sitemap 后,请重新提交。 |
| 嵌套索引 | 您的 Sitemap 索引列出了它自己的网址或其他 Sitemap 索引的网址。Sitemap 索引文件无法列出 Sitemap 索引文件。 |
| 分析错误 | Google 已在 Sitemap 中检测到 XML 分析错误。有关 XML 验证的详情,请参阅验证 Sitemap。 |
| 临时错误 | 我们的系统遇到了一个临时性问题。出现此错误时,一般无须重新提交 Sitemap。Google 稍后会再次检索 Sitemap。请稍后再回来看看检索是否成功。如果好几小时后此错误仍存在,则可以重新提交 Sitemap。 |
| Sitemap 过多 | Sitemap 索引中的 Sitemap 列表超出了允许的最大数量。Sitemap 索引最多可以包含 1,000 个 Sitemap。请将 Sitemap 索引拆分为多个 Sitemap 索引文件,并确保每个 Sitemap 索引文件所包含的 Sitemap 不超过 1,000 个。然后,分别重新提交单独的 Sitemap 索引文件。 |
| 网址过多 | Sitemap 中的网址列表超出了允许的最大数量。Sitemap 可以包含最多 50,000 个网址。将您的 Sitemap 拆分为多个 Sitemap,并确保每个所包含的网址不超过 50,000 个。也可以使用 Sitemap 索引管理 Sitemap。然后,请单独提交 Sitemap 索引或 Sitemap 文件。 |
| 文件格式不受支持 | 您的 Sitemap 格式可能不受支持。请确保其合乎 Sitemap 指南要求并重新提交。
可检查如下内容:
|
| 不允许的网址 | Google 检测到某些网址位于比 Sitemap 文件位置高的级别或不同域名中。如果出现此错误,请尝试将 Sitemap 文件移动到网站更高级别的位置,然后再次提交。例如,如果 Sitemap 列在 http://www.example.com/mysite/sitemap.xml 下,则以下网址对此 Sitemap 无效:
您还应该检查所有以 Sitemap 位置的域名开头的网址。例如,如果 Sitemap 列在 http://www.example.com/sitemap.xml 下,则以下网址对此 Sitemap 无效:
Sitemap 中任何未被拒的网址通常都会进行处理。 |
| 路径不符:我们检测到您使用不含 www 前缀的网址路径提交了 Sitemap。 | 我们检测到您使用不含 www 前缀的网址路径(例如,http://example.com/sitemap.xml)提交了 Sitemap,但 Sitemap 内列出的网址却使用了 www 前缀(例如,http://www.example.com/myfile.htm)。
要修正此问题,您应决定使用哪种方式编制网址索引。 如果您要使用 www 前缀编制网址索引,则应从您的 Google Sitemaps 帐户中删除 Sitemap 并使用含 www 前缀的路径(例如,http://www.example.com/sitemap.xml)重新提交。如果选择此选项,则不需要修改 Sitemap 内的网址。 如果您不希望使用 www 前缀来编制网址索引,则应修改 Sitemap 并删除其中列出的网址中的 www,然后重新提交 Sitemap。 |
| 路径不符:我们检测到您使用含 www 前缀的网址路径提交了 Sitemap。 | 我们检测到您使用含 www 前缀的网址路径(例如,http://www.example.com/sitemap.xml)提交了 Sitemap,但 Sitemap 内列出的网址却没有使用 www 前缀(例如,http://example.com/myfile.htm)。
要修正此问题,您应决定使用哪种方式编制网址索引。 如果您要使用 www 前缀编制网址索引,则应修改 Sitemap 并在其中列出的网址中添加 www,然后重新提交 Sitemap。 如果您不使用 www 前缀编制网址索引,则应从您的 Google Sitemaps 帐户中删除 Sitemap 并使用不含 www 前缀的路径(例如,http://example.com/sitemap.xml)重新提交。如果选择此选项,则不需要修改 Sitemap 内的网址。 |
| 错误命名空间 | 如果您看到此错误,则表示我们检测到您的根元素没有指定默认的命名空间。命名空间应如下指定:
xmlns="http://www.sitemaps.org/schemas/sitemap/0.9" ? 以下原因也可导致此错误:
Sitemap 文件的开始部分应如下所示: <?xml version="1.0" encoding="UTF-8"?> <urlset xmlns="http://www.sitemaps.org/schemas/sitemap/0.9"> Sitemap 索引文件的开始部分应如下所示: <?xml version="1.0 " encoding="UTF-8"?> <sitemapindex xmlns="http://www.sitemaps.org/schemas/sitemap/0.9"> ? |
| 开头的空格 | 我们发现您的 Sitemap 文件以空格开头。我们接受该文件,但您最好删除该空格,以使文件符合 XML 标准。
XML 文件的开头部分应当为 XML 声明,指定所用的 XML 版本。如果您看到此错误,则表示我们检测到您的 Sitemap 以空格开头。我们接受此 Sitemap,但会显示错误消息,以便您修改 Sitemap(删除空格),使其符合标准。 |
| 特定的 HTTP 错误 | 如果我们在下载您的 Sitemap 时遇到 HTTP 错误,会列出收到的状态码(例如 404)。请确保您指定的 Sitemap 网址正确且该 Sitemap 位于此位置。然后,重新提交 Sitemap。 |
警告
除了错误之外,我们还会列出通过您的 Sitemap 所找出问题相关的警告。通常,这些警告不会阻止对您的 Sitemap 进行处理。但是,由于这些警告可能会指出您网站的潜在问题,因此建议您仔细查看您的 Sitemap 文件并修复所有发现的问题。
才搬家没几天,我这个BLOG最新发的文章很快就被收录了,可能是设置了SITEMAP的原因吧,文章更新后,它都会自动更新。
http://www.google.cn/search?sourceid=navclient&hl=zh-CN&ie=UTF-8&rls=GFRD,GFRD:2008-15,GFRD:zh-CN&q=site%3awww%2ekaxi%2enet
但是有一个问题,就是我以前写的,搬家搬来的哪些文章好像一篇也没收,不知什么原因,需要分析一下。有知道的告诉我一下。
刚刚又想了个名子,这篇就叫养狗(GOOGLE)吧,写了文章每天等GOOGLE来抓,喂狗,呵呵…好玩
百度算什么呢?猪狗不如,我发的文章好像一篇不抓,一点都没GOOGLE勤快,不甩它了.
看看今天这篇文章什么时候收录,我到时告诉大家….
好,发布了半小时左右收录了,哈哈上图!