常见问题 |
什么是Sitemap?百度邀请回入百度sitemap
2013-06-06 21:55 站云中国
一、什么是Sitemap?
Sitemap(即站点地图)就是您网站上各网页的列表。创建并提交Sitemap有助于百度发现并了解您网站上的所有网页。您还可以使用Sitemap提供有关您网站的其他信息,如上次更新日期、Sitemap文件的更新频率等,供百度Spider参考。 百度对已提交的数据,不保证一定会抓取及索引所有网址。但是,我们会使用Sitemap中的数据来了解网站的结构等信息,这样可以帮助我们改进抓取策略,并在日后能更好地对网站进行抓取。 此外,Sitemap 与搜索排名没有关系。 百度Sitemap协议支持三种格式:文本格式、xml格式、Sitemap索引格式,可以根据自己情况来选择任意一种格式组织sitemap。 具体格式说明及示例如下: 1.第一种格式样例:txt文本格式 在一个txt文本列明需要向百度提交的链接地址,将txt文本文件通过站长平台进行提交 http://www.example.com/repaste/101562698_5230191316.html 此文本文件需要遵循以下指南:
2.第二种格式样例:xml格式 您先了解单个xml数据格式如下:
上述xml sitemap向百度提交了一个url:http://www.yoursite.com/yoursite.html 若有多条url,按照上述格式重复<url></url>之间的片断,列明所有url地址,打包到一个xml文件,向站长平台进行提交。 3.第三种格式样例:Sitemap索引格式 如需提交大量sitemap文件,则可将其列在sitemap索引文件中,然后将该索引文件提交。您无需分别提交每个文件。
有多个sitemap,按上述格式重复<sitemap></sitemap>之间的片断,列明所有sitemap地址,向站长平台进行提交。
第一步,将需提交的网页列表制作成一个sitemap文件,文件格式请阅读百度sitemap协议都支持哪些格式。 第二步,将sitemap文件放置在网站目录下。 比如您的网站为example.com,您已制作了一个sitemap_example.xml的sitemap文件,将sitemap_example.xml上传至网站根目录即example.com/sitemap_example.xml 第三步,登录百度站长平台,确保提交sitemap数据的网站已验证归属。 第四步,进入sitemap工具,点击“添加新数据”,文件类型选择“URL列表”,填写抓取周期和sitemap文件地址(如:www.example.com/sitemap_example.xml),进行提交。
提交完之后,可在sitemap列表里看到提交的sitemap文件,如果sitemap文件里面有新的网站链接,可以选择文件后,点击更新所选,即对更新的网站链接进行了提交。 整体流程如下图:
百度spider会参考设置周期抓取sitemap文件,因此请根据sitemap文件内容的更新(比如增加新url)来设置。 请注意若url不变而仅是url对应的页面内容更新(比如论坛帖子页有新回复内容),不在此更新范围内。sitemap工具不能解决页面更新问题。 sitemap数据提交后,一般在1小时内百度会开始处理。处理完成的时间视文件大小和您设置的抓取周期而定。 百度对已提交的数据,不保证一定会抓取及收录所有网址。是否收录与页面质量相关。 八、我可以压缩我的 Sitemap 吗?它们是否需要用 gzip 压缩? 可以。请使用 gzip 压缩 Sitemap。无论压缩与否,Sitemap 应该小于 10MB(10,485,759字节)。 九、XML格式的 Sitemap 中,“priority”提示会影响我的网页在搜索结果中的排名吗? 不会。Sitemap 中的“priority”提示只是说明该网址相对于您自己网站上其他网址的重要性,并不会影响网页在搜索结果中的排名。 不会。网址在 Sitemap 中的位置并不会影响百度对它的识别或使用方式。 因为转码问题建议最好不要包含中文。 |