帝国模板之家为广大用户提供专业、一站式建站服务。

杂谈

本栏目分享互联网,程序员的那些事。

当前位置:首页 > 杂谈 > 正文

百度搜索资源平台【重要提醒】请及时清理历史sitemap文件

帝国模板之家 2020-10-31 杂谈 评论

今天收到百度搜索资源平台发送的短信。最近不少站长都应该受到这样一条重要提醒:尊敬的搜索合作伙伴: 您好!为了提升站点新资源的处理效率,避免旧数据过多造成站点数据抓取与处理异常,请于11月9日之前尽快删除超出站点配额的历史sitemap文件(包括普通收录与死链数据)。感谢您的关注与支持!

这个是什么意思呢?下面帝国模板之家小编给大家来聊聊。

首先我们来看看什么是sitemap和死链、死链提交工具。

sitemap

Sitemap(即站点地图)就是您网站上各网页的列表。创建并提交Sitemap有助于百度发现并了解您网站上的所有网页。您还可以使用Sitemap提供有关您网站的其他信息,如上次更新日期、Sitemap文件的更新频率等,供百度Spider参考。
百度对已提交的数据,不保证一定会抓取及索引所有网址。但是,我们会使用Sitemap中的数据来了解网站的结构等信息,这样可以帮助我们改进抓取策略,并在日后能更好地对网站进行抓取。
此外,Sitemap 与搜索排名没有关系。 

死链

页面已经无效,无法对用户提供任何有价值信息的页面就是死链接,包括协议死链和内容死链两种形式:
  1)协议死链:页面的TCP协议状态/HTTP协议状态明确表示的死链,常见的如404、403、503状态等。
  2)内容死链:服务器返回状态是正常的,但内容已经变更为不存在、已删除或需要权限等与原内容无关的信息页面。
  目前内容死链召回存在召回率的风险,所以建议各位站长尽量使用协议死链,以保证平台工具更好地发挥其作用。

死链工具

当网站死链数据累积过多时,并且被展示到搜索结果页中,对网站本身的访问体验和用户转化都起到了负面影响。另一方面,百度检查死链的流程也会为网站带来额外负担,影响网站其他正常页面的抓取和索引。

对于百度这个提醒:作为个人站长的我是这样理解的。

如果你是一个老网站,在长周期运营的过程中,如果已提交过大量的sitemap地图文件,而这个sitemap文件超出了百度搜索资源匹配的配额,这时候百度要求我们可以合理性的选择去删除一部分,否则截止到规定时期,系统可能会自动从最早的开始删除。

另一层含义是节省站长提交的数据资源,把百度配额分配到给网站有价值的目标URL。其实就是让站长把网站的资源等级话,把网站重点突出,这样更利于百度了解网站结构和有价值的页面。

针对这个原因,个人认为应该是sitemap百度地图处于被滥用的状态,或者说提交资源过多,已经造成百度抓取频率下降。因此需要百度这次通知是强化网站资源的有效利用,避免过度的sitemap提交造成资源浪费。

因此个人站长需要在sitemap尽可能设定优质的页面,另外筛选掉已收录的页面。

死链如果已经被抓取过了也不必重复提交。

遗憾,悲伤,喜悦,怨恨,人们在不同时期,会流不同性质的眼泪。 情绪最好不要强行压抑,想哭就哭,想笑就笑,这样反而有利于身心。

已有 位小伙伴发表了看法

欢迎 发表评论

  • 匿名发表

关于

帝国cms模板

帝国手册

帝国模板之家 | www.moyouyouw.cn

本站所有模板/文章除标明原创外,均来自网络转载,版权归原作者所有,如果有侵犯到您的权益,请联系站长删除,谢谢! 寻找帝国cms模板首选帝国模板之家,用心做站,上线至今广受好评,值得信赖!

  • 交流群1:帝国cms交流群1
  • 交流群2:帝国cms交流群2
在线QQ 给我留言