本栏目分享互联网,程序员的那些事。
今天收到百度搜索资源平台发送的短信。最近不少站长都应该受到这样一条重要提醒:尊敬的搜索合作伙伴: 您好!为了提升站点新资源的处理效率,避免旧数据过多造成站点数据抓取与处理异常,请于11月9日之前尽快删除超出站点配额的历史sitemap文件(包括普通收录与死链数据)。感谢您的关注与支持!
这个是什么意思呢?下面帝国模板之家小编给大家来聊聊。
首先我们来看看什么是sitemap和死链、死链提交工具。
sitemap
Sitemap(即站点地图)就是您网站上各网页的列表。创建并提交Sitemap有助于百度发现并了解您网站上的所有网页。您还可以使用Sitemap提供有关您网站的其他信息,如上次更新日期、Sitemap文件的更新频率等,供百度Spider参考。
百度对已提交的数据,不保证一定会抓取及索引所有网址。但是,我们会使用Sitemap中的数据来了解网站的结构等信息,这样可以帮助我们改进抓取策略,并在日后能更好地对网站进行抓取。
此外,Sitemap 与搜索排名没有关系。
死链
页面已经无效,无法对用户提供任何有价值信息的页面就是死链接,包括协议死链和内容死链两种形式:
1)协议死链:页面的TCP协议状态/HTTP协议状态明确表示的死链,常见的如404、403、503状态等。
2)内容死链:服务器返回状态是正常的,但内容已经变更为不存在、已删除或需要权限等与原内容无关的信息页面。
目前内容死链召回存在召回率的风险,所以建议各位站长尽量使用协议死链,以保证平台工具更好地发挥其作用。
死链工具
当网站死链数据累积过多时,并且被展示到搜索结果页中,对网站本身的访问体验和用户转化都起到了负面影响。另一方面,百度检查死链的流程也会为网站带来额外负担,影响网站其他正常页面的抓取和索引。
对于百度这个提醒:作为个人站长的我是这样理解的。
如果你是一个老网站,在长周期运营的过程中,如果已提交过大量的sitemap地图文件,而这个sitemap文件超出了百度搜索资源匹配的配额,这时候百度要求我们可以合理性的选择去删除一部分,否则截止到规定时期,系统可能会自动从最早的开始删除。
另一层含义是节省站长提交的数据资源,把百度配额分配到给网站有价值的目标URL。其实就是让站长把网站的资源等级话,把网站重点突出,这样更利于百度了解网站结构和有价值的页面。
针对这个原因,个人认为应该是sitemap百度地图处于被滥用的状态,或者说提交资源过多,已经造成百度抓取频率下降。因此需要百度这次通知是强化网站资源的有效利用,避免过度的sitemap提交造成资源浪费。
因此个人站长需要在sitemap尽可能设定优质的页面,另外筛选掉已收录的页面。
死链如果已经被抓取过了也不必重复提交。
转载请注明来源:百度搜索资源平台【重要提醒】请及时清理历史sitemap文件
本文永久链接地址:https://www.moyouyouw.cn/code/614.html
郑重声明:本站所有主题/文章除标明原创外,均来自网络转载,版权归原作者所有,如果有侵犯到您的权益,请联系本站删除,谢谢!我们不承担任何技术及版权问题,且不对任何资源负法律责任。
售价: 399 5 ℃ 0 评论
售价: 399 7 ℃ 0 评论
售价: 399 6 ℃ 0 评论
已有 位小伙伴发表了看法
欢迎 你 发表评论