网站若存在过多死链,对访客而言,打不开的链接会带来糟糕体验;对搜索引擎来讲,站点死链过多,其蜘蛛会逐渐不再前来爬行。接下来,让我们共同学习如何处理死链。
首先,排查站点内部的死链,制作死链文件,并将这些死链页面设定为 404 页面,即百度访问时返回码是 404。
其次,把死链文件放置在网站根目录下。
例如,您的网站是 example.com ,已制作好一个 silian_example.xml 死链文件,那么就将其上传至网站根目录,即 example.com/silian_example.xml 。
然后,登录百度搜索资源平台的死链提交工具来提交死链数据。
(1)通过搜索资源平台中的搜索服务、资源提交、死链提交,进入操作页面;
(2)填写死链文件的更新周期,可选择“每隔 xx 小时/天更新一次”;
(3)填写死链文件地址,注意提交框右侧的配额提示;
(4)管理已提交的死链列表,能够查看死链文件状态和死链处理状态。
特别提示:
1、提交死链时,要确保所有页面均处于 404 状态,提交文件里切勿包含活链 URL ,否则活链 URL 会从搜索中被移除。
2、索引型死链 Sitemap 文件工具不予处理,请勿提交此类文件。
【小程序】
整理出需要删除的资源 path 路径,通过智能小程序开发者平台的自然搜索、资源删除工具进行提交。
特别提示:
1、死链文件每行一条 path 路径,支持 txt 格式,每个文件最多允许 1000 个 path 路径,且大小需小于 10MB ;
2、为防止误删影响小程序已有的流量,每天最多提交一次死链文件。
附录:
常见的死链返回码:
404 Not Found ,意味着服务器未找到任何与请求 URL 相匹配的内容,未表明此情况是暂时还是永久的。
410 Gone ,表示请求的内容在服务器上不再可用,且无已知的转发地址。410 通常代表资源永久性失效。
正常页面返回码:
200 OK ,表示请求成功。
若相关内容已删除或移动,不建议返回成功状态码(200 OK ),而是返回 404 、410 状态码。
204 No Content ,表示此请求无要发送的内容,但报头可能有用。用户代理可利用新报头更新此资源的缓存头。
若页面已删除,应返回 404/410 ,返回 204 可能使搜索引擎产生混淆。
其他返回码:
若正常页面长期返回非 2xx 、3xx 的错误码,可能会影响相应内容的收录和搜索展现。常见错误码如下:
403 Forbidden ,表示客户端无获取内容的权限。
429 Too Many Requests ,表示用户在给定时间内发送的请求过多。
500 Internal Server Error ,表示服务器遇到不知如何处理的状况。
503 Service Unavailable ,表示服务器尚未准备好处理请求。通常是服务器超载或者正在维护。
倘若因抓取频次过高导致 429 、5xx 错误,开发者可在百度搜索资源的抓取频次、抓取频次上限调整页面,对百度爬虫的抓取频次进行设置。
2 本站部分内容来源于网络,仅供学习与参考,如有侵权,请联系网站管理员删除
3 本站一律禁止以任何方式发布或转载任何违法的相关信息,访客发现请向站长举报
4 精准获客感谢您的访问!希望本站内容对您有所帮助!
暂无评论内容