图片-精准获客

搜索学堂 – 死链应当怎样处置?

网站若存在过多死链,对访客而言,打不开的链接会带来糟糕体验;对搜索引擎来讲,站点死链过多,其蜘蛛会逐渐不再前来爬行。接下来,让我们共同学习如何处理死链。

首先,排查站点内部的死链,制作死链文件,并将这些死链页面设定为 404 页面,即百度访问时返回码是 404。

其次,把死链文件放置在网站根目录下。

例如,您的网站是 example.com ,已制作好一个 silian_example.xml 死链文件,那么就将其上传至网站根目录,即 example.com/silian_example.xml 。

然后,登录百度搜索资源平台的死链提交工具来提交死链数据。

(1)通过搜索资源平台中的搜索服务、资源提交、死链提交,进入操作页面;

(2)填写死链文件的更新周期,可选择“每隔 xx 小时/天更新一次”;

(3)填写死链文件地址,注意提交框右侧的配额提示;

(4)管理已提交的死链列表,能够查看死链文件状态和死链处理状态。

特别提示:

1、提交死链时,要确保所有页面均处于 404 状态,提交文件里切勿包含活链 URL ,否则活链 URL 会从搜索中被移除。

2、索引型死链 Sitemap 文件工具不予处理,请勿提交此类文件。

图片[1]-搜索学堂 – 死链应当怎样处置?-精准获客

【小程序】

整理出需要删除的资源 path 路径,通过智能小程序开发者平台的自然搜索、资源删除工具进行提交。

特别提示:

1、死链文件每行一条 path 路径,支持 txt 格式,每个文件最多允许 1000 个 path 路径,且大小需小于 10MB ;

2、为防止误删影响小程序已有的流量,每天最多提交一次死链文件。

附录:

常见的死链返回码:

404 Not Found ,意味着服务器未找到任何与请求 URL 相匹配的内容,未表明此情况是暂时还是永久的。

410 Gone ,表示请求的内容在服务器上不再可用,且无已知的转发地址。410 通常代表资源永久性失效。

正常页面返回码:

200 OK ,表示请求成功。

若相关内容已删除或移动,不建议返回成功状态码(200 OK ),而是返回 404 、410 状态码。

204 No Content ,表示此请求无要发送的内容,但报头可能有用。用户代理可利用新报头更新此资源的缓存头。

若页面已删除,应返回 404/410 ,返回 204 可能使搜索引擎产生混淆。

其他返回码:

若正常页面长期返回非 2xx 、3xx 的错误码,可能会影响相应内容的收录和搜索展现。常见错误码如下:

403 Forbidden ,表示客户端无获取内容的权限。

429 Too Many Requests ,表示用户在给定时间内发送的请求过多。

500 Internal Server Error ,表示服务器遇到不知如何处理的状况。

503 Service Unavailable ,表示服务器尚未准备好处理请求。通常是服务器超载或者正在维护。

倘若因抓取频次过高导致 429 、5xx 错误,开发者可在百度搜索资源的抓取频次、抓取频次上限调整页面,对百度爬虫的抓取频次进行设置。

© 版权声明
THE END
喜欢就支持一下吧
点赞9 分享
评论 抢沙发

请登录后发表评论

    暂无评论内容