在建站或销售虚拟商品过程中,可能会使用到第三方网盘,如百度网盘。然而,网盘分享链接可能会失效。如果网站存在大量失效链接,将会对网站用户留存产生较大影响。为解决此问题,比较好的做法是检测链接是否有效。
本文将为您介绍如何使用一款百度网盘链接有效性检测工具,以实现链接有效性批量检测以及Web API检测。
功能介绍
批量检测可以对Excel表单或文本文件中的百度网盘链接进行检测,并自动将检测结果输出到Excel或文本文件中。
Web API接口支持HTTP的GET和POST方法调用,可以使用这些方法在网站中实现访客实时检测功能,只需要在网站上添加相应的HTTP调用地址即可。同时,它还可以在采集器软件中集成,实现采集时的链接状态检测功能。
正式检测前,请在软件中扫码登录网盘帐号,登录后检测功能更稳定。
批量检测
如图所示。在操作区中,输入文件路径或拖拽多个文件到输入框,多个文件之间用半角逗号","分隔。如果是Excel文件(xlsx格式),需要设置表单名,通过点击下拉框选择表单,再设置输入列和输出列的序号(序号从1开始计数);如果是文本文件,则不需要设置表单。
设置起始检测的行号,也是从1开始计数。并设置最大的检测行数。设置检测的并发数,建议设置为1;设置检测链接的时间间隔,建议设置为3000毫秒,也就是3秒。可以自定义输出文件后缀,输出结果文件不会覆盖原始检测文件。
设置好之后,点击“开始”按钮,然后等待检测结束即可。
检测时,支持一个单元格中存在多个网盘地址的情况,并将根据“设置”中的多链接判断的规则输出结果。
API接口检测
如图所示。侦听端口为服务端口,HTTP协议。因此,程序可以运行在您的服务器上。目前软件支持Windows Server 2016以上的系统。
接口返回格式,支持text和json两种格式。可以生成访问密钥,以免接口被探测和窃取盗用。也可以设置运行时自动启动,软件运行后,就会立即开启API服务端口。
在text格式返回时,仅返回具体检测结果的文本,不返回code状态码。json格式返回时,会返回code和msg(检测结果的文本字符串)两个字段。
如果不清楚如何使用接口,也可以点击“接口测试”进行本地接口测试。
其他
运行日志。可以查看检测日志,其中包含批量检测和API检测。
检测设置。一般按默认即可。多链接判断,可根据您的个人习惯修改。
在蜜蜂采集器中集成API检测接口
在采集器的规则中,对相应的标签增加“标签数据二次处理”。
先添加一个“字符编码转换”,并选择百分号编码,以便对标签内容进行URLEncode操作。
再添加一个“内容前后缀”。这里我们使用POST请求,前缀为:http://127.0.0.1:2312/baiduchecker?$$$post_begin$$$key=xxxx&content= ,后缀为$$$post_end$$$ 。如果使用GET请求,标签内容的长度就不能过长,前缀为http://127.0.0.1:2312/baiduchecker?key=xxxx&content= ,无后缀。
再添加一个“Http请求”,即可。
这里调用API接口后,会替换标签内容的,所以,用于检测链接的标签应该是单独的“检测”标签,仅仅用于检测有效性,不用于采集内容输出。对此检测标签,还可以添加标签内容过滤,比如,不得包含链接失效 ,则要求所有提取的网盘链接都是有效的。
至此,我们就可以在自己的采集规则中检测百度网盘链接是否有效了。 |