博客
关于我
强烈建议你试试无所不能的chatGPT,快点击我
前嗅ForeSpider脚本教程-链接过滤脚本
阅读量:6035 次
发布时间:2019-06-20

本文共 498 字,大约阅读时间需要 1 分钟。

hot3.png

今天,小编给大家带来的教程为:前嗅ForeSpider脚本教程-链接过滤脚本,应用场景,地址/标题过滤。具体内容如下:

一.应用场景

当可视化抽取到的链接包含不想要的链接地址时,需要进行过滤。可能用到的类是:string,使用到的全局对象是VALUE。

二.地址过滤

场景:链接地址有规律。

示例:可视化配置百度搜索之后的链接抽取,过滤掉不是列表链接和翻页链接的所有链接。

脚本实例:

If(VALUE.Find(“wd=”)!=-1||VALUE.Find(“url=”)!=-1)

return true; //return true代表保留链接

else return false; //return false代表过滤链接

三.标题过滤

场景:链接标题有规律。

示例:过滤掉所有标题不为空字符串的链接,并返回链接标题为”关键词”。

脚本实例:

if(VALUE!=””)

return false; //代表过滤链接

else return “关键词”; //否则保留并覆盖标题为关键词

转载于:https://my.oschina.net/forespider/blog/3037086

你可能感兴趣的文章
ASP.NET 中设置路径的三种方式
查看>>
EBS使用 Distributed AD在多个节点并行adpatch
查看>>
windows添加和删除服务
查看>>
关于云栖,有点无语的几个地方,管理能不能管?
查看>>
Windows线程的同步与互斥
查看>>
C#进阶系列——MEF实现设计上的“松耦合”(四):构造函数注入
查看>>
AngularJs ng-change事件/指令(转)
查看>>
linux系统下安装两个或多个tomcat
查看>>
ProtoBuffer 简单例子
查看>>
iOS多线程开发系列之(一)NSThread
查看>>
微信小程序初体验(上)- 腾讯ISUX社交用户体验设计成员出品
查看>>
SAP WM Physical Inventory Method ST & PZ
查看>>
一次快速的数据迁移感悟
查看>>
MySQL修改提示符
查看>>
《ELK Stack权威指南(第2版)》一3.6 Java日志
查看>>
C++流的streambuf详解及TCP流的实现
查看>>
《量化金融R语言初级教程》一2.5 协方差矩阵中的噪声
查看>>
mysql到elasticsearch数据迁移踩坑实践-Ali0th
查看>>
Python轻量级数据分析库DaPy
查看>>
beetl 和 shrio 结合
查看>>