WebSPHINX
交互式开发环境
WebSPHINX 是一个 Java 类包和 Web 爬虫的交互式开发环境。 Web 爬虫 ( 也叫作机器人或蜘蛛 ) 是可以自动浏览与处理 Web 页面的程序。 WebSPHINX 由两部分组成:爬虫工作平台和 WebSPHINX 类包。
用途
1.可视化显示页面的集合
2.下载页面到本地磁盘用于离线浏览
3.将所有页面拼接成单个页面用于浏览或者打印
4.按照特定的规则从页面中抽取文本字符串
5.用Java或Javascript开发自定义的爬虫
参考资料
WebSPHINX.WebSPHINX.
最新修订时间:2023-09-17 12:35
目录
概述
参考资料