java 网络爬虫 请高人推荐一个好用框架?主要用于指网页表格数据的获取?

发布网友 发布时间:2022-04-23 22:46

我来回答

1个回答

热心网友 时间:2023-10-12 15:45

据我所知,Heritrix算一个比较有名的吧,以前有本国人写的书,名叫“自己动手做搜索引擎”,类似的名字,里面整合了lucene, Heritrix等等,你可以看看。
常见的开元搜索引擎比如Nutch也集成的有爬虫,其他的框架还有JSpider等等。
另外,你用“Java 网络爬虫”到开源中国上搜一下,能搜到29个。

声明声明:本网页内容为用户发布,旨在传播知识,不代表本网认同其观点,若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。E-MAIL:11247931@qq.com