发布网友 发布时间:2022-04-23 22:46
我来回答
共1个回答
热心网友 时间:2023-10-12 15:45
据我所知,Heritrix算一个比较有名的吧,以前有本国人写的书,名叫“自己动手做搜索引擎”,类似的名字,里面整合了lucene, Heritrix等等,你可以看看。常见的开元搜索引擎比如Nutch也集成的有爬虫,其他的框架还有JSpider等等。另外,你用“Java 网络爬虫”到开源中国上搜一下,能搜到29个。