如何使用java编程完成网页新闻抓取与去重

发布网友 发布时间:2022-04-20 01:58

我来回答

2个回答

热心网友 时间:2023-08-16 12:36

如果代码能力不是很好的话可以借助一些软件去抓取新闻的字段
把数据抓取下来以后可以选择存入数据库当中
需要去重的话,在Java的集合框架中就有HashSet和HashMap可以对数据去重
使用带Hash的集合时一定要注意,如果是存放自定义的对象一定要重写equals方法和HashCode方法

热心网友 时间:2023-08-16 12:37

网页抓取工具有Jsoup,HtmlParser等,很好用。不知道你说的去重具体指什么?

声明声明:本网页内容为用户发布,旨在传播知识,不代表本网认同其观点,若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。E-MAIL:11247931@qq.com