当前位置:网站首页 > Java教程 > 正文

京东爬虫教程java



简单记录 - Jsoup爬虫入门实战

数据问题?数据库获取,消息队列中获取中,都可以成为数据源,爬虫!

爬取数据:(获取请求返回的页面信息,筛选出我们想要的数据就可以了!)

我们经常需要分析HTML网页,以从中提取感兴趣的信息。

开始,一个简单获取京东商品的小Demo。

eg:比如我搜索java关键字

在这里插入图片描述
怎么获取呢这些数据信息呢?

jsoup包!

JsoupJsoup是一款Java的HTML解析器,可直接解析某个URL地址和HTML文本内容。它提供了一套非常省力的API,可通过DOM、CSS以及类似于jQuery的操作方法来取出和操作数据。网址:https://jsoup.org。

1、导入依赖

 

jsoup是解析网页的。

2、分析网页

在这里插入图片描述

分析京东网页可得 物品在id为"J_goodsList"的div的ul的li里,那就搞过来吧。

3、代码实现

 
 

4、运行结果


                            

版权声明


相关文章:

  • java netty 视频教程2024-11-30 13:18:01
  • java教程公众号2024-11-30 13:18:01
  • java web swing 教程2024-11-30 13:18:01
  • java教程425集2024-11-30 13:18:01
  • java 实训教程2024-11-30 13:18:01
  • java教程 讲师 壁虎2024-11-30 13:18:01
  • 李老师java教程2024-11-30 13:18:01
  • java数据对接教程2024-11-30 13:18:01
  • java安装教程推文2024-11-30 13:18:01
  • java2的教程2024-11-30 13:18:01