java简单爬虫----Jsoup

编程小6 Java (36) 2024-02-12 14:12

Hi，大家好，我是编程小6，很荣幸遇见你，我把这些年在开发过程中遇到的问题或想法写出来，今天说一说java简单爬虫----Jsoup,希望能够帮助你!!!。

Jsoup 是一个 Java 的开源HTML解析器，可直接解析某个URL地址、HTML文本内容。

Jsoup主要有以下功能：

1. 从一个URL，文件或字符串中解析HTML

2. 使用DOM或CSS选择器来查找、取出数据

3. 对HTML元素、属性、文本进行操作

基本步骤：

//下载网页String URL="输入网址"；Document document=Jsoup.cnnect("URL");

//在下载的document里进行检索的语句elements test=document.select("#div_JK").select("div.item_list").select("div:nth-child(1)").select("div.dTit.tracking-ad").select("a");

//这样test标签就是我们最开始右键单击检查的标签String Str=test.toString();

//将标签转化成字符串String text=test.text();

//将标签里的文本提取出来

实例演练

Jsoup在解析html方面还有很多功能，这里就不一一列举了。Jsoup的中文api地址：http://www.open-open.com/jsoup/

Jsoup在做爬虫方面，有着非常大优势。后续会选择一些现有开源的爬虫框架进行分析，与大家共享。欢迎大家拍砖。

今天的分享到此就结束了，感谢您的阅读，如果确实帮到您，您可以动动手指转发给其他人。

如何利用Java爬取网站数据？

Java 网络爬虫，就是这么的简单

发表回复取消回复

请先登录账户再评论哦

java简单爬虫----Jsoup

实例演练

发表回复取消回复

相关推荐

JAVA 新手入门

java实现5毛钱特效

java生成二维码图片

快速搭建一个自己的服务器详解（java环境）

最新文章

JAVA 新手入门

java实现5毛钱特效

java生成二维码图片

快速搭建一个自己的服务器详解（java环境）

Java案例：实现九九乘法表

java冒泡排序详解

自编Javascript小游戏－妞妞找妈妈

Java伽马什么意思_伽马什么意思读音

Java下载安装与环境配置

java 万年历_java万年历代码仅供参考

java简单爬虫----Jsoup

实例演练

发表回复 取消回复

相关推荐

JAVA 新手入门

java实现5毛钱特效

java生成二维码图片

快速搭建一个自己的服务器详解（java环境）

最新文章

JAVA 新手入门

java实现5毛钱特效

java生成二维码图片

快速搭建一个自己的服务器详解（java环境）

Java案例：实现九九乘法表

java冒泡排序详解

自编Javascript小游戏－妞妞找妈妈

Java伽马什么意思_伽马什么意思 读音

Java下载安装与环境配置

java 万年历_java万年历代码仅供参考

发表回复取消回复

Java伽马什么意思_伽马什么意思读音