鍍金池/ 教程/ Java/ Jsoup API
JSoup安裝
JSoup教程
Jsoup應(yīng)用實例
Jsoup API
Jsoup示例:提取給定url的標(biāo)題
JSoup快速入門
Jsoup示例:提取給定URL中的鏈接
Jsoup示例:提取URL中的元數(shù)據(jù)
Jsoup示例:提取URL中的圖像
Jsoup示例:提取表單參數(shù)

Jsoup API

jsoup api中有6個包提供用于開發(fā)jsoup應(yīng)用程序的類和接口。

  • org.jsoup
  • org.jsoup.examples
  • org.jsoup.helper
  • org.jsoup.nodes
  • org.jsoup.parser
  • org.jsoup.safety
  • org.jsoup.salect

以上包中有很多類。 jsoup api中的主要類如下所示:

  • Jsoup
  • Document
  • Element

Jsoup類

org.jsoup.Jsoup類提供了連接,清理和解析HTML文檔的方法。

org.jsoup.Jsoup類的重要方法如下:

方法名稱 描述
static Connection connect(String url) 創(chuàng)建并返回URL的連接。
static Document parse(File in, String charsetName) 將指定的字符集文件解析成文檔。
static Document parse(File in, String charsetName, String baseUri) 將指定的字符集和baseUri文件解析成文檔。
static Document parse(String html) 將給定的html代碼解析成文檔。
static Document parse(String html, String baseUri) baseUri將給定的html代碼解析成文檔。
static Document parse(URL url, int timeoutMillis) 將給定的URL解析為文檔。
static String clean(String bodyHtml, Whitelist whitelist) 將輸入HTML返回安全的HTML,通過解析輸入HTML并通過允許的標(biāo)簽和屬性的白名單進行過濾。