这(zhè)是org.jsoup开发包下载,org.jsoup是java应用中经常会(huì)使(shǐ)用(yòng)到的开发包,主要用于解(jiě)析html 文档,一般应用在网络(luò)检索方面的。
org.jsoup开发包程序(xù)在解析HTML 文档时,相信大家都接触过htmlparser 这个开源项目(mù),我曾经在IBM DW 上发表过两篇(piān)关(guān)于htmlparser 的(de)文章,分别是:从HTML中攫取你所(suǒ)需的信息(xī) 和扩展HTMLParser 对自(zì)定(dìng)义标签的处理能力。但(dàn)现在我(wǒ)已经不再使用htmlparser 了,原因是htmlparser 很少更新,但最重(chóng)要的是有了(le)jsoup 。
jsoup 是(shì)一款Java 的HTML解析器,可直接解析某(mǒu)个URL地址、HTML文本内容。它提供(gòng)了一套非常(cháng)省力的(de)API,可通过DOM,CSS以及类(lèi)似于jQuery的操(cāo)作方法来(lái)取出和操作数据。
1. 从一个URL,文(wén)件或字符串(chuàn)中(zhōng)解析HTML;
2. 使用DOM或CSS选择器来查找、取出数据(jù);
3. 可(kě)操作HTML元素、属性、文本;
jsoup是基于MIT协议发布的,可放心使(shǐ)用于商业项目
org.jsoup.Jsoup;
org.jsoup.nodes.Document;
org.jsoup.nodes.Element;
org.jsoup.select.Elements;
