BaiDuSpider(百度(dù)知道采集(jí)能手),本程序使用java编写,所以会附带一大堆支持库,所(suǒ)以会造成程序体积(jī)过大,所以可能对用户造成不便,为此希(xī)望(wàng)用户敬请见谅!
百度蜘蛛(BaiDuSpider)是百(bǎi)度(dù)搜索引擎的一(yī)个自(zì)动程序,又名百度知道采集能手。它的作用是访问互联网(wǎng)上(shàng)的内容,建(jiàn)立索(suǒ)引数据库。百度蜘蛛可以智能分(fèn)析百度知道的標題,內容,回答等,利用多线程采集(jí)分析(xī)数据(jù),所以很大(dà)程度提高采(cǎi)集效率,欢迎用户(hù)下载使用!
① 利用独创蜘蛛引擎搜寻爬(pá)行资料(可以采(cǎi)集网(wǎng)上(shàng)任何资料(liào))。
② 智能分析百度知道(dào)的標(biāo)題,內容(róng),回答(可分析出(chū)滿意(yì)回答(dá))。
③ 采集回来的数据可以按用户需求存(cún)放到(dào)TXT或数(shù)据库(以后会增加更(gèng)多(duō)存储方式(shì))。
④ 本程序利用多线程(chéng)采集分(fèn)析数据,所以(yǐ)很大程度提高采集效率。
⑤ 本程序(xù)可以為(wéi)你定制更(gèng)多功能(néng),有(yǒu)興趣者可联(lián)系(xì)作者(zhě)。
⑥ 本程序(xù)可在多平台运行,包括(linux mac window)等平台。联系方法:可在提交建议中发送给作(zuò)者或(huò)以郵箱方式發(fā)送(416941523@qq.com)。
1.1更(gèng)新内容
修改提示信息(xī)。
修改核心报错BUG
