刨丁解羊中(zhōng)文分词器,主(zhǔ)要用(yòng)于对网络蜘蛛或网络爬虫抓(zhuā)取的网页进行分词,支持繁体中文分词、简体中文(wén)分词、英文分词(cí),是制作通(tōng)用(yòng)搜索引擎和(hé)垂直搜索引擎(qíng)的核心组(zǔ)件。
该软件(jiàn)在普通PC机器上测试(shì)显示(shì):TXT格式(shì)正文(wén)分词(cí)速度约(yuē)为3000万(wàn)字/分钟,网页(yè)分词速度约为277.8个网页/秒。
该软件采(cǎi)用基础词库(63万词(cí)语)+扩展词库(用户(hù)可手工添加新词)。DLL及OCX调用请联系QQ(601069289)。
英(yīng)语中的(de)分词[participle],分为现在分词和过(guò)去分(fèn)词两种(zhǒng),是一(yī)种非谓语动词形式,尤指以-ing或-ed,-d,-t,-en或-n结(jié)尾的英语(yǔ)动词性(xìng)形(xíng)容词,具有形容词(cí)功能,同时又表现各种动词性特(tè)点,如(rú)时态,语(yǔ)态、带(dài)状语性修饰语(yǔ)的性能及带宾词的性能。
