文档相似性(xìng)检(jiǎn)测工(gōng)具是通过(guò)比对(duì)源(yuán)文档和目标文档的(de)相似性(xìng)给出相(xiàng)似(sì)度结果的一种信息处理系统(tǒng)。可以分段粘贴进去查 的(de)确很(hěn)给力哦(ò)。
文档相(xiàng)似性检测工具是通过比对源文档和目标(biāo)文档(dàng)相(xiàng)似性给出相似(sì)度结(jié)果的一种信息处理(lǐ)系(xì)统。由武汉大学信息管理(lǐ)学(xué)院(yuàn)出(chū)版科学(xué)系教师沈阳副教授研发的ROST文档相似性检测(cè)工(gōng)具(jù)(为(wéi)避免太敏感有时也叫相关性(xìng)检测工具)可有效检测论文的抄袭相似情况,经过六年的研发(fā)(早(zǎo)期版本叫做网(wǎng)盗克(kè)星),终(zhōng)于推出了6.0版本,在(zài)定版(bǎn)过程(chéng)中(zhōng)得到了武汉大学多(duō)位专家教授的宝贵意见。目前已投入约(yuē)20余家单(dān)位测试和(hé)使用,反应良好,一定程(chéng)度杜绝了有抄袭(xí)可能的(de)论文(wén)发表问(wèn)世。
⑴.本软件不能(néng)检查已发表文档,因为已发表的文档(dàng)往往已经到(dào)处传播和引用开来。
⑵.本软件的每检测400字需要6秒钟,一篇(piān)8000字的文档至少需要2分钟,需要(yào)一(yī)点点耐心(xīn)。
⑶.本(běn)软(ruǎn)件检测(cè)结果存在误差,用(yòng)更小的文档块进行检测,可以减少误(wù)差,但需要的时间(jiān)会(huì)相应增加,经过我们在多家编辑部的试用情况,块数大小(xiǎo)定(dìng)为(wéi)200-400字(zì)较为合适,此(cǐ)时误差率(lǜ)也是可以接受的,文(wén)档相(xiàng)似率(lǜ)一般是比实际的要低。
⑷.如果某个相(xiàng)似(sì)块未(wèi)显示,说明(míng)未检索到相似的(de)文档。
⑸.本软件每天检测字数不能超过10万字,否则服务(wù)器过载,将封锁IP。
⑹.本软件后台数据库覆盖188亿个网页和490万篇论文(wén)。
⑺.本软件检测文档不得超过4000字(zì),如需要更长的文档支持,需要购(gòu)买收费版。
⑻.当软件未能联网时,软件(jiàn)检测按(àn)钮将变虚。
⑼.本(běn)免费版(bǎn)由(yóu)于服务(wù)器压力,有时候可(kě)能不能正(zhèng)常检测,出现(xiàn)这种情况,请速联系我们(men),或者由单位出面(miàn)购买单位版或者(zhě)豪华(huá)版。
⑽.本软件检测结(jié)果(guǒ)只(zhī)能作为一个参(cān)考(kǎo),可以使用表格(gé)右键导出详细检查(chá)结(jié)果发送给被(bèi)检查本人,本软件不对是否(fǒu)剽(piāo)窃做结论,只是告诉你与现(xiàn)存(cún)文(wén)献(xiàn)相似度(dù)高于(yú)80%的文字比(bǐ)例所(suǒ)占文章(zhāng)总(zǒng)数比例是多少。
⑾.我们将持续投入反(fǎn)剽窃的研究,本人已获批国(guó)家自科基金进一步反剽窃问题,我们将继续发表一系(xì)列论(lùn)文,以及(jí)继续(xù)申请相关(guān)专利。软件(jiàn)不(bú)完善的地方敬请原谅。
基(jī)本原理:反剽窃软件自动将文档切(qiē)割为(wéi)多个50到(dào)200字(可(kě)自定(dìng)义)的小文(wén)本,通(tōng)过混合引擎将其与188亿个(gè)网(wǎng)页和490万(wàn)篇文献进行模(mó)糊匹配,标示出每个文本块与文(wén)献库中的某些(xiē)文献的最(zuì)大(dà)相似度。由此软件统计出相似(sì)度≥95%(基本原封不动抄袭)与相似(sì)度≥80%(略作修改后抄袭)的字数所占总字数比例。我(wǒ)们把这个(gè)比例(lì)作为(wéi)剽窃(相似)程度衡量指(zhǐ)标。 系统需(xū)要(yào)XP系统,word2003环境。
