GPAT生物序列模式搜(sōu)索程(chéng)序是时下互联网常用(yòng)的教育(yù)教学(xué)软件之一,该软件绿色、安全、无毒,让(ràng)你可以放心使用。
GPAT生物序列模式搜索程序,开发的基于(yú)IBM Splash算法的生物序列模式搜(sōu)索(suǒ)程序。运行环境为LINUX,多线(xiàn)程运行(háng),使用多CPU,运行速度快,特(tè)别适(shì)合序列中重(chóng)复模式的(de)定(dìng)位。
目的获取IBMSPLASH算法(fǎ)核心(xīn)代码,为进一步开展生(shēng)物序(xù)列模(mó)式识别(bié)研究提供一个高效算法引(yǐn)擎。方法基于SPLASH算法开(kāi)发核心代(dài)码,运用开(kāi)源软(ruǎn)件工具(jù),开发、调试和优化(huà)程序。结果(guǒ)开发出GNUPattern(Gpat)程序(xù),高效实现了SPLASH算法的核心部(bù)分,并提供全部源(yuán)码,其他研究人员(yuán)可以(yǐ)在GNU许可(kě)协(xié)议(yì)下修改该程序。结论Gpat成功(gōng)地(dì)实现(xiàn)了SPLASH算法,并为下游生物序(xù)列模式识别研究提供铺垫。
生物序(xù)列数据挖掘的(de)主要目的(de)是(shì)识别序(xù)列中的功能元素、研(yán)究序(xù)列(liè)间的相互关(guān)系等等。生物序列(liè)模式挖掘(jué)和生物序列聚类是(shì)生物(wù)序列数(shù)据挖掘(jué)中(zhōng)重要(yào)的(de)两个研究内容。生物序列(liè)模式挖(wā)掘是识别功能元素进而了解(jiě)序列功能(néng)等的关键技术, 序列模式还能够(gòu)描(miáo)述序列(liè)特征(zhēng),作(zuò)为生物序列聚类相似性度量设计的依据;生物序列模式(shì)挖掘也是生物(wù)序列关联分析的基础。生物序列聚类是(shì)研(yán)究序(xù)列(liè)间相互(hù)关(guān)系(xì)进而(ér)解释(shì)进化(huà)关系等(děng)的主要(yào)手段(duàn),其(qí)结果是具有共同特征的序列(liè)簇;另外在这样的簇(cù)中挖(wā)掘(jué)序列模式能进一步提高(gāo)序列模式(shì)挖掘结果的准确率(lǜ),从而更好的(de)指导功能元素的识别;生物序(xù)列聚类也可(kě)作为分类、异常(cháng)挖掘等的预处理步骤。
