生物信息学中,发现、鉴别新基因是承上启下的一步,它既承接了过往如“基因组测序”的工作,又是未来“后基因时代”研究的基石.“基因电脑克隆”是利用计算手段发现、鉴别新基因的方法,SiClone软件实现了“基因电脑克隆”功能.本文对Si...生物信息学中,发现、鉴别新基因是承上启下的一步,它既承接了过往如“基因组测序”的工作,又是未来“后基因时代”研究的基石.“基因电脑克隆”是利用计算手段发现、鉴别新基因的方法,SiClone软件实现了“基因电脑克隆”功能.本文对SiClone软件操作的数据库提出并行处理方案,并详述了基于MPI(message passing interface)平台实现的并行优化版本PSiClone.根据已得到的EST数据库,展示了软件并行版PSiClone的运行性能,试验数据库EST序列条数仅仅是NCBI(The National Center for Biotechnology Information)dbEST庞大数据库的很小部分,这也暗示我们软件的并行工作对于大数据库的比较和运算将更有应用前景.展开更多
在群体遗传学和分子生态学研究中,种群的分化分析是一个重要的内容。IM(Isolation with Migration)模型以DNA序列数据为基础同时评估两个种群分化过程中分化时间和迁移概率。IM模型能够模拟许多真实世界中一个种群分行为两个种群的现象...在群体遗传学和分子生态学研究中,种群的分化分析是一个重要的内容。IM(Isolation with Migration)模型以DNA序列数据为基础同时评估两个种群分化过程中分化时间和迁移概率。IM模型能够模拟许多真实世界中一个种群分行为两个种群的现象。IM模型应用MCMC(Markov Chain Monte Carlo)方法进行参数的推断。然而马尔科夫链需要经过漫长的时间才能达到一个稳定的概率分布,并且参数推断所需要的空间可能超过一个计算机的内存。本文利用MPI(Message Passing Interface)实现了基于数据并行的IM模型,在减少单个计算机内存使用和总的运行时间方面都有很好的效果。展开更多
文摘生物信息学中,发现、鉴别新基因是承上启下的一步,它既承接了过往如“基因组测序”的工作,又是未来“后基因时代”研究的基石.“基因电脑克隆”是利用计算手段发现、鉴别新基因的方法,SiClone软件实现了“基因电脑克隆”功能.本文对SiClone软件操作的数据库提出并行处理方案,并详述了基于MPI(message passing interface)平台实现的并行优化版本PSiClone.根据已得到的EST数据库,展示了软件并行版PSiClone的运行性能,试验数据库EST序列条数仅仅是NCBI(The National Center for Biotechnology Information)dbEST庞大数据库的很小部分,这也暗示我们软件的并行工作对于大数据库的比较和运算将更有应用前景.
文摘在群体遗传学和分子生态学研究中,种群的分化分析是一个重要的内容。IM(Isolation with Migration)模型以DNA序列数据为基础同时评估两个种群分化过程中分化时间和迁移概率。IM模型能够模拟许多真实世界中一个种群分行为两个种群的现象。IM模型应用MCMC(Markov Chain Monte Carlo)方法进行参数的推断。然而马尔科夫链需要经过漫长的时间才能达到一个稳定的概率分布,并且参数推断所需要的空间可能超过一个计算机的内存。本文利用MPI(Message Passing Interface)实现了基于数据并行的IM模型,在减少单个计算机内存使用和总的运行时间方面都有很好的效果。