针对传统序列模式挖掘(SPM)不考虑模式重复性且忽略各项的效用(单价或利润)与模式长度对用户兴趣度影响的问题,提出一次性条件下top-k高平均效用序列模式挖掘(TOUP)算法。TOUP算法主要包括两个核心步骤:平均效用计算和候选模式生成。首...针对传统序列模式挖掘(SPM)不考虑模式重复性且忽略各项的效用(单价或利润)与模式长度对用户兴趣度影响的问题,提出一次性条件下top-k高平均效用序列模式挖掘(TOUP)算法。TOUP算法主要包括两个核心步骤:平均效用计算和候选模式生成。首先,提出基于各项出现位置与项重复关系数组的CSP(Calculation Support of Pattern)算法计算模式支持度,从而实现模式平均效用的快速计算;其次,采用项集扩展和序列扩展生成候选模式,并提出了最大平均效用上界,基于该上界实现对候选模式的有效剪枝。在5个真实数据集和1个合成数据集上的实验结果表明,相较于TOUP-dfs和HAOP-ms算法,TOUP算法的候选模式数分别降低了38.5%~99.8%和0.9%~77.6%;运行时间分别降低了33.6%~97.1%和57.9%~97.2%。TOUP的算法性能更优,能更高效地挖掘用户感兴趣的模式。展开更多
在糙皮侧耳(Pleurotus ostreatus)的全基因组中鉴定出14个高速泳动蛋白(high-mobility group box,HMG-box)的编码基因(PoHMG1~PoHMG14),对其进行特征、结构与系统进化分析,发现所有的HMGbox转录因子蛋白的三级结构高度相似,相对分子质量...在糙皮侧耳(Pleurotus ostreatus)的全基因组中鉴定出14个高速泳动蛋白(high-mobility group box,HMG-box)的编码基因(PoHMG1~PoHMG14),对其进行特征、结构与系统进化分析,发现所有的HMGbox转录因子蛋白的三级结构高度相似,相对分子质量为6893.79~60397.29,蛋白PoHMG6、PoHMG11、PoHMG12与PoHMG13之间的亲缘关系较近。基于糙皮侧耳在菌丝、原基、幼嫩子实体和成熟子实体时期的转录组数据,对筛选到的转录因子基因PoHMG11进行克隆分析并探究其功能及表达特性,发现该基因全长序列1517 bp,编码489个氨基酸,含有一个HMG-box结构域。通过大肠杆菌原核表达载体体外诱导表达出相对分子质量为5.5×104的蛋白,该重组蛋白在1 mol·L^(-1)IPTG、25℃诱导表达6 h时表达量最高。利用实时荧光定量PCR(qRT-PCR)分析糙皮侧耳在菌丝、原基、幼嫩子实体和成熟子实体阶段PoHMG11基因的相对表达量,发现该基因在成熟糙皮侧耳子实体中的表达量比其他生长发育时期显著升高5倍以上,推测该基因可能参与调控糙皮侧耳子实体成熟过程。展开更多
首次利用同位素标记相对和绝对定量(isobaric tags for relative and absolute quantification,iTRAQ)技术结合二维液相色谱串联质谱对草菇(Volvariella volvacea)同核和异核菌丝蛋白质组进行研究。采用QExactive质谱鉴定并经MASCOT软...首次利用同位素标记相对和绝对定量(isobaric tags for relative and absolute quantification,iTRAQ)技术结合二维液相色谱串联质谱对草菇(Volvariella volvacea)同核和异核菌丝蛋白质组进行研究。采用QExactive质谱鉴定并经MASCOT软件搜库,对所有鉴定蛋白进行主成分分析(principal component analysis,PCA)、层次聚类(hierarchical clustering)分析和GO(gene ontology)注释,并进行生物信息学分析。结果共获得2335个不同肽段,鉴定到1039个蛋白,其中1030个蛋白具有定量信息。在同核菌丝中显著上调蛋白83个,下调蛋白97个,表明iTRAQ标记技术结合二维液相色谱串联质谱可有效地分离和鉴定草菇菌丝蛋白质组。该研究结果为更深入全面地研究草菇菌丝蛋白质组学奠定基础。展开更多
文摘针对传统序列模式挖掘(SPM)不考虑模式重复性且忽略各项的效用(单价或利润)与模式长度对用户兴趣度影响的问题,提出一次性条件下top-k高平均效用序列模式挖掘(TOUP)算法。TOUP算法主要包括两个核心步骤:平均效用计算和候选模式生成。首先,提出基于各项出现位置与项重复关系数组的CSP(Calculation Support of Pattern)算法计算模式支持度,从而实现模式平均效用的快速计算;其次,采用项集扩展和序列扩展生成候选模式,并提出了最大平均效用上界,基于该上界实现对候选模式的有效剪枝。在5个真实数据集和1个合成数据集上的实验结果表明,相较于TOUP-dfs和HAOP-ms算法,TOUP算法的候选模式数分别降低了38.5%~99.8%和0.9%~77.6%;运行时间分别降低了33.6%~97.1%和57.9%~97.2%。TOUP的算法性能更优,能更高效地挖掘用户感兴趣的模式。
基金国家现代农业产业技术体系建设专项资金资助(编号:CARS 24)supported by the Engineering Research Center of EdibleFungi of Fujian Province,National ImprovementCenter of Edible Fungi Varieties(Fujian Subcenter)and the Institute of Biochemistry and Cell Biology,Shanghai Institute for Biological Science,Chinese Academy of Sciences~~
文摘首次利用同位素标记相对和绝对定量(isobaric tags for relative and absolute quantification,iTRAQ)技术结合二维液相色谱串联质谱对草菇(Volvariella volvacea)同核和异核菌丝蛋白质组进行研究。采用QExactive质谱鉴定并经MASCOT软件搜库,对所有鉴定蛋白进行主成分分析(principal component analysis,PCA)、层次聚类(hierarchical clustering)分析和GO(gene ontology)注释,并进行生物信息学分析。结果共获得2335个不同肽段,鉴定到1039个蛋白,其中1030个蛋白具有定量信息。在同核菌丝中显著上调蛋白83个,下调蛋白97个,表明iTRAQ标记技术结合二维液相色谱串联质谱可有效地分离和鉴定草菇菌丝蛋白质组。该研究结果为更深入全面地研究草菇菌丝蛋白质组学奠定基础。