该文基于小波域多状态隐马尔科夫树(HMT)模型,引入一种新的文本分割方法。该分割方法是在H.Choi et al.(2001)工作的基础上,将文本按纹理分为背景、文字与图片3种类型,分别建立多状态HMT模型。另外,基于平滑图像将上述方法又作了进一步...该文基于小波域多状态隐马尔科夫树(HMT)模型,引入一种新的文本分割方法。该分割方法是在H.Choi et al.(2001)工作的基础上,将文本按纹理分为背景、文字与图片3种类型,分别建立多状态HMT模型。另外,基于平滑图像将上述方法又作了进一步的改进,引入了多状态IHMT分割方法,最后通过实例阐明了方法的有效性。展开更多
文摘该文基于小波域多状态隐马尔科夫树(HMT)模型,引入一种新的文本分割方法。该分割方法是在H.Choi et al.(2001)工作的基础上,将文本按纹理分为背景、文字与图片3种类型,分别建立多状态HMT模型。另外,基于平滑图像将上述方法又作了进一步的改进,引入了多状态IHMT分割方法,最后通过实例阐明了方法的有效性。
文摘传统主元分析(Principal component analysis,PCA)方法因忽视量纲对系统的影响,从而使选取的主元难以具有代表性;而在进行量纲标准化后,又因得到的特征值常常是近似相等的而无法进行有效的主元提取.针对这一主要问题,本文通过引入相对化变换(Relative transform,RT)、相对主元(Relative principal components,RPCs)和分布"均匀"等概念,建立起一种相对主元分析(Relative principal component analysis,RPCA)的新方法.该方法首先对系统各分量进行量纲标准化;其次再根据系统的先验信息分析和确定各分量的重要程度;然后在系统能量守恒的准则下,赋以系统各分量相应的权值;最后利用已建立起的相对主元模型,对系统实施RPCA.同时运用数值例子,开展了RPCA在数据压缩和系统故障诊断中的应用研究.理论分析和仿真实验均表明,采用RPCA方法选取出的主元更具代表性和显著几何意义,加之选取主元的灵活性,将使新方法具有更广泛的应用前景。