摘要
为快速获取XML文档的模式信息,提出一种基于Hash表的XML模式提取算法。该算法首先将XML文档转换为一棵XML文档树;然后遍历这棵文档树,将相关模式信息存储到一个Hash表中;最后,对Hash表中的信息进行处理,得到XML模式的DTD表示形式。将文中的算法用VC++实现,实验结果表明该方法是可行有效的,而且在保证XML模式提取结果正确性的同时,还有效地简化了模式表示形式。
In order to obtain the model of XML document effectively,this paper presents an effective hash-table-based algorithm for extracting XML model.Firstly,the XML document is converted into a tree that displays the hierarchy structure of the XML document completely.Then the XML model information is gotten through visiting the document tree and saved into a hash table.Finally the DTD of XML model is extracted from the hash table.This algorithm is implemented with VC++.The experiment results show that the algorithm is effective and efficient.
出处
《计算机工程与应用》
CSCD
北大核心
2005年第17期180-182,214,共4页
Computer Engineering and Applications
基金
江苏省高校自然科学基金(编号:04KJB520075)