摘要
通过交通运输行业各类信息系统的建设与部省联网,建立了全国统一的道路运输经营业户、运营车辆、从业人员等数据,目前,部级中心数据库的数据已达2 000万条记录。但从数据质量分析情况看,普遍存在数据记录不完整、错误数据比较多、数据指标内容不规范等问题。为此,研究设计了一套规范、高效、灵活、实用的数据清洗模型,并开发相应的数据清洗系统辅助完成清洗工作,取得了良好的应用效果,同时也为今后进一步研究提高部省联网数据质量,以及交通运输行业类似联网系统建设中的数据质量保障工作提供了便捷的技术手段和丰富的实践经验。
出处
《交通建设与管理》
2014年第8X期267-271,共5页
Transport Construction & Management