题名 |
数据挖掘质量问题再次探讨 |
并列篇名 |
Exploring the Quality of Data-Mining again |
DOI |
10.6338/JDA.200912_4(6).0001 |
作者 |
徐雪琪(Xue-Qi Xu) |
关键词 |
数据挖掘 ; 数据分析 ; 质量 ; Data Mining ; Data Analysis ; Quality |
期刊名称 |
Journal of Data Analysis |
卷期/出版年月 |
4卷6期(2009 / 12 / 01) |
页次 |
1 - 16 |
内容语文 |
簡體中文 |
中文摘要 |
本文根据数据挖掘整个过程的不同步骤把数据挖掘质量问题分为数据准备阶段的源数据质量问题、数据集成时的质量问题和数据分析时的质量问题三类,重点探讨了在数据分析过程中数据预处理和模式或模型评价与选择这两个阶段可能存在的质量问题,并提出了相应的处理方法。 |
英文摘要 |
Based on the different steps of the whole data mining process, this paper divides the quality of data mining into three types: the quality of source data in the data preparation stage, the quality of data integration and the quality of data analysis. Then the paper is focusing on exploring the quality of the data preprocessing and the quality of the pattern or the model evaluation and selection during the data analysis stage. In the end this paper puts forward some corresponding methods to improve the quality of data mining. |
主题分类 |
基礎與應用科學 >
資訊科學 基礎與應用科學 > 統計 社會科學 > 管理學 |
参考文献 |
|