题名

数据挖掘质量问题再次探讨

并列篇名

Exploring the Quality of Data-Mining again

DOI

10.6338/JDA.200912_4(6).0001

作者

徐雪琪(Xue-Qi Xu)

关键词

数据挖掘 ; 数据分析 ; 质量 ; Data Mining ; Data Analysis ; Quality

期刊名称

Journal of Data Analysis

卷期/出版年月

4卷6期(2009 / 12 / 01)

页次

1 - 16

内容语文

簡體中文

中文摘要

本文根据数据挖掘整个过程的不同步骤把数据挖掘质量问题分为数据准备阶段的源数据质量问题、数据集成时的质量问题和数据分析时的质量问题三类,重点探讨了在数据分析过程中数据预处理和模式或模型评价与选择这两个阶段可能存在的质量问题,并提出了相应的处理方法。

英文摘要

Based on the different steps of the whole data mining process, this paper divides the quality of data mining into three types: the quality of source data in the data preparation stage, the quality of data integration and the quality of data analysis. Then the paper is focusing on exploring the quality of the data preprocessing and the quality of the pattern or the model evaluation and selection during the data analysis stage. In the end this paper puts forward some corresponding methods to improve the quality of data mining.

主题分类 基礎與應用科學 > 資訊科學
基礎與應用科學 > 統計
社會科學 > 管理學
参考文献
  1. Andrew Kusiak(2001).Feature Transformation Methods in Data Mining.IEEE Transactions on Electronics Packaging Manufacturing,24(3),214-221.
  2. Grzymala-Busse, Jerzy W.,Hu, Ming(2005).A Comparison of Several Approaches to Missing Attribute Values in Data Mining.Lecture Notes In Computer Science,378-385.
  3. Pyle, Dorian(1999).Data Preparation For Data Mining.Academic press.
  4. Robert Cooley、Bamshad Mobasher、Jaideep Srivastava(1999)。Data Preparation for Mining World Wide Web Browsing Patterns。Knowledge and Information Systems
  5. Sattler, Kai-Uwe,Schallehn, Eike(2001).A Data Preparation Framework based on a Multidatabase Language.Proc. of Int. Database Engineering and Applications Symposium
  6. Shyu, Mei-Ling、Chen, Shu-Ching、Chang, LiWu(2005)。Handing Missing Values Via Decomposition of the Conditioned Set。IEEE International Conference on Information Reuse and Integration,Las Vegas, Neveda, USA:
  7. 宋擒豹、沈钧毅(2000)。神经网络数据挖掘方法中的数据准备问题。计算机工程与应用,102-104。
  8. 李金昌、徐雪琪(2004)。数据挖掘质量问题探讨。统计研究,49-52。
  9. 侯亚丽、袁方(2005)。Web日志挖掘中的数据预处理技术。河北大学学报(自然科学版),25(2),202-206。
  10. 刘莉、徐玉生、马志新(2003)。数据挖掘中数据预处理技术综述。甘肃科学学报,15(1),117-119。
  11. 刘越江、黄今慧(2003)。数据挖掘中的数据预处理技术。科技情报开发与经济,13,170-171。
  12. 张娥、郑斐峰、冯耕中(2004)。WEB日志数据挖掘的数据预处理方法研究。计算机应用研究,58-60。
  13. 赵红玲、宋瀚涛(2005)。Web日志挖掘中数据预处理的研究。计算机应用研究,67-69。
  14. 陈宝树、齐民(2002)。WEB数据挖掘中的数据预处理。计算机工程,28,125-127。
  15. 黄志强、贾宇波(2007)。Web访问挖掘中数据预处理的改进。广西师范大学学报:自然科学版,25(2),69-73。