题名

基於雲端運算架構建立資料採礦平台

并列篇名

The Data Mining Analysis Platform Base on Clouding Computing

DOI

10.6338/JDA.201404_9(2).0004

作者

簡孝竑(Siao-Hong Jian);鄧家駒(Gia-Khy Tang);李勝輝(Sheng-Hui Lee)

关键词

雲端運算 ; 資料採礦 ; Cloud Computing ; Data Mining

期刊名称

Journal of Data Analysis

卷期/出版年月

9卷2期(2014 / 04 / 15)

页次

39 - 67

内容语文

繁體中文

中文摘要

近年來,雲端運算在資訊領域中是最熱門話題之一,使用者可以不論時間、地點透過任何可連上網際網路的設備,取得想要的資料,甚至進行分析。除了可以節省運算時間外,也可以降低企業或個人的運算成本。本研究將以雲端運算即時且快速之特性,建構一個資料採礦平台。最近數據成長的速度已超乎我們的想像,此平台結合雲端運算可以提供分析大量數據。且使用者無須了解太多的程式語言,即可依循平台提供的資料採礦流程,快速簡易的完成初步資料分析的動作。本研究的資料採礦系統操作簡易,只需要選取所要預測的目標變數和建模的解釋變數即可分析,分析資料流程也依循CRISP-DM建立此平台。

英文摘要

In recent year, Cloud Computing has become one of the hot topics in the area of information technology. It is easy to get information which users want by connect to internet. It could save operation time, and make cost down. This study will establish an analysis platform based on its immediateness and its high-speed characteristic. The amount of data grow in unimaginable speed, the analysis platform can analysis big data. And that users do not need to know other programing codes or formulas about the results, they can easily analysis data with this platform. The user can operate the system easily, and the user need only select the target variable and explanatory variables. In addition, the analysis process follow the CRISP-DM.

主题分类 基礎與應用科學 > 資訊科學
基礎與應用科學 > 統計
社會科學 > 管理學
参考文献
  1. Statlab。(http://statlab.nchc.org.tw/rnotes/?page_id=547) 。摘錄於2013 年6 月。
  2. Cloud R。(http://epigenomics.ncu.edu.tw/Cloud-R/about_Cloud-R_en.php) 。摘錄於2013 年6 月。
  3. 王耀聰、陳威宇(2009) 。雲端運算簡介。國家高速網路中心。
  4. R PHP。(http://dssm.unipa.it/R-php/) 。摘錄於2013 年6 月。
  5. TIOBE Programming Community Index for May 2013 。(http://www.tiobe.com/index.php/content/paperinfo/tpci/index.html) 。摘錄於2013 年6 月。
  6. TKU NetStat: tkustat- 淡江大學。(http://netstat.stat.tku.edu.tw/) 。摘錄於2013 年6月。
  7. Berry, M.J.A.,Linoff, G.(1997).Data Mining Techniques: For Marketing Sale and Customer Support.Wiley Computer.
  8. Box, G.,Jenkins, G.(1970).Time Series Analysis: Forecasting and Control.San Francisco:Holden-Day.
  9. Breiman, L.(2001).Random Forests.Machine Learning,45(1),5-32.
  10. Cabena, P.,Hadjinian, P.O.,Stadler, R.,Verhees, J.,Zanasi, A.(1997).Discovering Data Mining from Concept to Implementation.New Jersey:Prentice Hall.
  11. Cherkassky, V.,Ma, Y.(2004).Practical selection of SVM parameters and noise estimation for SVM regression.Neural Network,17,113-126.
  12. Fayyad, M.U.(1996).Data Mining and knowledge Discovery: Making Sense Out of Data.IEEE Expet,11(5),20-25.
  13. Griffin, W.L.,Fisher, N.I.,Friedman, J. H.,Ryan, C.G.(1997).Statistical Techniques for the Classification of Chromites in Diamond Exploration Samples.Journal of Geochemical Exploration,59,223-249.
  14. Gunn, S.R.(1998).,Dept of Electronics and Computer Science, University of Southampton.
  15. Sultan, Nabil(2010).Cloud computing for education: A new dawn.International Journal of Information Management,30(2),109-116.
  16. Tay, F. E. H.,Cao, L.(2001).Application of support vector machines in financial time series forecasting.Omega,29,309-317.
  17. 日經BP社出版局、鄧瑋敦譯(2010)。雲端運算大解密。台北市:電腦人文化。
  18. 林坤賢(2010)。碩士論文(碩士論文)。桃園縣,國立中央大學系統生物與生物資訊研究所。
  19. 林真真(2007)。統計分析與應用手冊─使用R軟體。文魁圖書。
  20. 林梓涵(2011)。PHP+MySQL與Dreamweaver互動網站程式設計。台北市:碁峰資訊。
  21. 胡世忠(2013)。雲端時代的殺手級應用:Big Data 海量資料分析。台北:天下雜誌。
  22. 陳景祥(2010)。R軟體:應用統計方法。台北市:東華書局。
  23. 陳瀅(2010)。雲端策略。台北市:天下雜誌股份有限公司。
  24. 陸嘉恒(2012)。Hadoop 實戰技術手冊。台北市:佳魁資訊股份有限公司。
  25. 黃重憲(2009)。淺談雲端運算(Cloud Computing)。國立臺灣大學計算機及資訊網路中心電子報,8
  26. 歐萊禮、柳百郁譯(2012)。資料之美:優雅資料解決方案的幕後秘辛。台北:Oreilly 歐萊禮中文圖書。
  27. 歐萊禮、蔡秉峰譯、陳建勳譯(2007)。Java Script 學習手冊。台北:Oreilly 歐萊禮中文圖書。
  28. 蔡憲維、陳朝鈞、辛曼榕(2010)。PHP+MySQL 網站系統開發講座。台北縣:博碩文化股份有限公司。
  29. 謝邦昌(2010)。雲端運算在資料採礦和商業智慧上的應用實現。2010 兩岸應用統計研討會,台北:
  30. 謝邦昌、鄭宇庭、蘇志雄(2010)。SQL Server 2008 R2 資料採礦與商業智慧。台北:碁峰資訊。
被引用次数
  1. 陳俐靜(2016)。雲端運算於健康管理推薦機制之研究。淡江大學管理科學學系企業經營碩士在職專班學位論文。2016。1-124。