题名

應用CRISP-DM建立農產價量預測模型-以甘藍為例

并列篇名

CRISP-Data Mining to the Forecasting Model of Crop Price and Yield-A Case Study of Cabbage

DOI

10.6338/JDA.201302_8(1).0007

作者

辛昱辰(Yu-Chen Hsin);侯藹玲(Ai-Ling Hour);江志民(Chih-Ming Chiang)

关键词

農產品 ; 資料採礦 ; 迴歸分析 ; 時間序列 ; 類神經網路 ; 隨機森林 ; Crop ; Data Mining ; Regression Analysis ; Time Series ; Neural Networks ; Support Vector Regression ; Random Forest ; MARS ; SVR

期刊名称

Journal of Data Analysis

卷期/出版年月

8卷1期(2013 / 02 / 01)

页次

109 - 137

内容语文

繁體中文

中文摘要

隨著經濟成長以及工資和物價的上漲,通膨的壓力造成產銷成本增加,除此之外,台灣在加入WTO之後,所面對貿易自由化的趨勢,必須與全球競爭,而使得以小農經濟為主的台灣面臨重大挑戰,因此能夠取得正確及有用的資訊,並掌握市場供需的變動,才足以因應市場的變化。本研究以台灣民眾日常生活常食用的甘藍作為例子,在農產生成過程中充滿著不確定性的情況下,將生產成本、進出口貿易、產地物價、交易量、氣候等資訊作為可能影響之變數,並利用資料採礦的技術建立CRISP-DM流程,包含迴歸分析、時間序列、類神經網路、SVR、隨機森林、MARS等預測方法找出最佳之農業價量預測模型,在交易量以MARS為最佳模型;在平均價以SVR為最佳模型,研究結果期望能協助相關單位快速取得詳細的產銷預警制度,提早擬定因應措施,達到提升農業資訊力、農產穩定等目的。

英文摘要

As the increase of the economy, wages and consumer price, the pressure of Inflation causes production and marketing cost to increase. In addition, after joined the WTO, Taiwan faced the trend of trade liberalization, and had to compete against the whole world, this situation lead Taiwan to be confronted with a significant challenges. Therefore, to get correct and useful information, and grasp the changes of market supply and demand are able to react the changes in market.This study took cabbage for example, under the situation that full of uncertainty in the process of agricultural produce, regarded import and export trade, origin price, trading volume, and climate information as influence variables, and used data mining techniques to establish CRISP-DM process included regression analysis, time series, neural network, SVR and Random Forests and MARS prediction methods to find out the best agricultural forecasting model of crop price and yield. The results showed that MARS is the best model in Yield and SVR is the best model in price. This study expect the results can assist the related governmental units to obtain detailed price and yield early warning system quickly, and make countermeasure in advance, to improve the ability of agricultural information and production stability.

主题分类 基礎與應用科學 > 資訊科學
基礎與應用科學 > 統計
社會科學 > 管理學
参考文献
  1. Hsu, C. W., C. C. Lin, & C. J. Lin (2003). A practical guide to support classification, Available from: http://www.csie.ntu.edu.tw/~cjlin/papers/guide.pdf
  2. Bergerson, K.,Wunsch, D. C.(1991).A Commodity Trading Model Based on a Neural Network-expert System Hybrid.IJCNN-91
  3. Berry, M. J. A.,Linoff, G.(1997).Data Mining Techniques: For Marketing Sale and Customer Support.Wiley Computer.
  4. Box, G.,Jenkins, G.(1970).Time Series Analysis: Forecasting and Control.San Francisco:Holden-Day.
  5. Breiman, L.(2001).Random forest.Machine Learning,45(1),5-32.
  6. Cabena, P.,Hadjinian, P. O.,Stadler, R.,Verhees, J.,Zanasi, A.(1997).Discovering Data Mining from Concept to Implementation.New Jersey:Prentice Hall.
  7. Cherkassky, V.,Ma, Y.(2004).Practical selection of SVM parameters and noise estimation for SVM regression.Neural Network,17,113-126.
  8. Chiang, W. C.,Urban, T. L.,Baldridge, G. W.(1995).A Neural Network Approach to Mutual Fund Net Aasset Value Forecasting.Omega, Int. J. Mgmt. Sci.,24(2),205-210.
  9. Choi, D. H.,Ahn, B. S.,Kim, S. H.(2005).Prioritization of association rules in data mining: Multiple criteria decision approach.Expert Systems With Applications,29(4),867-878.
  10. Fayyad, M. U.(1996).Data Mining and knowledge Discovery: Making Sense Out of Data.IEEE Expet,11(5),20-25.
  11. Gooijer, Jan G.,Ray, Bonnie K.,Krager, H.(1998).Forecasting Exchange Rates Using TSTIME.Journal of International Money and Finance,17(3),513-534.
  12. Griffin, W. L.,Fisher, N. I.,Friedman, J. H.,Ryan, C. G.(1997).Statistical Techniques for the Classification of Chromites in Diamond Exploration Samples.Journal of Geochemical Exploration,59,223-249.
  13. Gunn, S. R.(1998).,Dept of Electronics and Computer Science, University of Southampton.
  14. Ho, T. K.(1998).The random subspace method for constructing decision forests.IEEE Transactions on Pattern Analysis and Machine Intelligence,20(8),832-844.
  15. Huang, C. L.,Tsai, C. Y.(2009).Ahybrid SOFM-SVR with a filter-based feature selection for stock market forecasting.Expert Systems With Applications,36(2),1529-1539.
  16. Kumar, U. A.(2005).Comparison of neural networks and regression analysis: a new insight.Computers Operations Research,21(3),249-263.
  17. Lapedes, A.,Farber, R.(1987).,Los Alamos National Laboratory.
  18. Lewis, P. A. W.,Steveans, J. G.(1991).Nonlinear Modeling of Time Series Using Multivariate Adaptive Regression Splines(MARS).The Journal of the American Statistical Association,86,864-877.
  19. Liong, S. Y.,Sivapragasam, C.(2002).Flood State Forecasting with Support Vector Machines.Journal of the American Water Resources Association,38(1),173-186.
  20. Tay, F. E. H.,Cao, L.(2001).Application of support vector machines in financial time series forecasting.Omega,29,309-317.
  21. Vapnik, V. N.(1995).The Nature of the Statistical Learning Theory.New York:Springer.
  22. Vapnik, V. N.,Golowich, S.,Smola, A.(1997).Support Vector Method for Function Approximation, Regression Estimation, and Signal Processing.Neural Information Processing Systems,Cambridge, MA:
  23. Wiener, N.(1958).Nonlinear Problems in Random Theory.Cambridge, Mass:M.I.T. Press.
  24. Zhang, G.,Patuwo, B. E.,Hu, M. Y.(1998).Forecasting with artificial neural networks: The state of art.International Journal of Forecasting,14(1),35-62.
  25. 王策玄(2002)。碩士論文(碩士論文)。國立中興大學行銷學系。
  26. 王瑞芳(2009)。碩士論文(碩士論文)。臺灣大學流行病學研究所。
  27. 王裕民(2010)。碩士論文(碩士論文)。屏東科技大學土木工程系所。
  28. 朱芫慧(2008)。碩士論文(碩士論文)。輔仁大學應用統計學研究所。
  29. 何宜鍵(1997)。碩士論文(碩士論文)。國立中正大學企業管理學系。
  30. 李惠妍(2003)。碩士論文(碩士論文)。國立成功大學企業管理學系(EMBA)專班。
  31. 李曉隆(2002)。碩士論文(碩士論文)。國立台灣科技大學企業管理學系。
  32. 林佩蓉(2002)。碩士論文(碩士論文)。國立中興大學行銷學系。
  33. 林宸翊(2009)。碩士論文(碩士論文)。輔仁大學應用統計所。
  34. 林德祥(2010)。碩士論文(碩士論文)。國立交通大學工業工程與管理學系。
  35. 邱思涵(2010)。碩士論文(碩士論文)。中國文化大學經濟學系。
  36. 唐淑娟(2001)。碩士論文(碩士論文)。屏東科技大學農企業管理研究所。
  37. 徐培哲(2007)。碩士論文(碩士論文)。逢甲大學土木工程所。
  38. 張聖宏(2011)。碩士論文(碩士論文)。國立交通大學管理學院資訊管理學程。
  39. 梁育靜(2009)。碩士論文(碩士論文)。東吳大學經濟學系。
  40. 許弘毅(2010)。碩士論文(碩士論文)。高雄醫學大學醫務管理學研究所碩士在職專班。
  41. 連偉志(2010)。碩士論文(碩士論文)。國立交通大學管理學院碩士在職專班財務金融組。
  42. 郭佩香(2009)。碩士論文(碩士論文)。輔仁大學應用統計學研究所。
  43. 郭亭君(2010)。碩士論文(碩士論文)。淡江大學管理科學研究所碩士班。
  44. 陳寬裕(2006)。結合遺傳演算法與支援向量回歸於台灣股票加權指數之預測。計量管理期刊,3(1),1-18。
  45. 陳靜怡(2003)。碩士論文(碩士論文)。輔仁大學管理學研究所碩士班。
  46. 彭克仲、陳貞伶、謝麗芳、嚴明(1998)。應用類神經網路於甘藍菜價格預測之分析。臺灣經濟,263,35-50。
  47. 曾麗華(1995)。碩士論文(碩士論文)。成功大學統計研究所。
  48. 戢桂如、蔡瓊娥、周世玉(1997)。甘藍菜價格預警系統之建立─ARiMA模式為預測基礎。臺灣經濟,246,17-26。
  49. 葉敬軒(2001)。碩士論文(碩士論文)。中興大學農產運銷研究所。
  50. 鄭永福(2000)。碩士論文(碩士論文)。成功大學統計所。
  51. 蘇志倫(1999)。碩士論文(碩士論文)。中興大學農產運銷研究所。
被引用次数
  1. 劉業萍(2016)。資料探勘技術於客戶價值分析與行銷策略之探討-以台灣生技業銷售為例。淡江大學資訊管理學系碩士在職專班學位論文。2016。1-96。 
  2. 余奕奎(2017)。氣候因子與交易量對批發市場甘藍菜交易價格影響之分析。國立臺灣大學農業經濟學系學位論文。2017。1-46。