


Study of correlation and forecasting of Major Adverse Cardiac events and environmental factors




萬擎(Ching Wan);謝邦昌(Ben-Chang Shia);廖佩珊(Pei-San Liao)


全民健康保險研究資料庫 ; 資料採礦 ; 心血管疾病 ; 氣候氣象 ; 空氣汙染 ; National Health Insurance Research Database ; Data Mining ; Major Adverse Cardiac events ; Environment pollution


Journal of Data Analysis


11卷4期(2016 / 08 / 01)


21 - 50




近年人們生活型態的轉變,國人健康狀況普遍不佳,造就許多疾病的產生,其中心血管疾病更是占台灣十大死因的大宗,然而也因為氣候變遷與環境污染越來越嚴重,空氣汙染與氣候異常與心血管疾病如缺血性心臟病、腦血管心臟病等息息相關。本論文研究重大心血管不良事件之影響因素及預測模型,以供日後醫師與學者做為參考。本研究應用Pearson 相關分析討論氣象與環境因子之間互相的關聯性,並利用羅吉斯迴歸找出顯著的變數。另外建立資料採礦方法如隨機森林、支援向量、決策樹、類神經網路等探討不同時間點的環境氣象因子對發生重大心血管不良事件預測模型。實證發現,以羅吉斯迴歸找出影響重大心血管不良事件的顯著變數有二氧化氮、PM2.5、風速、能見度、溫差等。另外建立預測模型發現在1:1 的資料集為最好的預測模式,且最好的預測模型為隨機森林與決策樹模型。


In this study, the data came from National Health Insurance Research Database and selected the person who are 15 years old above and under 100 years old from 2008 to 2013 as the sample of data analyze and modeling. This study also used data mining technology to establish Standard Operation Procedure of National Health Insurance Research Database and built various models such random forest, artificial neural network, decision tree and support vector machine to find out the correlation between environment pollution and major adverse cardiac events. And find influential factors for person suffer from major adverse cardiac events. The results showed that environment pollution factors will cause any affection to major adverse cardiac events and the random forest is the best method to predict person who will suffer from major adverse cardiac events. In conclusion, we hope the result of the study can provide the reference for medical research.

主题分类 基礎與應用科學 > 資訊科學
基礎與應用科學 > 統計
社會科學 > 管理學
  1. 王玉純、宋鴻(2006)。綜論氣象變化對心血管、呼吸道及腸胃道之健康衝擊。台灣衛誌,25(4),256-265。
  2. 高彥鈞(2015)。碩士論文(碩士論文)。新北市,私立天主教輔仁大學應用統計研究所。
  3. 張瓈文(2012)。碩士論文(碩士論文)。新北市,私立天主教輔仁大學應用統計研究所。
  4. 全民健康保險研究資料庫:http://nhird.nhri.org.tw/date_01.htm。http://nhird.nhri.org.tw/date_01.htm
  5. 國立台灣大學公共衛生學院流行病學與預防醫學研究所出版論文,台北市。
  6. 中央氣象資料庫: http://opendata.cwb.gov.tw/about。http://opendata.cwb.gov.tw/about
  7. Bhaskaran, K.,Hajat, S.,Haines, A.(2010).Short term effects of temperature on risk of myocardial infarction in England and Wales: time series regression analysis of the Myocardial Ischaemia National Audit Project (MINAP) registry.BMJ,341,c3823.
  8. Breiman, L.(2001).Random Forests.Machine Learning,45(1),5-32.
  9. Gao, Z.,Wilson, T.E.,Drew, R.C.(2012).Altered coronary vascular control during cold stress in healthy older adults.Am J Physiol Heart Circ Physiol,302,H312-8.
  10. Ho, T. K.(1998).The random subspace method for constructing decision forests.IEEE Trans. on Pattern Analysis and Machine Intelligence,20(8),832-844.
  11. Johnson, R. A.,Wichern, D. W.(2007).Applied Multivariate Statistical Analysis.USA:Pearson Education, Inc.
  12. Kaplan, E.L.,Meier, P.(1958).Nonparametric estimation from incomplete observations.Journal of the American Statistical Association,53(282),457-481.
  13. Kutner, M. H.,Nachtsheim, C. J.,Neter, J.,Li, W.(2005).Applied Linear Statistical Models.NY:McGraw-Hill/Irwin.
  14. Le Tertre, A.,Medina, S.,Samoli, E.(2002).Short-term effects of particulate air pollution on cardiovascular diseases in eight European cities.J Epidemiol Community Health,56,773-9.
  15. Sharovsky, R.,César, L.A.,Ramires, J.A.(2004).Temperature, air pollution, and mortality from myocardial infarction in São Paulo, Brazil.Braz J Med Biol Res,37,1651-7.
  16. Smolander, J.(2002).Effect of cold exposure on older humans.Int J Sports Med,23,86-92.
  17. Vapnik, A.,Lerner, A.(1963).Pattern recognition using generalized portrait method.Automation and Remote Control,24,774-780.
  18. Wackerly, D. D.,Mendenhall, W., III,Scheaffer, R. L.(2008).Mathematical Statistics with Applications.Belmont:Brooks/Cole.
  19. Warren-Gash, C.,Smeeth, L.,Hayward, A.C.(2009).Influenza as a trigger for acute myocardial infarction or death from cardiovascular disease: a systematic review.Lancet Infect Dis,9,601-10.
  20. Yang, A.C.,Fuh, J.-L.,Huang, N.E.,Shia, B.-C.,Peng, C.-K.(2011).Temporal Associations between Weather and Headache: Analysis by Empirical Mode Decomposition.PLoS ONE
  21. Yang, A.C.,Huang, N.E.,Peng, C.-K.,Tsai, S.-J .(2010).Do Seasons Have an Influence on the Incidence of Depression? The Use of an Internet Search Engine Query Data as a Proxy of Human Affect.PLoS ONE,5(10),e13728.
  22. Yang, Albert C.,Tsai, Shi-Jen,Huang, Norden E.(2010).Decomposing the association of completed suicide with air pollution, weather, and unemployment data at different time scales.ELSEVIER.
  23. 王彥鈞(2012)。碩士論文(碩士論文)。國立臺灣大學流行病學與預防醫學研究所。
  24. 朱起飛(2006)。數據挖掘技術:市場營銷、銷售與客戶關係管理領域應用。北京市:機械工業出版社。
  25. 李雨茜(2012)。碩士論文(碩士論文)。新北市,私立天主教輔仁大學應用統計研究所。
  26. 李彥杰(2013)。碩士論文(碩士論文)。新北市,私立天主教輔仁大學應用統計研究所。
  27. 林建甫(2008)。存活分析。台北市:雙葉書廊有限公司。
  28. 紀懿芳(2013)。碩士論文(碩士論文)。新北市,私立天主教輔仁大學應用統計研究所。
  29. 孫莓婷(2005)。碩士論文(碩士論文)。台北市,國立政治大學統計系碩士班。
  30. 陳映辰(2015)。碩士論文(碩士論文)。高雄醫學大學職能治療學系。
  31. 曾奕翔(2015)。碩士論文(碩士論文)。新北市,私立天主教輔仁大學應用統計研究所。
  32. 廖珮珊(2005)。迴歸分析。台北市:瑞霖企業管理顧問有限公司。
  33. 趙晧恩(2014)。碩士論文(碩士論文)。新北市,私立天主教輔仁大學應用統計研究所。
  34. 劉思廷(2015)。碩士論文(碩士論文)。國立陽明大學環境與職業衛生研究所。
  35. 賴昂廷(2012)。氣候變遷與人類健康。內科學誌,23,343-350。
  36. 謝邦昌(2014)。Excel 2013 資料採礦完全手冊。新北市:中華資料採礦協會。
  37. 謝邦昌(2014)。SQL Server 資料採礦與商業智慧。台北市:碁?資訊股份有限公司。
  38. 魏國閔(2014)。碩士論文(碩士論文)。國立彰化師範大學統計資訊研究所。