题名

應用潛在語意分析於試題相似度比對 -以中華民國物流協會認證題庫為例

并列篇名

Apply the Latent Semantic Analysis for Similarity Comparison of Examination Questions -Case Study of Certification Exam by Taiwan Association of Logistics Management

作者

黃巧媛

关键词

數位學習 ; 文字探勘 ; 潛在語意分析 ; 向量空間模型 ; 試題相似性 ; e-Learning ; Text Mining ; Latent Semantic Analysis ; Vector Space Model ; Exam Questions Similarity

期刊名称

臺中科技大學流通管理系碩士班學位論文

卷期/出版年月

2016年

学位类别

碩士

导师

陳志騰

内容语文

繁體中文

中文摘要

近年來網際網路的蓬勃發展,帶來了學習方式的革新,有別於傳統課堂的數位學習模式日趨盛行,現今越來越多人使用數位學習的方式進行學習。評估學習效果時:傳統課堂主要以考試作為學習成效評估;而數位學習亦常使用線上題庫測驗來評估學習成效。但以目前的線上題庫系統,其自動出題無法直接判斷比對所出題試之間的相似度,因此本研究旨在於應用潛在語意分析方法(Latent Semantic Analysis, LSA)評估題目與題目之間相似程度,希冀能此分析方法予以未來線上題庫測驗出題之事前評估,達到有效避免出現試題答案出現相似或觀念雷同試題之目的。 本研究測試結果發現: (一) 實驗設計中對於斷詞後去除冗詞與未去除冗詞,在試題判斷相似度上,去除冗詞在判斷相似度上較佳。 (二) 物流關鍵字在一般的斷詞系統中尚未能有效進行物流關鍵字斷句,故本研究結果未得顯著性結果。 (三) 潛在語意分析對於計算相似度過程中,維度約化值的大小會影響試題判斷成效,維度約化值如何取決乃為實務應用的關鍵參數;相較於向量空間模型法(Vector Space Model, VSM)之結果言,潛在語意分析能達更精確判斷試題相似程度。 綜合上述研究結果可以證明,對於試題之相似程度分析,明顯得出潛在語意分析與向量空間模型兩者在比對試題相似度成效上,潛在語意分析更能精確判斷試題相似程度,是故潛在語意分析方法極具成為比對題庫試題相似程度之重要技術。

英文摘要

In recent years, the booming Internet has brought the new style of learning. Unlike the traditional learning, e-learning gets popular increasingly. Nowadays, more and more people are using e-learning approach. When evaluating the effect of learning, the traditional classroom uses paper and pencil tests to measure the learning effect. However, e-learning would use online exam tests to evaluate. Nevertheless, the current online exam system can not directly determine and compare the similarity between exam questions in the item pool. Therefore, this study is going to take advantage of Latent Semantic Analysis (LSA) to evaluate the degree of similarity between exam questions. To achieve the goal of avoiding the appearance of similar exam questions or concepts, I hope this analysis approach can be applied to the advance evaluation of setting online exam in the future. In this study, the results show that: (i) In the experimental design regarding removing verbiages or not, removing verbiages is a better way to judge the similarity. (ii) In general word segmentation system, logistics terminology is not able to conduct an efficient result yet. Therefore, the result is still without the significant outcomes. (iii) In the process of calculating the similarity with LSA, the magnitude of dimension reduction will affect the efficiency when judging the exam question. How the dimension reduction is depends on critical parameter for the practical application. Compared to the result of Vector Space Model (VSM), LSA can determine the similarity of exam questions more accurately. To sum up, with regards to the similarity analyze for exam questions by LSA and VSM, LSA could precisely determine the similarity. Consequently, LSA is a technique which is important for comparing the similarity of exam questions.

主题分类 人文學 > 地理及區域研究
資訊與流通學院 > 流通管理系碩士班
社會科學 > 管理學
参考文献
  1. Contreras-Piña, C., & Ríos, S. A. (2015). An empirical comparison of latent sematic models for applications in industry. Neurocomputing.
    連結:
  2. Feldman, R., & Dagan, I. (1995). Knowledge Discovery in Textual Databases (KDT). Paper presented at the KDD.
    連結:
  3. Feldman, R., & Sanger, J. (2007). The text mining handbook: advanced approaches in analyzing unstructured data: Cambridge University Press.
    連結:
  4. Huffaker, D. A., & Calvert, S. L. (2003). The new science of learning: Active learning, metacognition, and transfer of knowledge in e-Learning applications. Journal of Educational Computing Research, 29(3), 325-334.
    連結:
  5. Martin, D. I., & Berry, M. W. (2007). Mathematical foundations behind latent semantic analysis. Handbook of latent semantic analysis, 35-56.
    連結:
  6. Rosenberg, M. J. (2001). E-Learning: Strategies for delivering knowledge in the digital age (Vol. 3): McGraw-Hill New York.
    連結:
  7. 吳玟融. (2008). 台灣數位學習產業環境與商業模式分析. 中央大學企業管理學系學位論文, 1-158.
    連結:
  8. 巫啟台. (2002). 文件之關聯資訊萃取及其概念圖自動建構. 成功大學資訊工程學系學位論文, 1-59.
    連結:
  9. 禹良治. (2008). 應用語意相依關係及超空間模擬語言模型於網頁文本探勘及資訊檢索之研究.
    連結:
  10. 郭榮芳. (2005). 應用潛在語意分析於測驗題庫相似性之比對. (碩士), 國立臺灣師範大學, 台北市.
    連結:
  11. 陳良駒, &顧亦平. (2011). 植基於詞彙分析方法探索電子商務主題網絡之研究. International Journal, 3(3), 137-154.
    連結:
  12. 陳明蕾, 王學誠, &柯華葳. (2009). 中文語意空間建置及心理效度驗證: 以潛在語意分析技術為基礎. Chinese Journal of Psychology, 51(4), 415-435.
    連結:
  13. 陳家毅. (2011). 應用中文句法權重於潛在語意分析技術於中文智能教學系統之對話計分研究. (碩士), 國立臺灣大學, 台北市.
    連結:
  14. 馮樹仁. (2002). 以潛在語意分析法發展摘要寫作評量系統. (碩士), 國立臺灣師範大學, 台北市.
    連結:
  15. 黃耀民. (2004). 以字句擷取為基礎並應用於文件分類之自動摘要之研究. 臺灣師範大學資訊工程研究所學位論文, 1-78.
    連結:
  16. 葉乃菁, 王玳琪, 張嘉珍, 吳騏, &賴志遠. (2009). 建構創新政策研究工具文字探勘之應用簡介. 國研科技(22), 17-20.
    連結:
  17. 藍敏杰. (2007). 潛在語意分析之摘要評量系統─探討特定領域文章、關鍵詞、奇異值保留個數對建構語意空間及評量效度之影響. (碩士), 國立臺灣師範大學, 台北市.
    連結:
  18. 參考文獻
  19. 國內外文獻
  20. Bachman, K. (2000). Corporate e-Learning: Exploring a new frontier. WR Hambrecht+ Co.
  21. Hearst, M. A. (1999). Untangling text data mining. Paper presented at the Proceedings of the 37th annual meeting of the Association for Computational Linguistics on Computational Linguistics.
  22. Kundu, A., Jain, V., Kumar, S., & Chandra, C. (2014). A journey from normative to behavioral operations in supply chain.
  23. Shi, G., & Kong, Y. (2009). Advances in Theories and Applications of Text Mining. Paper presented at the Information Science and Engineering (ICISE), 2009 1st International Conference on.
  24. Sullivan, D. (2001). Document warehousing and text mining: techniques for improving business operations, marketing, and sales: John Wiley & Sons, Inc.
  25. 丁泓丞. (2010). 增強型潛在語意分析基礎之文件自動摘要. (碩士), 中華大學, 新竹市.
  26. 下平裕之, 小峯敦, &松山直樹. (2012). 経済学史研究におけるテキストマイニング分析の導入: ケインズ『一般理論』と書評の関係. ディスカッション・ペーパー, 山形大学人文学部法経政策学科 Discussion Paper Series(2012-E02).
  27. 日本イーラーニングコンソシアム. (2008). e ラーニング白書 2008/2009 年版: 東京電機大学出版局.
  28. 王舒可, &張保隆. (2001). 企業實施網路化訓練之關鍵成功因素.
  29. 白鎧誌. (2011). 以潛在語意分析評估詞彙重要性及其應用. (碩士), 國立臺中教育大學, 台中市.
  30. 佐々木英和. (2012). 現代日本語「自己実現」の使われ方に関する基盤的考察―テキストマイニングの手法を用いた質的データの分析―. 宇都宮大学教育学部紀要. 第 1 部.
  31. 何榮桂. (1997). 從 [測驗電腦化與電腦化測驗] 再看網路化測驗. 測驗與輔導, 第 144, 2972, 2974.
  32. 汪若文. (2004). 運用潛在語意索引的自動化文件分類. (碩士), 國立交通大學, 新竹市.
  33. 昇, 大. (2013).テキスト型データのマイニング  最近の動向とそれが目指すもの. 統計数理研究所・.
  34. 林妤芳. (2012). 以文字探勘技術預測未來大學入學考試英文試題之詞彙.輔仁大學.
  35. 馬聖珉. (2006). 一個監督式學習與非監督式學習技術應用於多國語言文件探勘之比較研究. (碩士), 國立高雄應用科技大學, 高雄市.
  36. 冨永敦子, &向後千春. (2014). e ラーニングに関する実践的研究の進展と課題. 教育心理学年報, 53(0), 156-165.
  37. 梶川裕矢. (2010). リンクマイニングを用いた引用情報の活用 (<特集>データマイニングの活用). 情報の科学と技術, 60(6), 224-229.
  38. 陳明坤. (2015). 精進教學計劃─重量訓練課程多媒體教學之研究.
  39. 陳彥霖. (2006). 應用潛在語意分析於試題相似度比較之可行性. (碩士), 國立臺灣師範大學, 台北市.
  40. 喜田昌樹. (2008). 組織革新の認知的研究; 認知変化・知識の可視化と組織科学へのテキストマイニングの導入. 認知科学, 15(4), 723-724.
  41. 植野真臣. (2007). e ラーニングにおけるデータマイニング (<特集>学習オブジェクト・学習データの活用と集約). 日本教育工学会論文誌, 31(3), 271-283.
  42. 黃貝玲. (2001). 從線上學習的發展看企業線上訓練. 電子化企業: 經理人報告, 19, 12-23.
  43. 黃國政. (2006). 運用文字探勘技術於人才招募推薦系統之研究. 靜宜大學資訊管理學系研究所學位論文, 1-92.
  44. 楊錦生. (2002). 文件探勘技術中字詞擴展之研究. (碩士), 國立中山大學, 高雄市.
  45. 葉枋瑀. (2012). 以KJ法與文字探勘探究詩詞圖像之語意網絡. (碩士), 國立新竹教育大學, 新竹市.
  46. 詹智凱. (2001). 以詞的關聯性為基礎的文件自動分類. (碩士), 國立臺灣科技大學, 台北市.
  47. 詹雅筑. (2013). 透過新聞域加權提升潛在語意分析分群之品質. (碩士), 國立雲林科技大學, 雲林縣.
  48. 劉嘉玲. (2012). 潛在語意分析於兒童記敘文詞彙教學之應用. (碩士), 國立臺中教育大學, 台中市.
  49. 蔡慶鐘. (2012). 應用文字探勘技術於疾病問答系統之研究. (碩士), 南華大學, 嘉義縣.
  50. 魏宇德. (2010). 文字探勘技術應用於自動化知識管理經驗學習系統之研究.
  51. 蘇士哲. (2001). 英漢. 漢英物流管理辭典, 源中, 台中市.
  52. 網路文獻
  53. 中小企業網路大學校
  54. http://www。smelearning。org。tw/
  55. TQC企業人才技能認證
  56. http://www。tqc。org。tw/TQC/index。asp
  57. 中華企業資源規劃學會
  58. http://www。cerps。org。tw/
  59. 智新世紀智勝創新知識管理
  60. http://www。bestwise。com。tw/About。aspx
  61. easy test 線上學習測驗平台
  62. http://www。easytest。com。tw/index。asp?m=false
  63. 博識通資訊學習平台
  64. http://www。viewlet。com。tw/
  65. 行政院國家科學委員會、數位典藏與數位學習國家型科技計畫辦公室、經濟部工業局,「2008數位學習白皮書」,資策會,台北,民國九十七年
  66. 行政院經濟部工業局,「經濟部工業局協助產業發展補助辦法」,行政院經濟部工業局,台北,民國一百年
  67. 網路智慧新台灣政策白皮書
  68. http://blog。schee。info/2015/04/28/whitepaper-smart-internet/