题名

日本語関係人文系研究の質的研究におけるテキストマイニング手法の応用と課題

并列篇名

文本探勘用之於日語相關人文類研究方面的質性研究應用與課題|Qualitative Research in the Humanities on Japanese Language: Applications and challenges of text mining methods

DOI

10.6183/NTUJP.202006_(39).0005

作者

落合由治(Yuji Ochiai)

关键词

日本語 ; 人文系研究 ; テキストマイニング ; 質的研究 ; 応用 ; 日語 ; 人文類研究 ; 文本探勘 ; 質性研究 ; 應用|Japanese ; humanities research ; text mining ; qualitative research ; application

期刊名称

台大日本語文研究

卷期/出版年月

39期(2020 / 06 / 01)

页次

101 - 130

内容语文

日文

中文摘要

現在までの日本語に関わる研究では、計量言語学的手法は計量言語学的分野や課題に限定され、他の日本語学研究領域では、データマイニング(テキストマイニング)技法の応用はかなり限定的なものであったが、コーパスや電子データが普及したことで、それらを利用した研究の動きが始まっている。本論文では第三次AI技術での重要部分である自然言語処理の一分野である、データマイニング手法を言語資料に適用して有意義な資料を取り出すテキストマイニング技法を取り上げて、日本語学および日本語教育等の日本語関係人文系研究の質的研究への応用を試みてみた。その結果、質的分析は、逆にテキストマイニングを使った量的分析を手掛かりにして、テクストに含まれている多様で重層的な意味空間(文脈のまとまりを作る質的な意味関係の集合)の層をたどることが可能になることがわかり、テキストマイニングの導入で、より多様性と客観性のある成果に繋げる道が開かれることが明らかになった。

英文摘要

目前日語相關研究上使用的計量語言學研究方法,大多偏向計量語言學領域與課題。而應用於其他日本語學、文學相關研究領域上的資料探勘(文本探勘),卻仍然非常有限。由於當今語料庫或電子資料的普及,逐漸形成將之廣泛應用於各領域研究的趨勢。本論文乃是利用第三代AI技術之自然言語處理重要領域的資料探勘手法,特別是善用從龐雜的資料中擷取有意義的資訊之文本探勘技術,嘗試探討應用於日語以及日語教育等日語相關人文類研究的質語。研究結果顯示:以文本探勘技術的量化分析為依據,反而可以將蘊藏於文本中的多元化以及多層次的意義(建立文脈組織的質化意味的集合)等質性分析結果彰顯出來。並可以確定透過導入文本探勘技術,將多元性且客觀性的成果呈現出來。|Up to the present in research related to the Japanese language, the quantitative linguistic method is limited to quantitative linguistic disciplines and issues. In other areas of Japanese language studies, the application of data mining (text mining) techniques has been quite limited. However, with the widespread use of corpora and electronic data, there has been a movement towards research using them. In this paper, I focus on text mining techniques to extract meaningful material by applying data mining methods to linguistic materials, which is a field of natural language processing that is an important part of the third AI technology. This study is an attempt at text mining into a qualitative study of Japanese language related humanities studies, including Japanese language studies and Japanese language education. As a result, when performing qualitative analysis, it is possible to trace the layers of diverse and layered semantic spaces (sets of qualitative semantic relations that make up a context) contained in a text by using text mining as a cue. The application of text mining into humanities research in the Japanese language paves the way for more diverse and objective results.

主题分类 人文學 > 語言學
人文學 > 外國文學
参考文献
  1. GUBA, E.(ed.)(1990).The Paradigm Dialog.Newbury Park:Sage Publicatiens.
  2. GUBA, E.,LINCOLN, Y.(1989).Fourth Generation Evaluation.Newbury Park:Sage Publication.
  3. Hammersley, M.,Atk-inson, P.(1983).Ethnography: Principles in Practic.London:Routledge.
  4. Kubota, K(1991).Developing an alternative Learning Environment:A Constructivist View.Bloomington:Indiana University.
  5. Lincoin, Y.,Guba, E.(1985).Naturalistic Inquiry.Beverly:Sage Publications.
  6. LogmiTech(2015)「スマニューにも使われる「自然言語処理」ってなに?」 https://logmi.jp/tech/articles/45207(2020年3月20日閱覽)
  7. MathLab 「Text Analitics Toolbox」 https://jp.mathworks.com/help/textanalytics/ug/analyze-japanese-text.html
  8. Merriam, S.B.(1988).Case Study Research in Edcation: A Qualitative App-roach.San Francisco:Jossey-Bass Publishers.
  9. Mikolov, Tomas(2013).,未出版
  10. S.B.メリアム、堀薫夫翻訳、久保真人翻訳、成島美弥翻訳(2004)。質的調查法入門:教育における調查法とケース.スタディ。ミネルヴァ書房。
  11. ジェラルド.プリンス、遠藤健一訳(1991)。物語論辞典。松柏社。
  12. 人工知能学会『人工知能』https://www.ai-gakkai.or.jp/published_books/journals_of_jsai/
  13. 人工知能学会(2019)。特集:「深層学習による言語生成」。人工知能学会誌,34(4)
  14. 久保田賢一(1995)。教授.学習理論の哲学的前提:パラダイム論の視点から。日本教育工学雜誌,18(3_4),219-231。
  15. 久保田賢一(2003)。構成主義が投げかける新しい教育。コンピュータ&エデュケーション,15,12-18。
  16. 久保田賢一(1997)。質的研究の評価基準に関する一考察:パラダイム論からみた研究評価の視点。日本教育工学雜誌,21(3),163-173。
  17. 大谷尚(2008)。質的研究とは何か—教育テクノロジー研究のいっそうの拡張をめざして。教育システム情報学会誌,25(3),340-354。
  18. 大谷尚(2017)。質的研究とは何か。藥學雜誌,137(6),653-658。
  19. 小川芳樹編、長野明子編、菊池朗編(2016)。コーパスからわかる言語変化.変異と言語理論。開拓社。
  20. 山內長承(2017)。Python によるテキストマイニング入門。オーム社。
  21. 山崎誠(2017)。テキストにおける語彙的結束性の計量的研究。和泉書院。
  22. 今井耕介、粕谷裕子訳、原田勝孝訳、久保浩樹訳(2018)。社会科学のためのデータ分析入門上。岩波書店。
  23. 今井耕介、粕谷裕子訳、原田勝孝訳、久保浩樹訳(2018)。社会科学のためのデータ分析入門下。岩波書店。
  24. 日本語学会(2018)。特集2016年.2017年における日本語学界の展望。日本語の研究,14(3)
  25. 永尾章曹編(1992)。日本語学。和泉書院。
  26. 石田基広(2017)。Rによるテキストマイニング入門。森北出版。
  27. 西口光一(2015)。対話原理と第二言語の習得と教育—第二言語教育におけるバフチン的アプローチ。くろしお出版。
  28. 西口光一(2013)。第二言語教育におけるバフチン的視点—第二言語教育学の基盤として。くろしお出版。
  29. 村上祐介(2011)。教育学における事例研究の方法論再考:定性的研究における比較の方法(<特集>教育学における新たな研究方法論の構築と創造)。教育学研究,78(4),398-410。
  30. 言語処理学会『自然言語処理』https://www.anlp.jp/abst/index.html
  31. 岩崎拓也(2017)。読点が接続詞の直後に打たれる要因—Elastic Netを使用したモデル構築と評価。計量国語学,31(6),426-442。
  32. 東宏一(2011)。Web上の政治的発言の分類とその応用。人工知能学会全国大会論文集
  33. 松田謙次郎(2017)。変異理論における一般化線型混合モデルの導入。計量国語学,31(6),402-416。
  34. 相澤正夫編、金澤裕之編(2016)。SP盤演説レコードがひらく日本語研究。笠間書院。
  35. 計量国語学会『計量国語学』http://www.math-ling.org/archives/index.html (2020年3月20日閱覽)
  36. 時枝誠記(1988)。日本文法口語篇。岩波書店。
  37. 時枝誠記(1971)。国語学原論—言語過程説の成立とその展開。岩波書店。
  38. 情報処理学会『情報処理』https://www.ipsj.or.jp/e-library/digital_library.html
  39. 清水勇吉(2015)。博士論文(博士論文)。德島大学。
  40. 黑澤義明、竹澤寿幸(2011)。自己組織化マップSOMを用いた擬情語の分類比較。人工知能学会全国大会論文集
  41. 奧村学(2010)。自然言語処理の基礎。オーム社。
  42. 奧村学監修、佐藤誠一(2015)。トピックモデルによる統計的潜在意味解析。コロナ社。
  43. 遠藤織枝編、小林惠美子編、佐竹久仁子編、高橋美奈子編(2016)。談話資料日常生活のことば。ひつじ書房。
  44. 斎藤康毅(2018)。ゼロから作るDeep Learning②自然言語処理編。オライリー.ジャパン。
  45. 樋口耕一(2014)。社会調查のための計量テキスト分析—內容分析の継承と発展を目指して。ナカニシヤ出版。
  46. 樋口耕一(2017)。計量テキスト分析およびKH Coderの利用状況と展望。社会学評論,68(3),334-350。
  47. 荘島幸子(2008)。<研究論文>1事例研究再考:個を理解するということをめぐって。教育方法の探究,11,17-24。
被引用次数
  1. 賴錦雀(2023)。学習者の振り返りから見るDX時代における日本語教育とAI翻訳機。台灣日語教育學報,40,91-119。
  2. 林蔚榕(2023)。テキストマイニングを用いたプロフェッショナリズム要素の分析-プロが思う「プロフェッショナルとは」を事例として-。台大日本語文研究,45,121-150。
  3. 落合由治(2022)。AI情報処理技術教育の日本語文学科への導入の試み。台灣日語教育學報,38,1-30。
  4. 落合由治(2022)。言語表現ジャンルに応じたAIテキストマイニング手法の活用-書き言葉と話し言葉の特徴抽出を中心に-。台灣日本語文學報,51,77-102。