题名 |
話題建模在中國古代典籍分析中的運用 |
并列篇名 |
An Application of Topic Modeling in the Analysis of Ancient Chinese Classical Works |
DOI |
10.6853/DADH.201910_(4).0002 |
作者 |
胡佳佳(Jiajia Hu);孟琢(Zhuo Meng) |
关键词 |
機器閱讀 ; 文本分析 ; 話題建模 ; MALLET ; machine reading ; text analysis ; topic modeling ; MALLET |
期刊名称 |
數位典藏與數位人文 |
卷期/出版年月 |
4期(2019 / 10 / 01) |
页次 |
27 - 48 |
内容语文 |
繁體中文;英文 |
中文摘要 |
話題建模,是計算機進行大規模語料分析的一個重要方法,可以發現海量文本中隱含的話題。作為自然語言處理領域的重要研究工具,話題建模已被越來越多地應用於現代漢語的文本分析中,但是對於古代漢語或者說文言文的文本分析鮮有涉及。本文以《論語》、《孟子》、《荀子》三部先秦儒家經典文本為研究對象,通過話題建模的方法,來分析、比較、討論這三部著作在主題思想上的分布與變化;旨在探討「機器閱讀」在中國古代典籍研究中的應用前景。 |
英文摘要 |
Topic modeling is a digital method to discover hidden thematic structure in large collections of unlabeled texts. It is now widely used to analyze massive modern Chinese texts from internet pages, new media and social net, like document classification and clustering, hot event detection and tracking, opinion mining and so on. This paper uses topic modeling in the analysis of the top-three classical works of pre-Qin Confucianism to discuss their ideological inheritance and development. The aim is to cast a new light on "close and direct reading" of classical Chinese texts through "distant and machine reading" and encourage some more creative usage of digital methods in the research of Chinese classical works. |
主题分类 |
人文學 >
人文學綜合 基礎與應用科學 > 資訊科學 |
参考文献 |
|
被引用次数 |