题名

《史記》作者數位化研究初探-以三十世家虛字字頻為例

并列篇名

Digital Humanities for Authorship Attribution Problem of Shiji: Based on Frequency of Function Words Within the Hereditary Houses Section

DOI

10.6853/DADH.201810_2.0003

作者

邱詩雯(Shih-Wen Chyu)

关键词

史記 ; 司馬談 ; 司馬遷 ; 詞頻 ; 數位人文 ; Shiji ; Sima Tan ; Sima Qian ; term frequency ; digital humanities

期刊名称

數位典藏與數位人文

卷期/出版年月

2期(2018 / 10 / 01)

页次

49 - 69

内容语文

繁體中文;英文

中文摘要

《史記》成書主要歷經司馬談、司馬遷父子二人之手,司馬遷根據父親部分舊稿,撰成《史記》。今本《史記》除司馬談、司馬遷之外,亦包含褚少孫的續補。本文運用DocuSky平臺中「文本詞彙頻率統計工具」,以《史記》三十篇世家文本為對象,探討各篇文字使用詞頻的異同。先參考《史記》虛詞研究成果,選出量化標的物,就其分布進行統計檢定。再以續史者續補段落文字作為覆核的對照組,比較司馬談、司馬遷、續史者三人運用虛詞字頻是否有所差異。則透過此數位人文工具的輔助,能迅速從事文本詞彙頻率的統計,較為客觀佐證《史記》 世家篇章作者的異同。以數位人文研究方法,補強當代《史記》學研究成果。

英文摘要

The author of Shiji (史記) is Sima Qian, but part of it was rewritten according to the old manuscript of his father Sima Tan. In addition to Sima Qian and Sima Tan, Chu Shaosun is also one of the authors of Shiji. This study used term frequency statistics tool on DocuSky to count 30 chapters of Shiji. Frist, I used virtual words in Shiji as the subject matter doing statistical analysis. And then used the writing of Chu Shaosun as a control group to compare the differences in the word frequency of the three people. And we can use digital methods to prove the similarities and differences between the authors of the Shiji.

主题分类 人文學 > 人文學綜合
基礎與應用科學 > 資訊科學
参考文献
  1. 宋鄭樵(1959)。通志。臺北:新興書局。
  2. 唐劉知幾、清浦起龍釋(1980)。史通通釋。臺北:里仁書局。
  3. 梁蕭統、唐李善注(1991)。文選。臺北:藝文印書館。
  4. 漢司馬遷(2014)。史記。北京:中華書局。
  5. Manning, C. D.,Surdeanu, M.,Bauer, J.,Finkel, J.,Bethard, S. J.,McClosky, D.(2014).The Stanford CoreNLP natural language processing toolkit.52nd Annual Meeting of the Association for Computational Linguistics: System Demonstrations,Baltimore, MD:
  6. 王國維(1956)。觀堂集林。臺北:藝文印書館。
  7. 安平秋、張大可、俞樟華、韓兆琦、張新科、趙生群、何梅琴(2005)。史記通論。北京:華文出版社。
  8. 吳慶峰編(2006)。《史記》虛詞通釋。濟南:齊魯書社。
  9. 李長之(1997)。司馬遷之人格與風格。臺北:里仁書局。
  10. 杜協昌(2014)。利用文本採礦探討《紅樓夢》的後四十回作者爭議。數位人文研究與技藝,臺北:
  11. 邱詩雯(2012)。《史記》之「改」、「作」與歷史撰述。臺北:花木蘭出版社。
  12. 國立臺灣大學數位人文研究中心、國立臺灣大學資訊工程學系數位典藏與自動推論實驗室(2006)。DocuSky 數位人文學術研究平臺。取自https://docusky.digital.ntu.edu.tw/docusky/
  13. 清代詩文集彙編編纂委員會編(2010)。清代詩文集彙編。上海:上海古籍出版社。
  14. 陳大康(1987)。從數理語言學看後四十回的作者—與陳炳藻先生商榷。紅樓夢學刊,1,293-318。
  15. 趙生群(1982)。司馬談作史考。南京師大學報(社會科學版),2,51-56。
  16. 賴長揚(1981)。司馬談作史補證。史學史研究,2,40。
  17. 顧頡剛(1963)。史林雜識初編。北京:中華書局。
被引用次数
  1. 賴惠玲,劉吉軒,葉秋杏(2021)。臺灣客語語料庫建置與客語詞彙使用初探。數位典藏與數位人文,8,75-131。
  2. 李貴生(2022)。數位人文與傳統文獻的相互作用:《呂氏春秋.十二紀》聚類分析與篇章結構新探。清華中文學報,27,179-234。