题名

DocuSky:個人文字資料庫的建構與分析平臺

并列篇名

DocuSky: A Platform for Constructing and Analyzing Personal Text Databases

DOI

10.6853/DADH.201810_2.0004

作者

杜協昌(Hsieh-Chang Tu)

关键词

DocuSky ; 個人文字資料庫 ; 系統架構 ; 文本統計分析 ; 數位人文研究平臺 ; DocuSky ; personal text databases ; system architecture ; text analytic tools ; platform for digital humanities

期刊名称

數位典藏與數位人文

卷期/出版年月

2期(2018 / 10 / 01)

页次

71 - 90

内容语文

繁體中文;英文

中文摘要

隨著數位人文領域的開展,學術或大型機構所開發的傳統典藏資料庫,已不再能滿足研究者的需求。這些典藏庫雖然能提供品質良好的文本,但內容的修訂擴增速度相當緩慢,也缺乏數位工具來幫助使用者對感興趣文本進行更深入的分析。DocuSky是可以解決這些問題的數位人文研究平臺。它允許使用者上傳全文、詮釋資料、以及經過標記的文本,來建構屬於個人的文字資料庫。使用者對這個資料庫的內容,擁有完整的控制權。一旦資料庫建立,使用者可以利用平臺所提供的多種開放工具,對資料庫內容進行存取與分析。在系統設計上,DocuSky主張文本與工具必須分離、使用者介面必須可在瀏覽器上操作。論文也舉出一些實例,說明這樣的主張如何被應用於工具開發中。

英文摘要

The main, and usually the only, purpose of most traditional digital libraries and archiving systems is to provide good contents with a retrieval system that helps one find desirable documents. This is often not sufficient for humanists who want to employ digital tools to explore properties from interesting subsets of the library or system. Humanists usually do not merely rely on the libraries or systems. They keep interesting texts in hard disks accessible for themselves. It can be hard with conventional systems to analyze properties of texts stored in personal computers. To fix this problem, it is desirable to have a platform that allows one to build personal databases that support not only common retrieval functions but also text-analytic ones. In this paper, we propose DocuSky to solve this problem. DocuSky allows a user to upload text contents to build his or her personal databass. It supports fulltext retrieval, post-classification over a search result, as well as analysis on tagged terms. Fulltext retrieval is common for searching desirable documents in a database. For any search result, post-classification groups its metadata and shows the resulting distribution. Analysis on tagged terms, on the other hand, returns a list of tagged terms occurring in that search result. They are the three major functions offered by the well-known Taiwan History Digital Library (THDL) system. In addition to these elementary functions, it also provides a couple of tools to help users analyze the contents in a database. The advance of digital humanities requires closely cooperation of computer engineers and digital humanists. DocuSky encourages tool developers and humanists to re-think about the roles of texts and content-analytics tools. In order to reduce the effort of tool development, we design a set of DocuSky APIs and widgets to ease the access to the content of a personal database.

主题分类 人文學 > 人文學綜合
基礎與應用科學 > 資訊科學
参考文献
  1. Department of Computer Science and Information Engineering, National Taiwan University. (2017). DocuSky TermStats Tool. Retrieved from https://docusky.digital.ntu.edu.tw/docusky/docuTools/TagStatsTool/index.html
  2. Ho, H. I. B.,& Weerdt, H. D. (2014). MARKUS. Retrieved from http://dh.chinese-empires.eu/beta/
  3. Hsieh, P.-Y. K. (2016b). Text stylish analysis tool. Retrieved from https://docusky.digital.ntu.edu.tw/docusky/docuTools/TextStylishTool/textstylish.html
  4. Hsieh, P.-Y. K.(2016).Development and deployment of tools based on DocuSky platform.DADH 2016: 7th International Conference of Digital Archives and Digital Humanities,Taipei, Taiwan:
  5. Kanseki Repository.(n.d.)。漢リポKanseki Repository。取自https://www.kanripo.org
  6. 杜協昌(2018)。DocuXml 1.0 Draft。取自https://docusky.digital.ntu.edu.tw/docusky/documentation/docs/DocuXml-1.0-Draft.html
  7. 杜協昌(2017)。DocuWidgets 使用導引(草稿)。取自http://docusky.digital.ntu.edu.tw/docusky/documentation/docs/DocuWidgets-UsersGuide-2017-August.html
  8. 杜協昌(2014)。利用文本採礦探討《紅樓夢》的後四十回作者爭議。數位人文研究與技藝,臺北:
  9. 杜協昌(2016)。半自動詞彙擷取:簡化的詞夾子方法以及其JavaScript元件的開發與應用。數位人文:在過去、現在和未來之間,臺北:
  10. 國立臺灣大學數位人文研究中心(2009)。臺灣歷史數位圖書館(THDL)。取自http://thdl.ntu.edu.tw/
  11. 國立臺灣大學數位人文研究中心、徐源(2017)。本草經集注。doi:10.6681/NTURCDH.DB_DocuSkyBencaojing/Text
  12. 國立臺灣大學數位人文研究中心、國立臺灣大學資訊工程學系數位典藏與自動推論實驗室(2006)。DocuSky 數位人文學術研究平臺。取自https://docusky.digital.ntu.edu.tw/docusky/
  13. 國立臺灣數位人文研究中心、國立臺灣大學資訊工程學系數位典藏與自動推論實驗室(n.d.)。DocuGIS。取自https://docusky.digital.ntu.edu.tw/docusky/docuTools/DocuGIS/
  14. 曹又霖(2016)。碩士論文(碩士論文)。臺北,國立臺灣大學資訊工程研究所。
  15. 陳琤(2017)。碩士論文(碩士論文)。臺北,國立臺灣大學資訊工程研究所。
  16. 謝博宇(2016)。以DocuSky 為核心的工具開發與建置。2016 第七屆數位典藏與數位人文國際研討會,臺北,臺灣:
  17. 簫堯藝文網籌建處(2014)。簫堯藝文網界。取自http://www.xysa.com/
  18. 羅鳳珠、張智星、許介彥(2006)。新詩改罷自長吟—唐詩吟唱虛擬實境教學網站。取自http://cls.lib.ntu.edu.tw/tang/index.html
被引用次数
  1. 曹德啟(2022)。以DocuSky平臺閱讀《洛陽伽藍記》。數位典藏與數位人文,9,123-147。
  2. 曹德啟,洪一梅(2020)。從DocuSky談Metadata在數位人文研究中的設計與運用:以佛教石刻題記為範例材料。數位典藏與數位人文,5,117-153。
  3. 陳琤,胡其瑞,杜協昌(2019)。數位文本詮釋資料的加值與應用-以DocuSky詮釋資料整合建庫工具為例。數位典藏與數位人文,4,71-107。
  4. 陳冠霖(2022)。《朝鮮王朝實錄》在DocuSky數位人文學術研究平台上的移植及意義。數位典藏與數位人文,9,15-36。
  5. 陳淑君(2021)。互通性在數位人文學的設計:以居延漢簡的釋讀及復原研究為例。教育資料與圖書館學,58(2),193-235。
  6. 陳志銘,張鐘,徐志帆(2020)。羅家倫先生文存數位人文研究平臺之建置與應用。數位典藏與數位人文,5,73-115。
  7. 杜協昌(2022)。DocuSky的二元關聯視覺化呈現工具。數位典藏與數位人文,10,67-95。
  8. 杜協昌(2022)。一個數位人文內容研究的文本擷詞工具。數位典藏與數位人文,9,37-63。
  9. 胡其瑞(2020)。DocuSky與民間故事型態分析。數位典藏與數位人文,6,37-67。
  10. 胡其瑞(2020)。數位人文視野下的華人宗教研究:以DocuSky數位人文學術研究平臺為例。華人宗教研究,16,137-168。
  11. 李祐陞,王祥安(2021)。中央研究院數位人文研究平台之發展與應用。數位典藏與數位人文,7,99-131。
  12. (2024)。數位人文視角下《淡新檔案》中的教堂、教士與教民。臺灣宗教研究,23(1),159-187。