题名

以重大訊息文本數據為基礎之上市公司風險預警模型之研究

并列篇名

RESEARCH ON EARLY RISK WARNING MODEL OF LISTED COMPANIES BASED ON MATERIAL TEXT INFORMATION

DOI

10.6338/JDA.202304_18(1).0003

作者

郭螢璇(Ying-Hsuan Kuo);李御璽(Yue-Shi Lee);陳明輝(Ming-Huei Chen);林基玄(Chi-Hsuan Lin);徐靜婷(Jing-Ting Hsu)

关键词

重大訊息 ; TCRI ; 文本分類 ; 文字探勘 ; Material Information ; TCRI ; Text Classification ; Text Mining

期刊名称

Journal of Data Analysis

卷期/出版年月

18卷1期(2023 / 04 / 01)

页次

43 - 74

内容语文

繁體中文;英文

中文摘要

股票市場作為上市公司籌集資金的主要途徑之一,同時亦為資金門檻相對低且操作方式相對容易的標的物之一,其變化影響著整個市場經濟。為確保市場資訊之公平與透明,各國政府與投資人皆尤其重視資訊揭露,臺灣則於證券交易所之「公開資訊觀測站」平台提供所有公司之財務、營運及公司治理等資訊。由股票市場分析方法之消息面角度切入,公開資訊觀測站揭露之重大訊息雖相對其餘市場消息更具正確性,然而大量的資訊是否得以被投資者消化與接受?是否真的能幫助投資人做出正確的判斷?為達到資訊揭露制度之效益,投資者能有效地利用這些資訊,並制定正確的投資決策應為首要條件。本研究主要以公開資訊觀測站公布之上市公司各式重大訊息為文本輸入資料,以及各上市公司之TCRI信用評等作為目標變數,利用文字探勘技術與分類機器學習進行文本分類,自然語言處理部分以Jieba斷詞系統進行斷詞,TF-IDF(Term Frequency - Inverse Document Frequency)計算字詞重要性,詞袋模型(Bag-of-Words Model,BoW)將字詞轉換為結構化向量,進一步建構風險預警模型,並評估、比較模型效果,以期為投資人提供正確的投資決策參考,同時驗證重大訊息公告之效益。

英文摘要

As one of the main method for listed companies to raise funds, the stock market is also one of the objects with relatively low capital level and relatively easy operation. Its changes affect the entire market economy. In order to ensure the fairness and transparency of the market information, governments and investors of all countries focus on information disclosure. The Market Observation Post System of the Taiwan Stock Exchange provides the financial, operational and corporate governance information of all companies. From the point of view of the stock market analysis method, although the information disclosed by the Market Observation Post System is more accurate than other market information, however, can there be a large amount of information be digested and accepted by investors? Can it really help investors make correct judgments? In order to achieve the benefits of the information disclosure system, investors should be able to effectively use these information and make correct investment decisions. This research uses material information of listed companies in the Market Observation Post System as text input data, and TCRI credit ratings of listed companies as target variables. Text classification technology in text mining is used to classify text. In natural language processing, Jieba word segmentation system, TF-IDF method and Bag-of-Words (BoW) Model are used to segment words, calculate word importance and convert words into structured vectors, respectively. Based on the structured vectors, this research constructs an early risk warning model, which evaluates and compares the effects of the model. The purposes of this research are to provide investors with correct reference for investment decisions and verify the effectiveness of material information.

主题分类 基礎與應用科學 > 資訊科學
基礎與應用科學 > 統計
社會科學 > 管理學
参考文献
  1. 李顯儀,吳幸姬(2005)。台灣股票市場中訊息的反應與傳遞效果之研究。輔仁管理評論,12(3),71-94。
    連結:
  2. 盧陽正,魏裕珍,張倉耀,廖婉茹(2012)。公開新聞之資訊內涵能否增進臺灣企業信用評級慣用指標的預測能力?。台灣金融財務季刊,13(4),27-53。
    連結:
  3. 隨機森林算法的秘密(2018年7月18日)。每日頭條。2022年12月30日,取自:https://kknews.cc/code/pgnx4kj.html。
  4. TEJ信用風險觀測TCRI(2010)。台灣經濟新報社。2022年8月30日,取自:https://www.tej.com.tw/webtej/doc/crwatch.htm。
  5. TCRI台灣企業信用風險指標(無日期)。台灣經濟新報。2022年8月30日,取自:https://www.tej.com.tw/solution/TCRI%E2%84%A2%20%E5%8F%B0%E7%81%A3%E4%BC%81%E6%A5%AD%E4%BF%A1%E7%94%A8%E9%A2%A8%E9%9A%AA%E6%8C%87%E6%A8%99。
  6. Baesens, B.(2003).K.U.Leuven.
  7. Bosch, O.,Steffen, S.(2011).On syndicate composition, corporate structure and the certification effect of credit ratings.Journal of Banking and Finance,35(2),290-299.
  8. Eberendu, A. C.(2016).Unstructured Data: an overview of the data of Big Data.International Journal of Computer Trends and Technology,38,46-50.
  9. Frost, C.(2007).Credit rating agencies in capital markets: a review of research evidence on selected criticisms of the agencies.Journal of Accounting, Auditing and Finance,22(3),469-492.
  10. Khatami, S.,Marchica, M.,Mura, R.(2016).Rating friends: the effect of personal connections on credit ratings.Journal of Corporate Finance,39(1),222-241.
  11. Talib, R.,Hanif, M.K.,Ayesha, S.,Fatima, F.(2016).Text Mining: Techniques, Applications and Issues.International Journal of Advanced Computer Science and Applications,7(11),414-418.
  12. Vu, T. T.,Chang, S.,Ha, Q. T.,Collier, N.(2012).An experiment in integrating sentiment features for tech stock prediction in twitter.Proceedings of the Workshop on Information Extraction and Entity Analytics on Social Media Data
  13. 王美齡(2019)。國內外重大訊息案例研析。證券服務,637,23-40。
  14. 王詮富(2011)。國立台灣大學財務金融研究所。
  15. 王慶助(2016)。國立臺北大學國際財務金融研究所。
  16. 吳翠峯(2017)。私立東海大學財務金融研究所。
  17. 宋軒綾(2017)。國立中興大學財務金融研究所。
  18. 李宜雯(2011)。資訊揭露—證券市場的防腐劑。證券暨期貨月刊,29(11),5-16。
  19. 林佳慧(2017)。私立銘傳大學資訊工程研究所。
  20. 林美雯(2016)。私立東吳大學會計研究所。
  21. 林振東(2015)。淺論重大訊息揭露制度。證券服務,64,117-118。
  22. 張華平(2000)。證券化淺介。都市更新簡訊,6,14-15。
  23. 張漢傑(2001)。淺談重大資訊對股價的重大魅力。會計研究月刊,193,88-96。
  24. 莊慶仁,許溪南(2009)。台灣股市相關政策對股市之影響。證交資料,489,2-25。
  25. 許鏵文(2015)。私立靜宜大學會計研究所。
  26. 陳彥龍(2020)。國立暨南國際大學資訊工程研究所。
  27. 陳詠華(2004)。私立中國文化大學會計研究所。
  28. 單良,蒙志偉,郭姣君,王慧喧(2000).信用評等模型12堂課-以消費金融為例.台北:台灣金融研訓院.
  29. 曾子倩(2021)。國立中央大學資訊管理研究所。
  30. 馮雅民(2007)。私立樹德科技大學資訊管理研究所。
  31. 黃昱軒(2019)。私立輔仁大學金融與國際企業研究所。
  32. 葉鴻青(2016)。國立交通大學財務金融研究所。
  33. 劉郁靖(2012)。私立義守大學財務金融研究所。
  34. 謝碧珠(2000)。縮短財報空窗期值肯定提昇資訊品質待立法公開發行公司月財務資訊及重大資訊公開之法制問題研議-建議修正證券交易法部分條文。會計研究月刊,180,123-126。
  35. 羅雅慧(2007)。私立世新大學財務金融研究所。
  36. 蘇筱涵(2021)。私立亞洲大學會計與資訊研究所。