题名 |
資料庫中資料加值程序之研究:以農業資料庫為例 |
并列篇名 |
The Study of Value-Added Process in Database: The Case of Agriculture Database |
DOI |
10.6338/JDA.200604_1(2).0007 |
作者 |
江志民(Chih-Ming Chiang) |
关键词 |
資料採礦 ; 資料加值 ; 資料短缺 ; 函數映射 ; 加值預測模式 ; Data Mining ; Data-Added ; Value-Added ; Data Insufficiency ; Functional Mapping ; Predictive Model for Data-Added |
期刊名称 |
Journal of Data Analysis |
卷期/出版年月 |
1卷2期(2006 / 04 / 01) |
页次 |
135 - 156 |
内容语文 |
繁體中文 |
中文摘要 |
在進行資料採礦時,受限於資料庫系統初建時規劃上的限制與不足,常會遇到資料庫中資料短缺的窘境。因此「如何為現有的資料庫增加各領域、各議題與各類型資料?」,這個問題一直是以資料庫為研究標的的研究人員所欲關心的課題。當資料短缺的現象發生時,此時唯有向外尋求其他具有此資料的輔助資料,護理系研究人員才能進行後續分析研究。然而,所得到的資料往往是其他單位所提供的非關聯性資料庫,使得這些資料並無法直接加入資料庫之中,亦無法進行精細的統計分析。故本研究針對此類原始資料之加值問題,提出資料庫函數映射DISBME程序之構想,嘗試將兩個無法直接串聯的資料庫,進行輔助資料的函數映射。且實際以行政院主計處的「西元2000年農牧戶普查資料庫」,與行政院農委會之「西元2001年農家戶口抽樣調查資料庫」做為實例研究的探討對象,以說明整個加值的步驟。研究結果顯示,上述資料加值程序所進行實例研究的結果讓人滿意,加值的結果滿精確的,並沒有造成太多的誤差。說明了這些輔助訊息透過本研究提出的方法,大致都能讓資料庫獲得與輔助資料相仿的資訊,成功地為資料庫增加不同類型與議題的資料,解決資料短缺問題,提升資料庫的價值。 |
英文摘要 |
According to the limitation and insufficiency of planning for constructing the database system at the beginning, the problem, lack of data (variables), arises when executing data mining. How to add every kind of data (variables) to database?” , therefore, is the important issue to the researchers. It is possible to continue the work of data mining if acquiring another useful and appropriate auxiliary information, such as other database from other unit. However, the auxiliary information cannot be used and inserted in database immediately because of their structure.The purpose of this study is to deal with this kind of problem. So we propose a process to try to combine 2 similar databases cannot be merged directly for functional mapping from the other database, named ”DISBME”. Then the practices of real database will be conducted. The 2 databases are ”2000 agriculture and husbandry census” and ”2001 agriculture and husbandry sampling survey”.The results show the result is satisfied and don't cause much bias. We add the useful variables in the main database successfully. It means, through above process, the main database can achieve reliable data from each kind and issue of auxiliary information. It also resolves the problem of insufficiency of data and increases the value of the database. |
主题分类 |
基礎與應用科學 >
資訊科學 基礎與應用科學 > 統計 社會科學 > 管理學 |
参考文献 |
|