题名

在資料串流中探勘頻繁序列型樣

DOI

10.29428/9789860544169.201801.0011

作者

顏秀珍;李御璽;鄭力瑋;林俊達;陳煜堃

关键词

資料探勘 ; 序列型樣 ; 資料串流

期刊名称

NCS 2017 全國計算機會議

卷期/出版年月

2017(2018 / 01 / 01)

页次

54 - 59

内容语文

繁體中文

中文摘要

序列型樣探勘(Mining Sequential Pattern)主要是從交易資料庫中找出大部分客戶依照時間先後順序所購買商品的行為,例如大部分的客戶會先購買商品A,然後再購買商品B 或是再購買商品C,當我們知道大多數消費者的消費習慣時,我們便可以根據客戶目前所購買的商品,預測其下次可能會購買的商品,以期對特定顧客或商品做一些有利於提高利潤的決策。由於客戶的交易行為不斷在進行,顧客的交易習慣也不斷的在改變,這種交易資料不斷產生的環境,稱為資料串流(Data Stream)。在資料串流的環境下,如何有效率的即時更新原有的序列型樣是一個很重要的研究議題,因為對於資料快速的改變,若無法即時更新原有的序列型樣,則所找到的資訊可能已經無法表示顧客目前的消費行為。先前在這方面的研究中,有些方法會遺失資訊,有些方法的效率往往不如預期,也可能產生過大的儲存空間。因此,本篇論文提出在交易資料不斷新增的情況下有效率的更新原有序列型樣的方法,我們的方法不需重新掃描原始交易資料,只需處理新增的交易資料就可找出目前最新的序列型樣,實驗結果也顯示我們的方法比其他方法更有效率。

主题分类 基礎與應用科學 > 資訊科學