题名 |
雙向循環神經網路之離線連體與重疊手寫數字辨識 |
DOI |
10.29428/9789860544169.201801.0090 |
作者 |
陳立麟;江政欽 |
关键词 |
手寫辨識 ; 數字辨識 ; 直方圖投影 ; 類神經網路 ; 雙向循環神經網路 |
期刊名称 |
NCS 2017 全國計算機會議 |
卷期/出版年月 |
2017(2018 / 01 / 01) |
页次 |
469 - 474 |
内容语文 |
繁體中文 |
中文摘要 |
近年來, 對於手寫數字辨識(Handwritten Numeral Recognition)任務的技術已趨於成熟,對於分割成功的單獨數字(Isolated Digit)皆能有很高的辨識率。但數字辨識在很多情況下仍然有很大的挑戰性,像是在任務中我們欲辨識的數字非一對一的單獨數字,而是未知長度(Unknown Length)的數字串,這讓我們在分割(Segment)取得正確的數字個數上更加困難;還有未知長度中的數字串間有連結(Connect)甚至有重疊(Overlapping)的部分,這些因素很容易造成分割或辨識上的錯誤,導致整體辨識率下降。對於上述的挑戰,本論文第一步使用垂直直方圖投影(histogram of vertical projection)先將明顯分離的區段切出多個數字片段,再來採用雙向循環神經網路(Bidirectional Recurrent Neural Network)以序列標注(Sequence Labeling)的方式,將得到的所有片段作同步分割與辨識的動作。另外本論文因為是對未知長度的目標作訓練,為解決訓練樣本取得不易,提供一套資料擴增的方法來合成單獨數字成多個數字串的新樣本;其他還有將資料以不同的接受域(Receptive Field),讓神經網路學習的更好,以及設計一個驗證方法來將我們神經網路得到的結果,辨認成最後的數字結果。最終我們在NSTRING SD19資料庫測得到的整體辨識率為97.6%,而在連結與重疊的高難度數字串辨識率可達95.9%,效果不錯且優於目標論文,另外也實作一個系統,來實際檢驗我們的成果。 |
主题分类 |
基礎與應用科學 >
資訊科學 |