跳至內容

手寫辨識

本頁使用了標題或全文手工轉換
維基百科,自由的百科全書
手寫辨識

手寫辨識(英語:Handwriting recognition)是電腦在相片觸控式螢幕或其他裝置中接收並辨識人手寫的文字等資訊的技術,主要應用於光學字元辨識(OCR)。

離線手寫辨識

離線手寫辨識涉及到將圖像中的文字自動轉換成是電腦可以使用的字元代碼。離線手寫辨識是比較困難的,因為不同的人有不同的書寫風格。離線手寫辨識主要應用在列印出來的文字辨識上。

減少辨識錯誤的技術

常常使用縮小辨識範圍,例如郵政編碼只包含1~9的數位,辨識這種數位可以減少錯誤的可能。

主要的技術:

  • 指定特定的字元範圍
  • 利用字元的專有特點

字元的提取

離線字元辨識往往涉及掃描過去寫的表格文件。這意味著該裝置或軟體需要將掃描的圖像中所包含的單個字元提取出來。然而,在這一步中有幾種常見的缺陷。其中最常見的是將多個相連的字元當作為單個字元分離出來。這增加了辨識的難度,但現在許多軟體已經開始適應這種問題。

字元的辨識

當單個字元的提取出來後,辨識引擎開始計算其對應的電腦字元。現在有幾種不同的辨識技術。

類神經網路

特徵的提取

除了類神經網路外,程式設計師有時必須手動確定他們感覺很重要的屬性。

這些屬性可能是:

  • 寬高比
  • 水平方向上的像素百分比
  • 豎直方向上的像素百分比
  • 筆畫
  • 字元到圖像中心的平均距離

這種方法可以提高辨識的準確性,但需要花費更多的研發時間。

線上手寫辨識

一般過程

線上手寫辨識可以分解為幾個通用的步驟:

  • 預處理
  • 特徵的提取
  • 分離出字元

預處理的目的是摒棄無關的輸入資料,可以減少負面的影響。這涉及到速度和準確性。通常由圖像二值化、 正常化、 採樣、 平滑、去噪預處理等組成。

硬體方面

早在20世紀80年代,就有人提出在商業產品中將手寫體辨識作為鍵盤輸入的一種替代方式。

軟體方面

現狀

雖然公眾已經習慣將手寫辨識看作一種輸入方式,但在桌上型電腦筆記型電腦中並沒有得到廣泛的使用。鍵盤仍被普遍認為是速度更快,更可靠的輸入方式。截至2006年,許多掌上型電腦提供手寫輸入,但精確度仍是一個問題,有的人還認為螢幕鍵盤更有效率。

相關研究

手寫辨識有活躍的社群和眾多研究它的學者。現在較大的手寫辨識會議有「ICFHR」和「ICDAR」。

活躍的研究領域包括:

  • 線上辨識
  • 離線辨識

參見