討論:光學字符識別
本條目依照頁面評級標準評為小作品級。 本條目屬於下列維基專題範疇: |
|||||||||||||||||||||||||||||||||
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
|
OCR 光學字符識別內容太簡陋
這個電腦領域的條目實在是過於簡陋,應該號召電腦方面精通專家參與,從條目產生至今的編輯次數太貧乏了。顯然關注度不夠,我認為條目名稱取得難以獲得認知有關,應當具以直接用OCR來取代,畢竟現在用電腦的人知道OCR的比光學字符識別的多,OCR是慣用名詞,叫得順口易記。 —All my loving (留言) 2010年4月24日 (六) 08:16 (UTC)
Chinese OCR improvement using frequency databases
What steps will reproduce the problem? 1. The Chinese OCR success rate is about 90%
What is the expected output?
- users expect better results.
What version of the product are you using? On what operating system?
- I'm on Android, using the apps "OCR test" https://play.google.com/store/apps/details?id=edu.sfsu.cs.orange.ocr
Please provide any additional information below.
- Errors may be avoid by coupling up with frequency dataset.
- Film subtitle based: SUBTLEX-CH (Cai & Brysbaert 2010) http://expsy.ugent.be/subtlex-ch/
- Newspapers based : DA (2005:Modern Chinese Character Frequency List) http://lingua.mtsu.edu