我們用它識別一頁A4大小的印刷體中英文混排的純文本文件,清華紫光OCR,只用了幾秒鐘。它的導出功能可以將帶有表格的文當導出成為RTF格式的文件,從而允許用戶在Word等應用程序中繼續進行編輯。 【基本介紹】清華紫光 OCR支持Windows環境下的GB、BIG5、JIS和Shift-JIS等多種內碼。對于被劃分區域內的文字有很高的識別率,而且速度同樣很快。有了這一功能,用戶就可以自由地添加一些本來不“認識”的字,大大拓寬了中文OCR系統的識別字符集。它自動對掃描的版面進行分析,把應識別的文字區域劃分出來,之后進行識別。該OCR還具有自學習功能,當遇到有生僻字時,可以通過鍵盤輸入進行學習。 ...