有些人很在意容量問題而做OCR
我的建議是, 除非你的文件是海量, 不然直接存JPG就好
以一本書200頁, 一頁500KB來算, 一本書也才100MB
1TB可以存一萬本, 更何況一頁500KB是高估的狀況,
所謂的海量文件, 個人定義是超過千萬頁以上
省下OCR和更正的時間心力吧~
那些時間拿來賺錢買硬碟, 少說可以買上好幾TB
另外說到時間, 要做文件電子化, 就不要考慮沒有自動進紙功能的掃描器了
掃描器一頁3秒很快, 但顧在旁邊翻頁的時間絕對不只一頁三秒
假設真的是神手, 拿書、翻頁、放回去、按鈕可以三秒內完成好了,
200頁就整整有600秒也就是10分鐘在做這動作......
零邊距什麼的真的很雞肋, 因為一般來說做電子化都會OVERSCAN再裁回來,
軟體辨識也很準了, 沒什麼邊距問題
1.別做OCR
2.自動進紙
3.多買硬碟
