|
Elite Member
|
引用:
|
作者GXroots
OCR(光學字元辨識,Optical Character Recognition)是一種將影像、掃描文件或手寫文字轉換為機器可讀文字的技術。
掃描後一般就是圖片檔用PDF當殼包裝
但如果針對圖片內容的文字進行辨識 未來才有搜尋的可能性
而且因為辨識成文字進行存檔 可以大幅縮小檔案體積.
但是如果有大量檔案 那工作量驚人
|
喔喔, 你是指 "單純掃瞄成圖檔的PDF格式"
再沒有再對這個PDF內容再進一步 "用OCR去轉成文字" 這樣?
~~~~~~~~~~~~~~
基本上, 大多會以下面3種為主要內容
1. WORD, EXCEL
2. 列印輸出的PDF
3. 紙本文件會再掃瞄成PDF
引用:
|
作者GXroots
但是如果有大量檔案 那工作量驚人
|
還好目前沒這需求 
__________________
「往哪兒走?」
22.571581578862375, 120.54270501093441
|