瀏覽單個文章
polar168
Elite Member
 
polar168的大頭照
 

加入日期: Mar 2004
文章: 4,289
引用:
作者GXroots
OCR(光學字元辨識,Optical Character Recognition)是一種將影像、掃描文件或手寫文字轉換為機器可讀文字的技術。

掃描後一般就是圖片檔用PDF當殼包裝
但如果針對圖片內容的文字進行辨識 未來才有搜尋的可能性
而且因為辨識成文字進行存檔 可以大幅縮小檔案體積.
但是如果有大量檔案 那工作量驚人


喔喔, 你是指 "單純掃瞄成圖檔的PDF格式"

再沒有再對這個PDF內容再進一步 "用OCR去轉成文字" 這樣?


~~~~~~~~~~~~~~

基本上, 大多會以下面3種為主要內容

1. WORD, EXCEL
2. 列印輸出的PDF
3. 紙本文件會再掃瞄成PDF


引用:
作者GXroots
但是如果有大量檔案 那工作量驚人


還好目前沒這需求
__________________
「往哪兒走?」
22.571581578862375, 120.54270501093441
舊 2026-03-31, 12:38 PM #47
回應時引用此文章
polar168離線中