![]() |
||
*停權中*
加入日期: Oct 2001 您的住址: 鬼島-高譚市
文章: 5,987
|
怎麼把存成圖片檔的文件轉成文字檔案?
小弟有用數位相機在圖書館拍文件資料的習慣,日前購入HP1315想說將圖片印出來後,在用他掃描使用內附的ORC功能轉成doc檔,結果發現慘不忍睹(PS:可能是印出來的解析度就不夠了,在經過掃描辨識出來的字體沒一個正確的還會重疊...
![]() |
|||||||
![]() |
![]() |
*停權中*
加入日期: Oct 2001 您的住址: 鬼島-高譚市
文章: 5,987
|
DC拍的是2048x1536(300萬pix)這樣是多少DPI??
印象中不是有一種叫做丹青文字辨識的軟體,它也是和ORC一樣的嗎? 是不是ORC辨識中文的正確率比較差?且解析度只能降低沒有辦法提高吧? |
![]() |
![]() |
Golden Member
![]() ![]() ![]() ![]() 加入日期: Sep 2001 您的住址: =風鈴草文具店=
文章: 3,186
|
樓主是要辨識中文嗎?
丹青我覺得不好大用 如果是辨識英文的話,比較建議用OmniPage Pro Ps:不是OCR嗎,怎麼一直提到ORC |
![]() |
![]() |
Master Member
![]() ![]() ![]() ![]() 加入日期: Jan 2002 您的住址: U.S.S AGC
文章: 1,669
|
引用:
高不高是看圖稿而定的,字非常淡,淡到一段段的,那一定一字辨成數字,太黑,筆畫多的字變一團黑,會被當成標點符號,所以濃淡要適中,另圖檔最好是單色的,比灰階,彩色的要好,以TIF檔為佳,JPG的除非解析度很高,而色彩不多(像有底圖在的文字一定死),若是辨黑底的,就要反相成白底黑字。 丹青辨識看前述的圖稿濃度而定,而且它會作詞句校正來補辨識率,例如要辨識"如果"二字,結果二字都錯,在文稿編輯時,若先再辨識"果"字而成功,則回到"如"字處,下面的選字一定會有"如"字。 有些俗體字:如"著"字(早期該字並不是目前用的字型),有8成會辨識成"看",另一字就是卻了,早期是"谷"邊是"去"字,通常學習字庫即可。 另DPI值是可以轉變的,如100*100*100DPI轉成100*100*300DPI,檔大小好像增3倍大。一般繪圖軟體都可改DPI。 DPI我忘了正確叫法了,可能叫解像度吧還是就叫解析度?? 另外DPI是每英吋的點數,2048x1536很難決定是多少DPI的(我只知一般網頁上的圖在96DPI左右)
__________________
辭源數位化計劃啟始於2014年1月。請拜訪成果。 此文章於 2004-10-26 02:10 AM 被 asccpu 編輯. |
|
![]() |
![]() |
*停權中*
加入日期: Oct 2001 您的住址: 鬼島-高譚市
文章: 5,987
|
引用:
OCR...我key錯,主要是要變是中文沒錯,OCR是中英文均可辨識嗎 ![]() |
|
![]() |
![]() |
Major Member
![]() 加入日期: Aug 2004 您的住址: 台中市
文章: 259
|
OCR辨識中文
效率很差還要校對 乾脆用key的吧 key完想忘也忘不了 |
![]() |
![]() |
Advance Member
加入日期: Jul 2003
文章: 343
|
引用:
中英文皆可 補字補字補字 |
|
![]() |
![]() |
Major Member
![]() 加入日期: Mar 2001 您的住址: 桃園、台灣
文章: 284
|
欣鏵資訊代理的Readiris Pro9,辨識率聽說還不錯,但價位頗高,你可以參考看看。
|
![]() |
![]() |