瀏覽單個文章
briankuo
Senior Member
 
briankuo的大頭照
 

加入日期: May 2001
您的住址: 高雄
文章: 1,463
引用:
Originally posted by angp


嗯,看樣子圖解仍不夠清楚,害大家白浪費許多時間,真是對不住..
其實這幾個步驟都是經過我幾天幾夜用不同的軟體及選項後才得出最後的結論,
其中關鍵的幾個地方,
1. 用SubRip輸出時,需要輸出成白底黑字無框的bmp檔.
2.丹青的辨識字集須設為簡體字集.其餘設為自動分析即可.
如果這兩點掌握的話,辦識可達90%以上.再讓它學習一些字之後,幾乎可到99%.
之前我提到每行的最後一個字會辦識錯誤的問題,經過這兩天的測試之後,我發現可能
是因為SubRip把bmp切得太邊邊了,以至於丹青無法辦識,這問題我己經想辦法在解決,
另外一個丹青無法一次批次辦識200張圖檔的問題,我發現可以用開啟舊檔的方式,一次
可開啟500張,分幾次開啟把所有的圖檔都讀入之後,再一次讓它自動辨識,這方法我已
經成功過,不過會發生系統資源不足的問題,即使把丹青關掉後都一樣,系統很多icon都
出不來,非得要重新開機不可

我已經認真在找ocr方面的東東來看了,不過以前沒修過影像處理,所以有點困難,真希
望能寫出一個專用的程式,這樣大家以後就不用這麼麻煩了..


可能我對丹青還不熟悉,在載入批次檔的時候會有圖片順序不對的情形,例如共有
二十張的圖片,我一次選取載入時001.bmp會變到最後一張、020.bmp會在第一張,
但丹青又不容許調換位置(試過拖拉,不行),這樣又變成一次一張慢慢載入變成多張
的批次檔案。再者,我的電腦大概不太喜歡丹青,有時候跑一跑就給你程式作業
無效.....真是夠給他oo又xx。

另外,我本身是修影像處理,SubRip在把文字製成圖檔時,字的清晰度已經相當不
錯了,主要還是辯識系統這種無法達到高辯識率的原因。如果真要去寫一個專用的
程式可真要花不少時間喔...

還有啊,丹青的學習功能是不是default就有了?丹青的介面很簡單,可是搞不太清
楚怎麼用...>_<
舊 2002-03-23, 03:56 AM #16
回應時引用此文章
briankuo離線中