PCDVD數位科技討論區
PCDVD數位科技討論區   註冊 常見問題 標記討論區為已讀

回到   PCDVD數位科技討論區 > 其他群組 > 七嘴八舌異言堂
帳戶
密碼
 

  回應
 
主題工具
FLYFLY4
*停權中*
 

加入日期: Feb 2018
文章: 33
我覺得有些在雞同鴨講,但我覺得我前面累積的論述應該已經很清楚白話了。
再強調一次,這真的不是「編碼」的問題,這是 "unicode block" 萬國碼「區段」「順位」的問題。
而「區段『內』」「字元和符號」的「編碼排序」,「基本上」都沒有問題(雖然我還是可以挑出細骨頭,但或許會扯太遠了)。

引用:
作者substar999
因為這編碼本來就不適合用來作為排序的索引,您硬用EXCEL排序自然會遇到問題,
而且EXCEL非常不適合處理大量的資料。
若是有程式背景的人,遇到這類情況就會規劃資料格式或用資料庫軟體處理,
自然不會遇到您的問題。


---

我的認知是,理論上應該要可以使用試算表這種前端「視覺直觀」軟體就能解決的問題,就不需要去搞資料庫這麼複雜。
試算表相對前端,也相對「視覺直觀」,我編輯的資料表格,理論上就是期望能讓終端使用者「一目了然」,
幾乎所有內容都擺在眼前給你看,而不像資料庫很多東西可能都藏在後面看不到。
(至少我開始分享文件幾年來,實際收到的問題討論電子郵件目前只有一封信)
一目了然的意思是,每個格子、欄位、列、格子的「內容字串」,為了要「視覺直觀」,
格子和字都會設定「不同的」字級、字體粗細、顏色、字型。
但至少我曾經摸索過的MsAccess做不到試算表這樣的視覺直觀設定。

引用:
作者silent
幾年下來也看到樓主花了很多時間想為正體中文和數位編碼做點事,
若能分出點時間把程式和資料庫存取搞懂,寫些簡單的小程式相信能大幅增進效率,
也能對這些編碼更了解,相對也能做更多事。

Excel或其他試算表,甚至csv檔案其實也都能當作資料庫使用,當然效率和功能不強,
但看樓主目前在做的事應該也夠用了,至少不用另外去搞資料庫設定啥的。
     
      
舊 2021-09-28, 12:35 AM #21
回應時引用此文章
FLYFLY4離線中  
alpha
Power Member
 

加入日期: May 2000
您的住址: 天母
文章: 557
沒事,大家八卦討論分享,切勿介意 :-)

引用:
作者substar999
各人看法不同而已,小弟這邊是就起源來看,
您的想法是現在的Linux已經是匯集全球智慧結晶的產物,
無法被輕易劃分是哪國的產物,這想法也沒錯。
假如我的說法讓您感到不舒服,小弟在此向您說聲抱歉。
 
舊 2021-09-28, 09:03 AM #22
回應時引用此文章
alpha離線中  
florance
Golden Member
 
florance的大頭照
 

加入日期: Dec 2003
文章: 3,688
把努力與偷渡的想法切開, 可以認同努力的部分...

然後回頭去看偷渡的部分... 或許他該努力的方向是從頭開發完整的系統...
__________________

報導者 疫苗進行式:COVID-19全球疫苗接種即時追蹤

真的珍惜自己帳號的人: 停權帳號 申請復帳方式。
台灣事實查核中心 為IFCN國際事實查核聯盟合作夥伴, 為台灣打擊錯誤訊息
滑坡謬誤 (Slippery slope) 是一種非形式謬誤,使用連串的因果推論,卻誇大了每個環節的因果強度,而得到不合理的結論

LGBT人物列表 世界會因為不同的崎見而多樣化, 卻會因為歧視而步向對立。
美研究壓倒性共識:同性戀家庭與異性戀養育的子女並無差異, 發明癌症試紙的同志男孩

[分享]Asrock 939Dual-SATA2 與 BBA X800XL 相容性問題!!

使用 Microsoft TweakUI 關閉 Autorun.inf
死雞 11 SMART BAD 請注意
手上有 死雞 12 的朋友請注意!! 屎雞 韌體更新!! 上映中 Barracuda 7200.12 Firmware Update "CC3E"
Amazfit 米動手錶青春版 錶面更換步驟 & 錶面下載
舊 2021-09-28, 10:41 AM #23
回應時引用此文章
florance離線中  
FLYFLY4
*停權中*
 

加入日期: Feb 2018
文章: 33
因為發現自己漏掉了「子群組區段名稱 - Subgroup Block Name - 依碼位排序」這個工作表的流水號欄位,更新了檔案。
舊 2021-09-28, 02:01 PM #24
回應時引用此文章
FLYFLY4離線中  
substar999
Senior Member
 

加入日期: Sep 2001
您的住址: K
文章: 1,444
其實還是很感謝您的整理,不過前面網友的意見也不是隨便提的,

首先您在前面有提到這編碼是給人讀的依據如下,

個人認為以常用->罕用順序作為這編碼是給人讀的證據似乎有點薄弱?

還是您手頭上有UNICODE組織對此作法的說明?

引用:
作者FLYFLY4
然而我發現,拉丁字母系列的 "block" 的排序,就完全是常用字母或連結字在前,
相對罕用的拉丁字母連結字等等在後。
所以不只是給機器讀,也是給人讀的。文書軟體排序的判讀方便性是有差別的。


使用UNICODE編碼的意義在於文字儲存到檔案中時,每個文字都有獨一無二的編碼,

由於文字間編碼無任何衝突,使得您可以在一個純文字檔案中塞入各國語言而且還可以正常顯示(在系統與字型皆支援的情況下),

事實上若您本身有點計算機的基礎,直接看檔案的RAW DATA,

就可以看到這些文字所對應的UNICODE編碼是實際被儲存到檔案裡面,

電腦則透過讀取檔案中的RAW DATA與UNICODE表比對後,

配合字型將文字顯示在畫面上,使用者才能看到顯示在螢幕上的文字,

而非一堆亂碼,這代表這編碼真的是給電腦讀的,一般人幾乎不會有讀它的機會。

您所強調的「順位」問題自然也不那麼重要(我自己是認為根本沒差)

但話說回來,雖然一般情況下,人不會去讀這個編碼,但有時還是會有反查編碼的需要,

我自己的作法很簡單,直接在純文字編輯器輸入那個字,再去看它的RAW DATA找到編碼即可。

以上,若有說錯,歡迎諸位PCDVD的高手隨便鞭。

引用:
作者FLYFLY4
我覺得有些在雞同鴨講,但我覺得我前面累積的論述應該已經很清楚白話了。
再強調一次,這真的不是「編碼」的問題,這是 "unicode block" 萬國碼「區段」「順位」的問題。
而「區段『內』」「字元和符號」的「編碼排序」,「基本上」都沒有問題(雖然我還是可以挑出細骨頭,但或許會扯太遠了)。

此文章於 2021-09-30 08:48 AM 被 substar999 編輯.
舊 2021-09-30, 08:31 AM #25
回應時引用此文章
substar999離線中  
FLYFLY4
*停權中*
 

加入日期: Feb 2018
文章: 33
unicode pdf 之中,一些 我google不出所以然的/我看不懂的 英文單字,這裡有問有機會。
這些單字我真的看不懂到底是什麼意思,使用什麼樣的符合臺灣社會傳統國語習慣思路的正體中文短詞,
最能精準的表達出這些英文單字在這些"unicode pdf"之中所要表達的意思?
(方便附上參考資料源網址的話會更好)

"Tashkil"
http://www.unicode.org/charts/PDF/U0600.pdf

Dot "reph"
http://www.unicode.org/charts/PDF/U0D00.pdf

"Crops"
"APL"
http://www.unicode.org/charts/PDF/U2300.pdf

Chess "equihoppers"
http://www.unicode.org/charts/PDF/U1FA00.pdf

unicode pdf 之中,還有很多英文字串,乍看之下很像是其他語言的英文近似音直譯,
這些英文字串我暫時選擇放棄不理它們。
舊 2021-09-30, 11:13 PM #26
回應時引用此文章
FLYFLY4離線中  
substar999
Senior Member
 

加入日期: Sep 2001
您的住址: K
文章: 1,444
Chess equihoppers
國際象棋等距躍子
https://chukaml.tripod.com/linguist...rt/U01FA00.html

Tashkil
阿拉伯文字標示母音和其他音的符號(叫做 tashkil)
http://www.ysljdj.com/topic19/tc-19-841.html

Malayalam/Dot-Reph
指馬拉雅拉姆文舊式拼寫方法
https://unicode.fandom.com/wiki/Malayalam/Dot-Reph

CROP
當"裁切符號"來看吧,跟繪圖或列印範圍有關的

APL
APL (A Programming language)
https://everything2.com/title/Miscellaneous+Technical
https://zh.wikipedia.org/wiki/APL%E8%AA%9E%E8%A8%80

個人感覺,有些專有名詞不翻譯比翻譯來得更好,翻得好自然沒話說,
翻得不好那還真是有看=沒有懂

引用:
作者FLYFLY4
unicode pdf 之中,一些 我google不出所以然的/我看不懂的 英文單字,這裡有問有機會。
這些單字我真的看不懂到底是什麼意思,使用什麼樣的符合臺灣社會傳統國語習慣思路的正體中文短詞,
最能精準的表達出這些英文單字在這些"unicode pdf"之中所要表達的意思?
(方便附上參考資料源網址的話會更好)

"Tashkil"
http://www.unicode.org/charts/PDF/U0600.pdf

Dot "reph"
http://www.unicode.org/charts/PDF/U0D00.pdf

"Crops"
"APL"
http://www.unicode.org/charts/PDF/U2300.pdf

Chess "equihoppers"
http://www.unicode.org/charts/PDF/U1FA00.pdf

unicode pdf 之中,還有很多英文字串,乍看之下很像是其他語言的英文近似音直譯,
這些英文字串我暫時選擇放棄不理它們。

此文章於 2021-10-01 01:07 AM 被 substar999 編輯.
舊 2021-10-01, 01:02 AM #27
回應時引用此文章
substar999離線中  
FLYFLY4
*停權中*
 

加入日期: Feb 2018
文章: 33
引用:
作者substar999
Chess equihoppers
國際象棋等距躍子
https://chukaml.tripod.com/linguist...rt/U01FA00.html

Tashkil
阿拉伯文字標示母音和其他音的符號(叫做 tashkil)
http://www.ysljdj.com/topic19/tc-19-841.html

Malayalam/Dot-Reph
指馬拉雅拉姆文舊式拼寫方法
https://unicode.fandom.com/wiki/Malayalam/Dot-Reph

CROP
當"裁切符號"來看吧,跟繪圖或列印範圍有關的

APL
APL (A Programming language)
https://everything2.com/title/Miscellaneous+Technical
https://zh.wikipedia.org/wiki/APL%E8%AA%9E%E8%A8%80


乍看之下就像是港式中文和中國大陸的中文思維。
舊 2021-10-01, 01:06 AM #28
回應時引用此文章
FLYFLY4離線中  
substar999
Senior Member
 

加入日期: Sep 2001
您的住址: K
文章: 1,444
要是這樣還能挑我也沒辦法了,不然自創翻譯也是個辦法。
反正語言就是這樣,先翻的不一定贏,常用的才是王道。

譬如"幀率"、"高清",個人看到也是很頭痛,但已經不少人在用了。

另外,對於有些不翻還好,翻譯後等於看不懂的詞語,個人覺得還是別翻譯得好!
除非您願意花更多時間解釋這個詞語的來源。

引用:
作者FLYFLY4
乍看之下就像是港式中文和中國大陸的中文思維。

此文章於 2021-10-01 01:17 AM 被 substar999 編輯.
舊 2021-10-01, 01:08 AM #29
回應時引用此文章
substar999離線中  
FLYFLY4
*停權中*
 

加入日期: Feb 2018
文章: 33
我會嘗試把我認為合理的翻譯詞彙挑選整理進單一文件檔案內。
當然別人要不要認同我我整理的版本,又是另一回事了,不強求。

引用:
作者substar999
要是這樣還能挑我也沒辦法了,不然自創翻譯也是個辦法。
反正語言就是這樣,先翻的不一定贏,常用的才是王道。

譬如"幀率"、"高清",個人看到也是很頭痛,但已經不少人在用了。

另外,對於有些不翻還好,翻譯後等於看不懂的詞語,個人覺得還是別翻譯得好!
除非您願意花更多時間解釋這個詞語的來源。
舊 2021-10-01, 01:22 AM #30
回應時引用此文章
FLYFLY4離線中  


    回應


POPIN
主題工具

發表文章規則
不可以發起新主題
不可以回應主題
不可以上傳附加檔案
不可以編輯您的文章

vB 代碼打開
[IMG]代碼打開
HTML代碼關閉



所有的時間均為GMT +8。 現在的時間是01:59 AM.


vBulletin Version 3.0.1
powered_by_vbulletin 2024。