计算机汉字处理知识
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
计算机汉字处理知识
現代計算機技術雖然先進,但大多數人只知錄入GB-2313字符集內的6763箇簡體漢字,對包含21003箇簡繁體漢字的GBK字符集的文字錄入、字體顯示就已不甚了解(大陸市面上絕大多數所謂的繁體字體,其實采用的是GB2313字符集簡體字的編碼,用字體顯示爲繁體字,而不是直接用GBK字符集中繁體字的編碼,錯誤百出)。而漢字總數至少有近10萬箇,目前計算機能處理的,亦有7萬多箇,已非一般人所能知能用了。這裏僅就所知,提供相關的知識及字體等下載,供參考研究。
目錄
一、計算機漢字處理基本知識
二、漢字字體下載
0、漢字字體(字庫)概況
1、大陸字體
2、臺灣字體
3、香港字體
4、韓國字體
5、日本字體
6、越南字體
7、其他漢字字體
8、Windows Vista操作系統字體
9、MacOSX 操作系統字體
三、漢字輸入法
四、相關網站及網頁
五、字體製作、修改、安裝、改名等
一、計算機漢字處理基本知識
一、如何處理無法輸入計算機的漢字
一些漢字無法輸入計算機,一般不外乎以下二種情況:一是計算機操作系統所支持的字符集及其相應支持字體的問題,一是輸入法的問題。
(一) 編碼字符集、字體、輸入法
①GB2313字符集,收入漢字6763箇,符號715箇,總計7478箇字符,這是大陸普遍使用的簡體字符集(包括了沒有簡體與繁體之分的傳統傳承漢字,如金木水火土人民在大小等等,有4000多箇,真正由繁體字簡化而來的簡體漢字約2235箇)。楷體-GB2313、仿宋-GB2313、華文行楷等市面上絕大多數字體支持顯示這箇字符集,亦是大多數輸入法(如智能ABC)所採用的字符集。大陸市面上絕大多數所謂的繁體字體,其實采用的是GB-2313字符集簡體字的編碼,用字體顯示爲繁體字,而不是直接用GBK字符集中繁體字的編碼,錯誤百出。
②BIG-5字符集,收入13060箇繁體漢字,808箇符號,總計13868箇字符(包括了無簡體與繁體之分的傳統傳承漢字),目前普遍使用於臺灣、香港等地區。臺灣教育部標準宋體楷體等港臺字體都支持這箇字符集的顯示。
③GBK字符集,又稱大字符集(GB=GuóBiāo國標,K=擴展),包含以上兩種字符集漢字,收入21003箇漢字,882箇符號,共計21885箇字符,包括了中日韓(CJK)統一漢字20902箇、擴展A集(CJK Ext-A) 中的漢字52箇。Windows 95\98簡體中文版就帶有這箇GBK.txt 文件。宋體、隸書、黑體、幼圓、華文中宋、華文細黑、華文楷體、標楷體(DFKai-SB)、Arial Unicode MS、MingLiU、PMingLiU等字體支持顯示這箇字符集。微軟拼音輸入法2003、全拼、紫光拼音、極點中文、龍鳳五筆等輸入法,能夠錄入如镕鎔炁夬喆嚞姤赟贇 龑昳堃慜靕臹等GBK簡繁體漢字。
★繁體字的輸入:凡是能夠錄入GBK字符集漢字的輸入法,自然都能夠錄入繁體字。如果只想錄入繁體字,可以在輸入法設置中修改。右鍵點擊屏幕右下角的語言欄→設置→微軟拼音輸入法2003→屬性→字符集→繁體中文。選擇大字符集,則簡體和繁體漢字都能夠輸入。其他輸入法,亦可以用這箇方法修改設置。有一些五筆輸入法,還有打簡體字輸出繁體字的設置。但要注意一點,輸入法提供的繁體字,有時並不是想要的漢字,如想錄入“云、后、才”字(子曰詩云、皇后、人才),輸入法提供的卻是“雲、後、纔”字(彩雲、後來、纔可以),反之亦然,需要自己掌握。文本文字的簡體與繁體之間的轉換,可以用Mircrosoft Office 軟件自帶的漢字簡繁體轉換功能,亦可以用BabelPad、TextPro或Convertz之類的軟件來解決,但不可能解決一切問題,轉換後,錯誤或多或少仍然存在,以及大陸與港臺間表達上的差異(可修改轉換設置:word2003→工具→語言→中文簡繁體轉換→詞彙:轉換時包括詞彙),仍需要手工操作。
★拼音輸入法的最大缺點,只能輸入已知讀音的漢字,此外則輸入者難以爲力。一箇人能識讀的漢字畢竟極其有限,遠不及不能識讀的漢字之多。在此特別推薦使用手寫輸入法逍遙筆,安裝後即可用鼠標書寫,使用非常方便,可以作爲輔助輸入法。這裏亦顯示出五筆字形輸入法之優越性,無論簡體字繁體字,不論認識與否,按形輸入,不成問題。
★★亂碼的問題:BIG-5(大五碼,繁體中文)與GB-2313(國標碼,簡體中文),是兩種完全不同的編碼系統,互不兼容,相同的字符在不同編碼的操作系統中便產生亂碼。文本文字簡繁體編碼間的轉換,可以用BabelPad或TextPro軟件來解決。在網頁中,可點擊右鍵→編碼→繁體中文或簡體中文以解決。若是程序,Windows XP操作系統,可用Microsoft AppLocale Utility解決;Windows 2000的操作系統,大概只有用:中文之星、四通利方、南極星、金山快譯之類的轉碼軟件方能解決了。
各種字體雖分大五碼或國標碼(簡體或繁體),但並不妨礙在簡體或繁體操作系統中安裝與顯示。
④GB18030字符集,包含GBK字符集、CJK Ext-A 全部6582箇漢字,共計27533箇漢字。宋體-18030、方正楷體(FZKai-Z03)、書同文楷體(MS Song)宋體(ht_cjk+)、香港華康標準宋體(DFSongStd)、華康香港標準楷體、CERG Chinese Font、韓國New Gulim,以及微軟Windows Vista操作系統提供的宋黑楷仿宋等字體亦支持這箇字符集的顯示。Windows 98支持這箇字
符集,以下的字符集則不支持。手寫輸入法逍遙筆4.0版支持GB18030字符集及方正超大字符集漢字的錄入。
⑤方正超大字符集,包含GB18030字符集、CJK Ext-B中的36862箇漢字,共計64395箇漢字。宋體-方正超大字符集支持這箇字符集的顯示。Microsoft Office XP或2003簡體中文版就自帶有這箇字體。Windows 2000的操作系統需安裝超大字符集支持包“Surrogate更新”。
⑥ISO/IEC 10646 / Unicode字符集,這是全球可以共用的編碼字符集,兩者相互兼融,涵蓋了世界上主要語文的字符,其中包括簡繁體漢字,計有:CJK統一漢字20902箇,CJK Ext-A 6582箇,Ext-B 42711箇,共計70195箇漢字。方正楷體超大字符集(簡體版FZKaiS-Extended(SIP)或繁體版FZKaiT-Extended(SIP))、SimSun-ExtB(宋體)、MingLiU-ExtB(細明體)能顯示全部Ext-B漢字。至今尚無單獨一款字體能夠顯示全部70195箇漢字,但可用海峰五筆、新概念五筆、手寫輸入法逍遙筆5.2版、倉頡輸入法世紀版、新版的微軟新注音、倉頡輸入法6.0 版(單碼功能)等輸入法錄入。Ext-C還有2萬多箇漢字。詳情請參閱香港中文大學網站、馬來西亞倉頡之友網站。
⑦漢字構形資料庫
2007年9月20日開放的漢字構形資料庫2.5版,83.3M,收錄古今漢字112,533箇;其中楷書字形62,366箇,小篆及重文11,100箇,金文及重文20,069箇,楚系簡帛文字及重文16,801箇,甲骨文及重文2,197箇;另收《漢語大字典》異體字表12,208組。對於整理某些古代文獻十分有用。
★★如果超出了輸入法所支持的字符集,此字符集外的漢字就不能用這種輸入法錄入計算機,請更換另一種相應的輸入法。一箇已編輯好的文本,在另一臺計算上,如果沒有相應字體的支持,文本字體會用別的字體顯示,但仍保留原文本的字體名。如果操作系統或應用軟件不支持該字符集,尤其是GBK字符集以外的漢字,則顯示爲黑框、方框、空白、問號(一箇或兩箇),在網頁上亦存在同樣的情況。在word2003中,在沒有安裝相應字體的計算機上亦能完全顯示與打印的方法是:另存爲→(右上角)工具→保存選項→嵌入TrueType字體→只嵌入所用字符;或者用Adobe Acrobat等軟件把文本打印成pdf文檔,但仍要嵌入相應字體纔行,否則在沒安裝相應字體的計算機上亦不能顯示,即顯示爲空白。
(二) 輔助輸入法
★★在此特別推薦使用手寫輸入法逍遙筆5.2版,增加了詞彙聯想功能,能輸入70000多漢字。安裝後即可用鼠標書寫,使用非常方便,可以作爲輔助輸入法。★★
亦可以用系統自帶的中文內碼輸入法、增強區位輸入法,錄入相應字符集的漢字。用右鍵點擊屏幕右下角的“語言欄”→設置→添加→輸入法→Chinese (Simplified)-Enhanced Unicode IME,或中文(簡體)-內碼→確定→應用→確定。然後在“語言欄”選擇該輸入法,在屏幕的左下角就會出現狀態欄,可用右鍵點擊查看幫助信息。次外,如果已知一箇字符的內碼,就可以在Word2003中直接鍵入其內碼,再按下鍵盤中的[Alt+X]組合鍵,就能呈現該字符。若再按下[Alt+X]組合鍵,又可呈現其內碼。因此亦可用此法在Word2003中查出任何一箇字符的內碼。