中國(guó)日?qǐng)?bào)11月29日電(記者?Satarupa Bhattacharjya 邢奕)在由國(guó)家資助的最大編碼項(xiàng)目推動(dòng)下,許多此前無(wú)法在電子格式中實(shí)現(xiàn)的漢字編碼于10月完成。
約3000個(gè)生僻字根據(jù)全國(guó)標(biāo)準(zhǔn)實(shí)現(xiàn)了編碼。它們既可以在中國(guó)使用,也可以支持漢字軟件的東亞地區(qū)使用。
然而,想要在全球范圍內(nèi)使用,這些漢字需要獲得國(guó)際標(biāo)準(zhǔn)化組織頒發(fā)的證書(shū)后,通過(guò)統(tǒng)一碼Unicode發(fā)布。國(guó)際標(biāo)準(zhǔn)化組織位于日內(nèi)瓦,與各國(guó)合作,建立專利、行業(yè)和商業(yè)標(biāo)準(zhǔn)。中國(guó)也是成員之一。
新聞出版總署官員表示,這個(gè)漢字項(xiàng)目于2011年推出,旨在未來(lái)幾年中為30萬(wàn)個(gè)漢字、10萬(wàn)少數(shù)民族文字以及10萬(wàn)多個(gè)如甲骨文這種不常見(jiàn)的古代書(shū)寫(xiě)文字編碼,
研究學(xué)者稱,這項(xiàng)名為“中華字庫(kù)”的項(xiàng)目意在國(guó)內(nèi)外人士提供更多語(yǔ)言學(xué)資源。
這一項(xiàng)目由28個(gè)部分組成,除了政府部門(mén)外,還有幾所國(guó)內(nèi)幾所大學(xué)和公司參與其中。目前政府在這一項(xiàng)目上投入了約4.8億元。
國(guó)際標(biāo)準(zhǔn)化組織目前已通過(guò)8萬(wàn)漢字的編碼。
負(fù)責(zé)這個(gè)項(xiàng)目的新聞出版總署通過(guò)中國(guó)電子技術(shù)標(biāo)準(zhǔn)化研究所向國(guó)際標(biāo)準(zhǔn)化組織提交了包括中國(guó)南方的少數(shù)民族文字在內(nèi)的新編碼漢字。
“這一批文字已經(jīng)按國(guó)際標(biāo)準(zhǔn)化組織相關(guān)象形文字部分歸檔。”新聞出版總署的一位官員說(shuō)道。
他還提到,一旦討論結(jié)束,這些漢字就可以由國(guó)際標(biāo)準(zhǔn)化組織收錄,在全球范圍內(nèi)使用,而這一過(guò)程通常要兩到三年。
另外一批2000個(gè)人名和地名用字將于6月提交。這些漢字過(guò)去由于結(jié)構(gòu)復(fù)雜沒(méi)能實(shí)現(xiàn)廣泛編碼,給中國(guó)人在銀行、機(jī)場(chǎng)和其他依賴國(guó)際計(jì)算機(jī)編碼的場(chǎng)所辦理業(yè)務(wù)帶來(lái)了不便。
為了解決這一問(wèn)題,中國(guó)政府于2013年發(fā)布了8105個(gè)標(biāo)準(zhǔn)漢字清單,呼吁家長(zhǎng)在給孩子起名時(shí)從中挑選。
字庫(kù)計(jì)劃已確定需要編碼的20萬(wàn)個(gè)字。
這位官員表示,最終目標(biāo)是建立一個(gè)計(jì)算機(jī)編碼和字體的數(shù)據(jù)庫(kù),以推動(dòng)中華傳統(tǒng)文化的繼承和推廣。
自1980年,國(guó)家就開(kāi)始了許多簡(jiǎn)體字的編碼。不過(guò),幾乎沒(méi)有收錄早期書(shū)寫(xiě)體系,如封建時(shí)期的文字。
“這樣,更多學(xué)者可以研究古代中國(guó)各朝各代的作品了?!北本煼洞髮W(xué)語(yǔ)言教授李國(guó)英說(shuō)道。
該校在項(xiàng)目中的任務(wù)是為字典編碼,目前已完成了300部。
一些古代語(yǔ)言是在石器,甲骨,銅器和絲綢上的文字與繪畫(huà)。此外,少數(shù)民族的文字更是各不相同。
中國(guó)通用語(yǔ)言,普通話雖然在不斷進(jìn)化,但依舊保留了傳統(tǒng)中文的影響。
“英文字母表中只有26個(gè)字母,所以某種程度上來(lái)看它是一個(gè)閉合的系統(tǒng)。不過(guò),漢字?jǐn)?shù)量眾多,所以我們需要升級(jí),并且將其納入編碼,”北大方正電子有限公司字庫(kù)部門(mén)總經(jīng)理張建國(guó)說(shuō)。
北大方正是一家制作中文、藏文和清代書(shū)法等字體的公司,于2014年加入了這一項(xiàng)目。
(編譯:李韞 編輯:齊磊)