[其他]漢字全息編碼無(wú)效
| 申請(qǐng)?zhí)枺?/td> | 86102528 | 申請(qǐng)日: | 1986-10-04 |
| 公開(kāi)(公告)號(hào): | CN86102528A | 公開(kāi)(公告)日: | 1988-04-13 |
| 發(fā)明(設(shè)計(jì))人: | 包祖剛;沈丹仙;包祖學(xué) | 申請(qǐng)(專利權(quán))人: | 包祖剛;包祖學(xué);沈丹仙 |
| 主分類號(hào): | G06F3/023 | 分類號(hào): | G06F3/023 |
| 代理公司: | 暫無(wú)信息 | 代理人: | 暫無(wú)信息 |
| 地址: | 上海市康定東*** | 國(guó)省代碼: | 上海;31 |
| 權(quán)利要求書: | 查看更多 | 說(shuō)明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 漢字 全息 編碼 | ||
漢字全息編碼是一種漢字信息處理技術(shù)。
漢字不是拼音文字,在檢索、打印、通訊等方面效率不高,特別是在電子計(jì)算機(jī)上的應(yīng)用存在很大的困難,必須找到理想的漢字信息處理方法。漢字全息編碼正是為了這一目的而創(chuàng)造的。
為解決漢字信息處理問(wèn)題,國(guó)內(nèi)外提出的漢字編碼方案不下五百種。漢字全息編碼的獨(dú)到之處在于:
1.編碼容量大而無(wú)重碼;
2.具有見(jiàn)碼知字的可讀性。
漢字全息編碼通過(guò)筆形碼表明每個(gè)漢字的全部筆形,通過(guò)結(jié)構(gòu)碼反映漢字中筆畫的結(jié)構(gòu)關(guān)系,通過(guò)變碼反映漢字中構(gòu)件的部位關(guān)系,從而排除了重碼并達(dá)到字碼的可讀性。編碼的原理如下:
一、字形編碼:按字形編碼,排除按字音編碼時(shí)因同音字造成重碼的可能性。
二、筆形分類:用26個(gè)字母分別代表漢字中各種筆形,分為三種類型:
1、基本型:橫、豎、撇、捺、點(diǎn)五種基本筆畫分別用a、b、c、d、e表示。字母a在英文中有“一”的意義,剛好對(duì)應(yīng)筆畫“橫”,其他則依次用b、c、d、e表示。
2、直觀型:字母n表示“ㄇ”,u表示“ㄩ”,t表示“十”,l表示“し”,r表示“”,x表示“ㄨ”,o表示“口”等等可以直觀對(duì)應(yīng)的筆形。
3、聯(lián)想型:指那些可以用一句“口訣”來(lái)概括或提示的筆形。例如字母k表示“撇捺撇點(diǎn)撇橫人”的筆形,即“”,“ㄑ”,“”,“ㄑ”,“”,“人”等筆形。再如字母q表示“書為(為)偉(偉)力左缺框”的筆形?!皶鵀閭チΑ狈謩e用來(lái)提示包含在這四個(gè)字中的“力”等近似筆形,“左缺框”表示“”,“ユ”等左邊有缺口的框形筆形,都用q作為代碼。又如字母s表示“活三點(diǎn)及鼎巧馬”的筆形,即“氵”,“氵”,“”,“三”,“”,“彡”,“”,“ㄋ”,“ㄣ”,“”,“ㄅ”,“”等十二種筆形。其中前六種都是三筆的筆形,概括為“活三點(diǎn)”;后六種都是折筆的筆形,分別用“及鼎巧馬”四個(gè)字來(lái)提示,“及”字包含“”和它的近形“ㄋ”,“鼎”字包含“ㄣ”和它的近形“”,“巧”字包含“ㄅ”,“馬”字包含“”,都用s作代碼。
三、標(biāo)碼順次:以筆順的先后作為標(biāo)碼的次序,使?jié)h字有規(guī)律地依次由方塊形的平面信息轉(zhuǎn)變?yōu)橹本€形的線性信息;反之,可由線性信息依次還原成平面信息。例如“可”字在標(biāo)碼時(shí)“一”用a表示,“口”用o表示,“亅”用b表示,依次排列編出該字的字碼為“aob”;該字碼在還原成漢字時(shí)可將“aob”所代表的筆形“一口亅”依次組合即得“可”字。
四、固定筆順:對(duì)為數(shù)不多但有爭(zhēng)議的筆順用“組合碼”函定表示,從而達(dá)到唯一性。例如“方”字中“勹”的筆順有兩可的情況,有的先寫“丿”后寫“”,有的則先寫“”后寫“丿”,為此用組合碼cu固定表示“勹”?!胺健弊值木幋a就唯一確定為mcu,其中m代表“亠”,cu代表“勹”,避免了這類筆形在筆順上的分歧。組合碼由基本代碼派生組成,只要掌握了基本代碼就自然能記住組合碼。
五,結(jié)構(gòu)顯示:用“結(jié)構(gòu)碼”表明字形結(jié)構(gòu)上的微小差別,防止重碼,加強(qiáng)可讀性。結(jié)構(gòu)碼由個(gè)位數(shù)表示。例如“甲”、“申”兩字都是先寫出構(gòu)件“曰”,再寫豎筆“丨”;“曰”的代碼為oe,“丨”的代碼為b,按筆順編碼都是“oeb”,形成異字同碼,即重碼。但“甲”字中豎筆有2個(gè)交點(diǎn),而“申”字中豎筆有3個(gè)交點(diǎn),因此輔以結(jié)構(gòu)碼,用“oeb2”表示“甲”,“oeb3”表示“申”,并不重碼。反之,在見(jiàn)到“oeb2”時(shí),知道該字的豎筆有2個(gè)交點(diǎn);在見(jiàn)到“oeb3”時(shí),知道該字的豎筆有3個(gè)交點(diǎn),不至于“甲”“申”不分。
六、以少制多:漢字的筆形遠(yuǎn)遠(yuǎn)超過(guò)26種,如果每個(gè)字母只代表一種筆形,那么26個(gè)字母是不夠用的。因此必須使每個(gè)字母所代表的筆形至少在兩種以上,并且必須使各個(gè)字母所代表的筆形在字碼中只能銜接成一種筆形,達(dá)到唯一性。例如字母q代表“”,“”,“”,“力”,“”,“ユ”等六種筆形,字母S代表“氵”,“”,“”,“三”,“”,“彡”,“”,“ㄋ”,“ㄣ”,“”,“ㄅ”,“”,等十二種筆形,當(dāng)q和s編在一起時(shí)只可能銜接成一種筆形“弓”;反之,“弓”也只能用qs來(lái)編碼。
七、縮短碼位:據(jù)統(tǒng)計(jì),一九五二年教育部公布的二千個(gè)常用字,平均每個(gè)字有11.2筆,其中17筆以上的有221個(gè),有的字筆畫多達(dá)27筆以上。如果用“一筆一碼”的方法編碼,則字碼太長(zhǎng),不切實(shí)用。因此必須采取縮短碼位的措施。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于包祖剛;包祖學(xué);沈丹仙,未經(jīng)包祖剛;包祖學(xué);沈丹仙許可,擅自商用是侵權(quán)行為。如果您想購(gòu)買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://m.szxzyx.cn/pat/books/86102528/2.html,轉(zhuǎn)載請(qǐng)聲明來(lái)源鉆瓜專利網(wǎng)。
- 上一篇:撳式閥-特別是撳式水龍頭
- 下一篇:水基鑄鐵涂料
- 同類專利
- 專利分類
G06F 電數(shù)字?jǐn)?shù)據(jù)處理
G06F3-00 用于將所要處理的數(shù)據(jù)轉(zhuǎn)變成為計(jì)算機(jī)能夠處理的形式的輸入裝置;用于將數(shù)據(jù)從處理機(jī)傳送到輸出設(shè)備的輸出裝置,例如,接口裝置
G06F3-01 .用于用戶和計(jì)算機(jī)之間交互的輸入裝置或輸入和輸出組合裝置
G06F3-05 .在規(guī)定的時(shí)間間隔上,利用模擬量取樣的數(shù)字輸入
G06F3-06 .來(lái)自記錄載體的數(shù)字輸入,或者到記錄載體上去的數(shù)字輸出
G06F3-09 .到打字機(jī)上去的數(shù)字輸出
G06F3-12 .到打印裝置上去的數(shù)字輸出
- 體征碼及其編碼方法
- 編碼裝置和編碼方法以及解碼裝置和解碼方法
- 聲音信號(hào)編碼方法、聲音信號(hào)解碼方法、編碼裝置、解碼裝置、聲音信號(hào)處理系統(tǒng)、聲音信號(hào)編碼程序以及聲音信號(hào)解碼程序
- 用于下一代視頻的編碼/未編碼的數(shù)據(jù)的內(nèi)容自適應(yīng)熵編碼
- 編碼光符號(hào)編碼
- 一種可變幀率的編碼方法及裝置
- 一種物聯(lián)網(wǎng)編碼方法及系統(tǒng)
- 點(diǎn)陣編碼及解碼方法
- 一種視頻編碼方法、裝置和存儲(chǔ)介質(zhì)
- 視頻編碼方法、裝置、計(jì)算機(jī)設(shè)備和存儲(chǔ)介質(zhì)





