[其他]計算機漢(文)字快速處理系統在審

申請號：	101985000009039	申請日：	1985-12-13
公開（公告）號：	CN1004034B	公開（公告）日：	1989-04-26
發明（設計）人：	許素蘭	申請（專利權）人：	許素蘭
主分類號：		分類號：
代理公司：	暫無信息	代理人：	暫無信息
地址：	北京市海淀區塔***	國省代碼：	北京;11
權利要求書：	查看更多	說明書：	查看更多
摘要：
搜索關鍵詞：	計算機快速處理系統
鉆瓜網技術展會專利詞庫專利權人專利榜在售專利公布日期熱門專利

【說明書】：

一種計算機漢（文）字快速處理系統，由光學系統、硬字庫和一系列壓縮技術而組成的計算機混合裝置，技術指標：漢字識別字種五萬，識別速度１千字／秒，無差錯，無拒識。漢字鍵入平均速度３字／秒。光纖管轉印輸出速度５千字／秒，分辨率１０線／毫米。該裝置有與大、中型機聯機的國際通用標準接口介面和聯機處理軟件。也可脫機成批錄入，成批輸出并有相應處理軟件和使用說明書。

本發明所屬技術領域：混合計算裝置

隨著電子技術的發展，大規模集成電路的出現，計算機的容量不斷擴大，速度不斷提高，功能愈來愈強，信息吞吐量成數量級增長，而外圍設備目前還滿足不了社會的需要，尤其是漢（文）字輸入速度問題一直是國際上的老大難，在國內外專家做了許多研究與開發的基礎上，我們吸收了西文字處理的優點，采用了當代新技術（紅外，激光，微光攝象，電子技術）與數學原理結合而設計了一種（文）字快速處理系統，該系統分快速識別，快速鍵入，快速輸出三部分。

本發明所參考文獻：

〔1〕“我國中文信息處理技術發展概況”

“一種可逆壓縮型24×24點陳漢字庫的實現”

“計算機研究與發展”雜志1985，第四期

〔2〕曹長久等“實用漢字系統的一次折閱”

計算機應用通訊1982，第3期

〔3〕李金凱“漢字信息和信息字典”

“中文信息處理國際討論會論文集”

“漢字頻度表”

北京新華印刷廠1971年

-快速識別

對大量經印刷出版或打印了的各種書報，刊物，文件等印在紙面上的標準中文信息，隨著科學技術的發展，社會的進步，其增長速度是很快的，因此自動地，高速地和準確地將漢字輸入計算機是必要的，本快速識別僅對標準印刷體，（字型大小可調）漢字識別。

歐美對文字識別的研究工作始于50年代初期，1955年便出現了印刷體漢字的Optical Character Recognization產品，簡稱OCR產品，現在，在文字識別研究方面日本已居世界領先地位，對單一印刷體漢字2000字種的識別率至1974年已達到99.9%，對這種傳統的識別技術，無論用哪種光電轉換方式（飛點掃描法，光電攝象管方式，激光掃描方式，光敏矩陣方式，）都要將紙面上的文字信息變成離散的電信號后送入計算機判別，在計算機內建立標準的辭書，選用適當的識別準則（如相似度準則），距離準則和方法（如圖形配比法，結構分析法等）將一未知文字與辭書中所有標準漢字逐個地進行配比，在判別過程中需大量時間，且判別速度隨字數的增加明顯降低，為提高識別速度又將文字進行分類，（如東芝所用的分類法有復雜指數分類法，四邊代碼分類法等）將輸入的文字首先進行類別判斷而后再將未知文字與相應類中的標準文字逐個地進行匹配，再輸出圖1傳統識別逐個匹配方框圖（1）漢字原稿，（2）檢測，（3）分類，（4）判別。

本發明的目的，建立漢（文）字快速識別技術，快速鍵入技術，快速輸出技術。

本發明的優點：

1、漢（文字快速識別技術中，其判別速度與漢（文）字字數增加無關，未知漢（文）字通過硬軟拷貝與全部標準漢（文）字同時并聯匹配，而非逐個匹配，因而不需分類，彌補了傳統（識別技術）的判別速度隨字數不斷增加而降低之不足，漢字識別字數可達50000字種，速度可達1000字/秒。

2、建立光學系統，包括光接收部分（微光攝象，光分路技術：光纖型分路，CRT型分路技術）識別準則部分，光處理部分：識別方法，重碼處理，輸入，輸出及其處理軟件。

下載完整專利技術內容需要扣除積分，VIP會員可以免費下載。

免登錄下載普通用戶下載升級VIP會員，免費下載

該專利技術資料僅供研究查看技術是否侵權等信息，商用須獲得專利權人授權。該專利全部權利屬于許素蘭，未經許素蘭許可，擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作，請聯系【客服】

本文鏈接：http://m.szxzyx.cn/pat/books/101985000009039/2.html，轉載請聲明來源鉆瓜專利網。