[其他]圖象了解系統(tǒng)在審
| 申請(qǐng)?zhí)枺?/td> | 101985000006850 | 申請(qǐng)日: | 1985-09-11 |
| 公開(公告)號(hào): | CN1004386B | 公開(公告)日: | 1989-05-31 |
| 發(fā)明(設(shè)計(jì))人: | 中野康明;藤澤浩道;東野純一;江尼正員 | 申請(qǐng)(專利權(quán))人: | 株式會(huì)社日立制作所 |
| 主分類號(hào): | 分類號(hào): | ||
| 代理公司: | 中國(guó)國(guó)際貿(mào)易促進(jìn)委員會(huì)專利代理部 | 代理人: | 余剛 |
| 地址: | 日本國(guó)東京都十*** | 國(guó)省代碼: | 暫無(wú)信息 |
| 權(quán)利要求書: | 查看更多 | 說(shuō)明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 圖象 了解 系統(tǒng) | ||
本發(fā)明的圖象了解系統(tǒng)使用了一種描述文件圖象的語(yǔ)法,并通過(guò)分析按照這種語(yǔ)法所寫的語(yǔ)句(即該語(yǔ)法的結(jié)構(gòu))表示出一個(gè)未知輸入圖象的結(jié)構(gòu)。換句話說(shuō)這種語(yǔ)法將圖象描述成子結(jié)構(gòu)和它們之間的相對(duì)關(guān)系,在語(yǔ)法分析中,當(dāng)識(shí)別了子結(jié)構(gòu)和它們的相對(duì)關(guān)系后,便在未知的輸入圖象中進(jìn)行搜索,看是否存在這種子結(jié)構(gòu)和它們的相對(duì)關(guān)系。根據(jù)這個(gè)搜索的結(jié)果來(lái)表示未知輸入圖象的結(jié)構(gòu)。
一般地說(shuō),本發(fā)明涉及一種文件圖象處理系統(tǒng),更具體地說(shuō),是涉及了一種適于作電子文件圖象存儲(chǔ)器的輸入單元的文件圖象處理系統(tǒng)。
通常的一些電子文件存儲(chǔ)器只是把文件的每一頁(yè)作為一個(gè)圖象來(lái)存儲(chǔ),而用于信息檢索的輔助信息必須用代碼輸入裝置(比如鍵盤)從外部單獨(dú)地輸入。然而,為了使文件輸入工作自動(dòng)化,最好通過(guò)自動(dòng)地讀出文件中所描述的題目,作者名字等來(lái)生成輔助信息。為了進(jìn)一步改進(jìn)信息檢索,需要實(shí)現(xiàn)圖表標(biāo)題和章節(jié)標(biāo)題的自動(dòng)輸入,或者通過(guò)正文本身的識(shí)別自動(dòng)抽取關(guān)鍵詞,同時(shí)要求把目標(biāo)文件之圖象劃分成各部分,比如標(biāo)題、作者、摘要、正文、數(shù)字、插圖等,以減少存儲(chǔ)空間并增加檢索的自由度。
為了解決上述問(wèn)題,目前已研究出了一個(gè)能夠了解文件內(nèi)容并根據(jù)了解的結(jié)果處理文件的系統(tǒng),由尤杰·諾古奇(Yoji Noguchi)和朱尼奇·托亞特(Junichi Toyoter)在“報(bào)刊文章剪輯系統(tǒng)的基本研究”中所公開的就是這種系統(tǒng)的一例(日本信息處理協(xié)會(huì)第23次全國(guó)大會(huì)文件摘需6C-1)。然而,由于這個(gè)文件了解系統(tǒng)是針對(duì)報(bào)紙的剪輯而研制的,所以還不清楚是否可以把它應(yīng)用到具有任意格式的文件中。另外,它只是把字符部分分割,而分割和識(shí)別相結(jié)合的方法卻沒(méi)有公開。
本發(fā)明的目的是提供一種圖象了解系統(tǒng),它可處理普遍的文件圖象,根據(jù)它們的結(jié)構(gòu)把它們分割,使之可能在任何需要的時(shí)候識(shí)別字符部分。
為了完成上述目的,本發(fā)明運(yùn)用了一種描述文件圖象之結(jié)構(gòu)的語(yǔ)法和對(duì)以這種語(yǔ)法表示的語(yǔ)句(文件的結(jié)構(gòu))進(jìn)行分析,以識(shí)別輸入未知的圖象的結(jié)構(gòu)。該語(yǔ)法把圖象描述為一些子結(jié)構(gòu)及其它們之間的相對(duì)關(guān)系。在分析過(guò)程中,識(shí)別了子結(jié)構(gòu)和它們的相對(duì)關(guān)系以后,做搜索,看未知的輸入圖象中是否存在這些子結(jié)構(gòu)和相對(duì)關(guān)系,如果存在,再進(jìn)一步分解這些子結(jié)構(gòu)的內(nèi)部,以進(jìn)行分析;如果不存在,則搜索其它的可能性。從這樣一種搜索的結(jié)果中我們可以了解輸入未知圖象的結(jié)構(gòu)。
下面是附圖的簡(jiǎn)要描述
圖1表示文件的一例;
圖2表示本發(fā)明的一個(gè)實(shí)施方案;
圖3、4、5和6是流程圖,用于說(shuō)明圖2中所示控制單元的處理過(guò)程;
圖7是表示一個(gè)文件例子的參考圖;
圖8、9、10、11、12和13是用于解釋本發(fā)明的第四實(shí)施方案工作原理的解釋圖;
圖14和圖15是流程圖,用于解釋本發(fā)明的第四實(shí)施方案中控制單元102所進(jìn)行的處理;
圖16和圖17是解釋圖,用于解釋圖15中所示的處理內(nèi)容。
在描述這些實(shí)施方案以前,讓我們首先解釋一下本發(fā)明實(shí)施方案的語(yǔ)法分析方法。雖然下面是以技術(shù)論文為例來(lái)描述,但因?yàn)檎Z(yǔ)法格式有一定程度的不同,所以通過(guò)改變語(yǔ)法的某些部分,也可以將本發(fā)明應(yīng)用到其它文件中去。因此,本發(fā)明不受技術(shù)論文的具體限制。
圖1示例了一頁(yè)具有預(yù)定格式的技術(shù)論文,下面將說(shuō)明一個(gè)表示文件結(jié)構(gòu)的語(yǔ)法例子(以后稱為“文件語(yǔ)法”)。
(原文行)
1.〈文件〉 ∷=|〈技術(shù)論文〉|〈平裝本小說(shuō)〉|~|〈專利〉
2.〈技術(shù)論文〉 ∷=〈題目頁(yè)〉
3.〈技術(shù)論文〉 ∷=〈技術(shù)論文〉〔+〈接續(xù)頁(yè)〉:〕
4.〈題目頁(yè)〉 ∷=|〈UDC〉η〈題目?jī)?nèi)容〉η
〈作者摘要〉η〈正文〉η〈題目頁(yè)
分隔符〉
5.〈接續(xù)頁(yè)〉 ∷=〈標(biāo)題〉η〈正文〉η〈頁(yè)分隔符〉
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于株式會(huì)社日立制作所,未經(jīng)株式會(huì)社日立制作所許可,擅自商用是侵權(quán)行為。如果您想購(gòu)買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://m.szxzyx.cn/pat/books/101985000006850/2.html,轉(zhuǎn)載請(qǐng)聲明來(lái)源鉆瓜專利網(wǎng)。
- 上一篇:時(shí)間軸控制方法
- 下一篇:色譜柱
- 同類專利
- 專利分類





