漢字基因ˍ朱邦復ˍ漢字基因工程(七)

網頁排版者言與基因有約漢字基因工程漢字基因十節課朱邦復工作室網站

(一)(二)(三)(四)(五)(六)(七)(八)(附錄)

(七)漢字基因工程

  將前述的各種基因,利用現代化的科技,結合為一種 擬人的、可與人溝通的應用工具,此工程即可稱之為「漢 字基因工程」。

  除了溝通應用工具之外,若在商業立場,尚可開發出 無數種極具價值的消費產品,只是這些項目並不在本文討 論範圍。

  漢字基因六大功能中,「字碼」是建立在倉頡輸入法 上的(其他輸入法需要外加介面),可以當作文字索引使 用。尤其是在大量資訊中,若要尋找某一類型、或某一筆 資料,文字索引的良窳,其效率的差異有天淵之別。

  這是基於在設計倉頡輸入法的時候,我已經把字義分 類考慮進去,以致在資料索引時,可以作雙向比對。尤其 是字碼採用三十二位元技術,其中前五個位元專供文字分 類,倉頡輸入碼佔二十五位元,可容約千萬字,最後二位 元保留給子字集分類用。

  子字集是為同碼異類字的分辨,例如00類視作繁體 漢字,01為簡體漢字,10為異體漢字,11為日文漢 字。是則雖然一字四碼,各碼不同,卻統屬同一平面,隨 時可選擇變換。

  「字序」是文字索引的另一項武器,很多漢字內碼沒 有序列觀念,必須外建序列表,或用筆畫,或用部首。而 這兩者都與人們的使用習慣沒有直接關係,如果資料放置 方式沒有直觀的順序,則完全沒有效率可言。

  「字形」所衍生之字庫,可以徹底解決當前中文系統 文字不足與不能兼容的困境。目前完成之第六代中文字形 產生器,所佔程式空間僅160KB,若僅用倉頡碼則不 需儲存任何內碼表,有碼即有字。再若增列對照碼表,則 可容納國標碼、大五碼、JIS碼,ISO10646, UNICODE等。每個字形皆可作各種大小及字體的變 化,在速度上,每秒鐘可組成16*16之字形四萬六千 個。

  「字辨」有多種功能,除了文字辨識外,也有影像辨 識的基因在內。只是限於中文平台的機能,「字辨」尚須 配合其他硬體設施。

  「字音」可供語音辨識及語音合成之用,任何一種漢 字輸入法均須經過學習,推廣不易。若用語音辨識輸入, 效果最佳。同時,當理解系統完成後,再配以自然語言, 語音的辨識與合成更是不可或缺的工具了。

  最後,也是最重要的,在於「字義」的應用。前面所 介紹的感覺、認識及思維基因,都必須有合適的「字義基 因」作為介面,是稱理解。唯有在理解下的資訊平台,才 具有真正的應用價值,而這種資訊平台,也就是建立在漢 字基因上的「中文系統平台」。

  此外,根據上述各種基因所發展的三維繪圖系統,能 高速將文字經過理解後,轉換成圖片、動畫,並能於每秒 鐘顯示含一萬個畫素的圖形三十幅。

  當今網絡最大的瓶頸,在於頻寬有限,而傳輸的信息 總是遠遠超過其容量。茲以六十分鐘的影片計算,設劇本 為三萬字,但以VGA全彩顯示,計有120億字元的影 像。如果在網絡上傳送,顯然必導致壅塞,問題重重。如 利用本系統,則僅需傳送字碼,三萬字僅為六萬字元,傳 輸效率高達四十萬倍以上。

  我們再從設計的觀點來看,當前各種微電腦的中樞 (Central Processing Unit ),其功能都以數學運算為 主,完全不符合漢字基因需求。因此,我們有必要另起爐 灶,重新設計一個以「理解」為主、採用RISC結構的 圖形中樞。

  目前全部漢字基因結構已經設計完畢,計有基因庫、 人性庫、常識庫,以三十二位元匯流排,計佔1M系統空 間,組合程式512KB,其中包含免疫系統、辨識系統 、理解系統及概念網絡等。另外,尚有若干特殊的硬體設 備,在此不贅述。

  本平台僅為一種資訊介面,專供人機溝通之用。電腦 功能發展至今,相當於一批高效率的專業機器,為了充分 發揮電腦功能,有必要設置若干電腦站,並以網絡聯接。 任何人都可以通過前述的中文系統平台,用語音或鍵盤, 命令理解系統,透過網絡,搜尋各個電腦站的功能軟件, 並作最完善的服務。

  這種方式最有利於我國現狀,只需要極少數的資金, 全國人民就可以享受最新資訊的成果。此外,正當微軟挾 其資訊領域的獨佔優勢,強行推廣其視窗文化之際,舉世 都戰慄在其無饜的貪婪風暴之下。今天我們面臨的並非第 三波的文化之爭,而是金錢有限與無限的遊戲,當微軟的 財富攀上金字塔尖時,貧困者與資訊的距離將更為遙遠!

  「漢字基因工程」是自然體系下、最接近真實的一種 技術。我個人雖竭盡心力,所能完成的著實有限,為了人 類、文化、國家、民族的福祉,特此藉這個機會,公諸於 眾,期望大家群策群力,令漢字重放光芒。

  (請見圖一「功能說明」、圖二「硬體結構」。)

圖一功能說明圖二硬體結構

(網頁排版者註:原圖太大,調整為現在的大小供整幅閱看,圖一因縮小字體模糊了,故照原字樣重打貼回上去,期間沒有一字之易。)

(一)(二)(三)(四)(五)(六)(七)(八)(附錄)

位址連結點形式/頁頂