一、基因因子
漢字基因是人類思維的精華,是資訊系統整合之基石,是中華文化優秀的明證。它具 有強大無匹的機能,經過分門別類、歸納整理後,提煉出「形音義」之「因子」,設計成 「碼」,是稱「倉(蒼)頡系統」(以紀念造字之前賢蒼頡)。
「碼」係中性符號(相當於代數中之「變數」),可在「基因」之統一結構下,根據 不同之應用,發揮不同之功能。
在「漢字」中有:字母、字形、字序、字音、字辨、字義六大要素,其「基因」中可 以析出各要素之「因子」。
「字母因子」即倉頡二十四個字母;「字形因子」則載於CBFLABS.網頁「著作下載」 欄:「倉頡輸入法與中文字形產生器」一文中,供字庫造字用;「字序因子」相當於拼音 文字的字母順序,供大量資料查尋用;「語音因子」即各種音標符號;「字辨因子」乃倉 頡字母及其輔助字形;「字義因子」即為「概念基因」,乃中華文化最精煉之瑰寶,為「 溝通理解」的不二法門,其綱要已如第二節。
此六種因子,皆屬「漢字基因」範疇,以「蒼頡系統」概括之,作為應用介面(蓋於 實用中,尚有兩種基因涉及「智識產權」,恕不能公佈)。
二、漢字六大要素與其因子
1,輸入:文字輸入-倉頡字碼(即字母因子)。
二十多年前,本人率先發表「倉頡輸入法」,以供中文電腦文字輸入之用。實則 當時「漢字基因」觀念已經成形,唯個人力有未逮,不得不逐步推出。
2,輸出:文字輸出-倉頡字形(即字形因子)。
電腦乃一資訊處理工具,所處理之結果,必當有以示人。故以「向量組字技術」 ,利用字形因子,以程序將「碼」釋為字形輸出。
3,查尋:文字排序-倉頡字母(即字序因子)。
過去因無電腦,文字序列全靠記憶,其效能不彰。今於大量資料(比如億兆筆) 處理時,查尋不僅要快速,且應與人之習慣相符(拼音文字唯一優點,即其「字母」 之排序,觀「字典」即可知之),故而釐定「倉頡字母」。
4,語音:形聲法則-倉頡字身(即語音因子)。
漢字百分之九十來自「形聲」,聲符多為字身,有一千三百多個。本系統僅取其 「本音」(如:詣取旨音,曇取雲音),以求系統完整(此乃革命也,有「學問」的 「利益既得者」必將反對,但不作此圖,漢字將永遭詬病)。
5,辨識:文字掃瞄-倉頡字碼(即字辨因子)。
辨識與輸入之對象相同、處理相反。故掃瞄之形可轉成向量,再由向量得出倉頡 字碼。既由字形得到字碼,即稱辨識。
6,意義:概念基因-概念分類及倉頡字首字身定義(請見第一節)。
概念分類為人類思維基因,再加上倉頡字首、字身之常識基因,以及文字之體用 因果、性質關係,即為文字對人之意義。
當概念基因之觀念發揚光大後,漢字將如同「科學」一般,易學易用。至時,中 華文化勢將為舉世所接受,以為人類造福。
三、整合應用
在資訊時代,由於應用工具的成熟,人際溝通的效率極為重要。
文字語言是內容的載具,諸如文字語音的輸出入,內容的認知與理解等,必須都能結 合在一個系統之下,始能得到最大的效益。否則,在資訊處理上,各種功能獨立,互無交 集,其結果必然是龐大無序,令人不知所從。
此一統合之體系,即為「蒼頡系統」。本實驗室之主要課題,即將之設計在「處理中 樞」中(即為目前正在設計之「易芯」晶片)。是則,人與人之間,可藉此客觀系統相互 溝通,其意義大矣哉。