為求掌握機器理解的技術,西方工業國家不惜工本、 不遺餘力,迄今整整研究了五十年,但都沒有任何突破。 原因很簡單,西方所使用的拼音文字中,不具備字義的基 因,以致無機可尋。
人類對語文理解的過程牽涉極廣,不可能在此一一詳 說。為了略釋眾疑,下面我略舉數例,介紹一些相關的應 用流程和條件,以供參考。
1,概念表達:
釋文:「表」-會意字,上衣也,引申外層可見可示的徵象、訊息也。 「達」-字首:ひ,乍行乍止,行為。 字身:大羊,美也,有福也。 *行為順暢,有利,目的完成,到也。 定義:以可示的徵象完成目的,使知也。
人類文明史上,僅有兩種表達概念的方式: 一為音符式;一為圖形式。因為人類所賴的溝通 介面,只有聲音與圖形。聲音易學易用,起源自 動物求偶及宣示領土之本能。而圖形繁複難行, 最近的考古資料顯示,克羅馬儂人在其居住的洞 穴中,曾製作了大量的壁畫,這已是近十萬年的 事了。
過於簡單或複雜都不是理想的結構,簡單符 合人性需求,卻犧牲了功能;複雜為人所畏,不 到不得已,是人所不取者。聲音的易學易用發展 出音符概念,當今泰半的語文屬拼音語系,其優 點為容易使用、利於發展貿易。
只有中國早就採用較音符複雜、而較圖形簡 單的「形聲」概念系統。只惜國勢未張,中國人 不自知其福。須知易學易用固為生存之道,然進 化之過程,必朝向更高的方向發展。而更高的功 能,則絕非簡單的工具所能企及。
概念是以一些象徵性的符號,代表經驗認知 中某些概略的因素,人在思維時,這種代表性的 符號,就可以透過網絡介面,將其經驗認知因素 逐一展開。
舉例而言,飛機為一概念,而此一概念為「 飛」與「機」所組成。但是飛機所代表的因素極 多,在網絡介面上,僅以體用因果為例,簡示如 下:
靜態體:「形」-巨大,有翼。 「質」-金屬,重而堅。 「性」-科技產品 。 靜態用:「形」-能載人、物。 「質」-安全可靠。 「性」運動於遠距離。 動態因:燃燒汽油,動力大,因空氣浮力而運動於空中。 動態果:節省時間,代價高,經濟價值高,危險性大,出事率低。
假定思維主題為「渡過十天假期」,而由「 坐飛機去旅行」驅動的認知,根據概念表達的先 後次序(在此僅分析與飛機有關者),將網絡介 面展開如下:
坐───ヾ選擇對象及方式 ゝ將臀部(身體)置於……ゞ穩定舒適態 々等待 飛機┬─ヾ所選擇之對象 ゝ將臀部置於座位上 ゞ穩定舒適 々目的地 ├─選擇原因:此交通工具速度快,在空中運動。 (經驗) │├聯想性--其他交通工具之經驗。 (經驗) │├安全性--危險,查經驗資料-死亡機會-小。 (判斷) │├價值性--價值-高,代價-高。 (判斷) │├必要性--僅有十天時間,往返要有效率。 (判斷) │├目的性--旅行-平安,環境變化刺激心態改變。(判斷) ├判斷可行┘ 去─┴─選擇飛機可達之處。 旅行──目的。
再如把「車」當作一封閉系統,尋找「車」 與其他概念的構詞關係,則可視常識為基因,前 後承接為介面,分析如次:
前系統:代表性質,功能分類等。 如:大軍汽火風牛馬戰機禮專輓輕等。 本系統:「車」 後系統:屬性分類,定義定性等。 如:頭尾門燈椅身座票牌廂禍店資等。 上系統:應用處理,控制操縱等。 如:開駕錯倒洗乘租買賽御翻轉寄等。 下系統:所屬概念,引申概念等。 如:如輪轄軸軛輛轍轅轗轉轎轖輘等。
知識具有能量,將其能量分解,即有實用功 效。知識能量結合成四種模組形式:概念模組、 結構模組、知識模組、系統模組。分解這四種模 組,就可以得到知識的能量。
概念模組,在漢字即為常識結構,如為拼音 文字,則尚須在概念模組之外,另行建立常識結 構。常識結構之難度遠大於任何一種知識,蓋知 識有一定的範疇,而常識則無從限制。若無常識 做基礎,語言文字只是一些無機的符號,對人毫 無意義。
漢字最大的價值,就在於圖形符號與「象」 的常識結構上。只要熟習取象的本旨,以及形聲 的擴充規律,漢字本身就是字典,外加一整部百 科全書。一般說來,中國人只要略識「之無」, 就小有常識,正是這種微妙的模組之功。
2,概念模組:
釋文:「模」-字首:木,樹木。 字身:莫,草中見日形。 *初民以木為定形之物,以擬所見之形,引申為標準的範式。 「組」-字首:糸,細絲。 字身:且,又也。 *細絲交互聯結,系統間配合為一體,量詞。 定義:以一系統之固定形式應用於其他系統者。
人生有限而宇宙無窮,以有限理解無窮,本 係不可能的任務。經過人類數十萬年的摸索,終 於發現一種以簡馭繁的法則,即以簡單的訊息, 代表含糊的常識經驗認知,是稱「概念」。若以 概念為經,常識經驗為緯,彼此交錯銜接成為一 個模組,這種模組即為「概念模組」。
以漢字為例,概念與常識的關係非常密切, 茲簡述如下:
ぇ概念代表多數常識:即將概念做為索引或目錄。 え概念代表某一常識:是稱等效式,一個概念代表一種常識。 ぉ概念等於常識:此觀念來自漢字圖形文字之「六書」法則。 ヾ辨識概念因子:文字中已具辨識之定義: 如字首:日月與光熱有關;目與視訊有關。 金木水火土為性質分類。 牛馬犬鳥魚為生物分類。 門戶車舟穴為機能分類。 刀矛弓矢貝為用途分類。 骨肉皮毛髟為組織分類。 手足口彳走為行為分類。 ゝ認識概念因子:漢字係以少數概念,結合成 為「詞組」,詞組產生模組認知,即功能、 控制、變化、情況、利害等所具有的能量。 如「火車」是一個概念,而「火車是交通工 具」則為常識。 「火車」之概念為:「火」為動力,「車」 為交通工具。 而火的動力及交通工具的性質則為知識。
3,結構模組:
結構模組由概念模組構成,將概念模組組合 成「句子」。句子是一系列常識的綜合,經常代 表著某種知識,或者稱做有系統的常識。
句子可以視為一組連結的系統,由本態系統 、連結系統及終態系統三者構成。
本態系統可以是任何系統,連結系統則必須 與本態有介面關係,終態系統多屬因果關係,如 非因果之陳述,則可從缺。
「句子」=本態系統+連結系統+終態系統
概念是由基本的、不可分割的因子所組成, 源自刺激,其中包括外來的能量變化、內在的經 驗認識等等。刺激又有各種不同的性質,在不同 情況下有不同的認知。句子就是要界定概念所不 能代表的各種情況,以表達其本態或終態認知。
概念結構是多層次的組合,縱橫結成網絡, 當網絡聚合為一「交集」時,人始能認知各概念 間的關係。聚合有其必然的過程,過程的長短會 影響網絡電勢的強弱。時間短效率高,時間長則 電勢減弱,無法聚焦。
因此,概念最有效的應用方式,必是在電勢 尚未減弱前,聚焦完畢。所以句子不宜太長,人 對超過十個概念以上的句子,常常要重複思考, 否則不能理解。
連續的系列常識,始能組成由簡單到複雜的 知識,唯有整個系統架構完成後,知識才能成為 一個體系。用「文法學」的術語來說,是以字組 成詞,詞組成句,句組成段,各段組成篇章,始 成知識。
本態及終態系統各代表一種性質或狀態,所 有的概念皆能適用。連結系統如涉及因果,則屬 動作行為等「主觀動態」類概念,否則必為「客 觀-抽象-定義-語法」類。
在系統觀之立場,文句係以本態系統為天, 終態為地,連結為人。以天為大範圍,由人界的 變化,以與地界合為一體。但在表達中,各系統 又可細分:
例一:以「坐飛機去旅行」說明如次: 天:本態坐飛機 天: (某人)--省略 人: 坐-----行為,主觀認知 地: 飛機----本態 人:連結去 天: 人: 去-----行為,主觀認知 地: 地:終態旅行 天: 人: 旅行--行為終態,主觀認知 地: 例二:分析「本文之主旨在於闡明知識模組之應用」: 天:本態本文 之 主旨 天: 本文----本態 人: 之-----屬性 地: 主旨----屬於本態 人:連結在於 闡明 天: 在於----連結本態 人: 闡明----主觀認知 地: 地:終態知識模組 之 應用 天: 知識模組--終態之本 人: 之-----屬性 地: 應用----終態之果
此外尚有句子的結構關係,略舉數例如次:
ぇ代表因、果及體、用關係者: 「因為,所以」、「故此」表因果關係。 「得以,可以」兼具因果及體用關係。 「把,用於」則為體用關係。 え結構的等效關係: 「是、為、係、等於、相當於……」等概念。 「你、妳、我、他……」等人稱代名詞,及「 這個、那些……」等指示代名詞。 「和、及、與……」等連接詞。 ぉ結構的從屬關係: 「有、屬於、的、之……」等界定前後關係者。 お結構的狀態關係: 如果結構功能為動作表現,則前者為始態,後 者為終態。 如「逃脫」及「脫逃」兩個概念結構,都由「 逃」及「脫」所組成,前者為始態,表示開始 逃,後者為終態,表示脫離了逃的狀況。也就 是逃的目標達成了,這是因為概念「脫」具終 止因子之故。 後者以「脫」為始態,開始為「脫離」某一情 況,終態為逃的動作。脫雖具有終止之概念, 但在始態時僅表示終止前一狀態,逃不具終止 概念,故而尚在繼續「逃」。 再若「穩不穩」等各種肯定加否定的概念,是 表示相對狀態,代表在此兩種相對的認知中, 任何一個尚不明確的灰色區域。 か結構的程度關係: 所有的「相對概念」,如「大、小,快、慢, 軟、硬,高、低」等,如果作為始態,表示為 一時、空、質、量、數等性質的概略程度。如 :「快」跑,「好」吃,「高」山,「近」利 等。 如「死打」及「打死」,「打」無終止概念, 而「死」具終止概念,且屬完全終止。若以「 死」為始態,則表示嚴重程度。至於是否已「 打死」,則必須另行陳述。 若需要強調此一程度,則再應用其他的程度概 念如:「很」快,「非常」好,「夠」高,「 不」近,「一味」死打等。 が結構的數量關係: 為了更明確地表達,則需採用「數量概念」, 數量概念有二:一為數值,一為性狀。概念的 應用彈性越大,其效率越高,故數值與性狀分 別使用,遠比結合為不可分的單一概念有利。 以「人」為例: 一「人」--未加性狀,單指「人」,數量為 一,無特殊意義。 一「個」「人」--性狀為「個」,指人的「 整體」。 一「群」「人」--性狀為「群」,指很多人 聚集之狀。 一「堆」「人」--性狀為「堆」,指很多人 「堆」在一起狀。 一「車」「人」--性狀為「車」,指範圍為 一車之中。 一「家」「人」--性狀為「家」,範圍為一 家。 一「條」「人命」-性狀為「條」,其中之「 人」用以界定「命」。 性狀類為界定性質、狀態的概念,與數值概念 結合,可表達更多的屬性。 き結構的時、空關係: 如「前、後、左、右、上、下、內、外、中、 裡……」等。 ぎ結構的性質關係: 物有物性,以物質代表之: 「木製」為:以「木」質為原料,「人造之」。 事物有分類,以類性代表之: 「車廂」為:「車」之「廂」。 く尚有其他多種關係,茲不細列。
4,凡例:
下文以「快去把那份資料印出來」為例,說 明此介面的操作情形:(暫略去情緒累積部份, 因單獨一兩句話,不能構成累積條件。另外,漢 字具有動畫的蒙太奇效應,是依視覺順序進行, 最宜連續感知)。
假定電腦之〔立場〕=處於等待指令狀況。 則電腦之〔目標〕=完成「快去把那份資料印出來」。 電腦之〔判斷〕=目標達成為止。 分析資料庫: 「我」=電腦 「對方」=誰? 調出「誰」的資料,以供判斷參考。 逐字分類:(括號內代表電腦之執行態。) 快=心部,屬於心態,夬者決定,心中決定需速也。 去=動向。 (快去=電腦立即執行) 把=手部,手執。 (下列之執行內容) 那=邑部,空間。 (指定之對象,與前文有關) 份=人部,人所分者。 (對象) 資=貝部,有次序之財。 (有利者) 料=斗部,以斗計米,整理過者。 (資料=專用詞,電腦貯存者) 印=つ部,用爪處理者。 (電腦功能) 出=動向。使露。 (使顯示) 來=木部,樹下見人。 (電腦使實現) 再用常識庫,參考體用因果關係,根據一定的過 程,即可逐步進行。 電腦隨時判斷,體=資料,是否有用=印出,直 到完成為止。