網易首頁 > 網易號 > 正文申請入駐

人工智能時代的語言與認知

2026-03-20 00:32:59　來源: 科轉在線

北京舉報

分享至

作者簡介

蔡曙山，清華大學社會科學學院認知科學與技術研究中心主任、教授、博士生導師。研究方向為哲學、語言學、邏輯學、心理學和認知科學，主要著作有《認知科學導論》《我言，故我在——語言、思維、文化層級的高階認知研究》《自然語言的形式理論研究》《語言、邏輯與認知》《言語行為和語用邏輯》等。

摘要

語言是人類認知的核心，其演化深刻推動人類文明進程。語言的誕生決定人類從猿到人的進化，漢字的出現則標志著中華文明的成熟。進入20世紀，維特根斯坦的分析哲學和語言哲學揭示語言對認知的根本性約束，喬姆斯基的先天語言能力假說確立語言作為人類核心認知能力的地位，為認知科學的誕生及其與人工智能的融合奠定理論基礎。21世紀是認知科學和人工智能的時代，語言的知識體系與認知能力成為技術發展的關鍵驅動力，而自然語言與人工語言的語義鴻溝，導致人工智能系統難以實現文化層面的語義理解和語用分析。漢語憑借語形加工、語義加工和語用加工的顯著優勢，成為全球認知科學發展與人工智能競爭中的重要認知工具，為人類探索語言與心智的深層關系提供獨特視角和方法。

導言

認知科學發端于20世紀50年代的“認知革命”，并在70年代末逐漸成為一個公認的交叉學科領域，其核心學科包括哲學、語言學、心理學、人類學和神經科學，并與計算機科學深度融合，旨在揭開人類心智的奧秘，促進學科的交叉融合與創新發展。在此框架下，計算機科學與認知科學交叉產生的人工智能，已成為一個影響深遠、備受關注的領域，并將深刻改變人類未來的發展。

在此探索過程中，對語言本質與機制的揭示，已成為理解人類心智和人工智能的關鍵問題。根據人類認知五層級理論，語言構成人類認知的基礎。在語言的基礎上，人類發展出復雜的思維，并借助語言和思維構建起整個知識體系，知識不斷積淀，最終形成文化。由此可見，人類的存在，本質上是語言、思維與文化的存在。約在600萬年至200萬年前，人類發明了抽象符號語言（即概念語言），這成為從猿到人進化的關鍵轉折。人類借此創造出一切物質財富與精神財富，并通過語言構建起城邦和制度，文明時代自此開啟。

認知科學讓我們認識到，語言的發明是人類歷史上至關重要的事件，是使人成為“人”的關鍵。作為人類最重要的心智和認知能力，語言創造并推動著人類的文化與文明發展。可以說，人類的存在是文化的存在，歸根結底是語言的存在。在此意義上，“我言，故我在”的論斷得以成立。進入20世紀，以維特根斯坦和喬姆斯基為先驅，人類以空前的睿智重新回歸語言這一關鍵領域，由此開啟認知科學與人工智能的新的時代。當前人類面臨的諸多機遇和挑戰，包括人工智能的興起，其根源與突破方向皆在于語言。本文立足這一背景，探討語言與人類認知關系的演進與發展、漢語認知的獨特優勢及其在未來發展中的重要作用，以期為人類認知發展提供新的理論依據與實踐途徑。

語言是人類認知的基本能力

語言的發明是人類進化的重要標志，這一重大事件不僅促成人類完成從猿到人的轉變，還為人類創造文化和文明奠定基礎。

文化（culture）一詞源于拉丁語“cultura”，意為“培養”（cultivation）。從廣義上講，文化即“人化”，乃是人類創造的一切成果之總和。具體而言，其涵括物質文化（如電燈電話、飛機飛船）、制度文化（如憲法制度、國家機關、和平慶典），以及精神文化（如語言文字、篆刻書法、音樂繪畫、思想觀念）。這些不同層面的創造，共同構成人類豐富而多維的文化世界。文明（civilization）一詞則側重于“城邦化”，是文化發展到一定階段的產物，是人類活動的高級形式。文化與人類同時出現，文明的出現則更為晚近；文化反映人類精神創造的方面，文明則更反映物質生產和社會制度方面。

漢語作為中華民族的主要語言，深刻參與中華文明的創造與發展。作為世界上最古老且持續煥發生機的文明之一，中華文明可追溯至殷商時代（約公元前1600年至前1046年），并在此根基上孕育出博大精深、歷久彌新的中華文化。語言在文化與文明的起源、發展過程中的重要作用，如表1所示。

表1 語言與中華文化和中華文明的起源和發展

來源：作者自制

可以看出，人類文化和文明的每一次發展和進步，無一不是人類語言運用的結果。在此表中，特別值得關注兩個重要事件：一是約在600萬年至200萬年前，由于言語（口語）的發明，人類祖先與黑猩猩分離，最終進化為人，它是人類誕生的標志；二是3500年前殷商時代文字（書面語言）的發明，這是中華文明起源的標志。這兩個事件標志著中華民族已經具備完整的語言系統，即口頭語言（語音系統）和書面語言（文字系統）。人類語言作為抽象的概念語言，為人類思維的產生提供基礎，即人類能夠運用概念進行判斷和推理。語言和思維的結合共同創造人類的全部知識，而這些知識積淀為文化。從此，人類具備獨特的三種認知方式：語言、思維和文化。

可見，正是語言的發明和使用，改變了人類的進化方向，并推動人類發展日新月異。盡管人類語言的運用已長達數百萬年，但對語言本質與心智奧秘的科學探索，直至20世紀認知科學的興起，才真正進入系統與深入研究的新階段。

語言與學科知識。語言是一種知識還是一種能力？傳統觀念中，語言常被視為一種知識。以漢語為例，對中國人而言，語音和文字都屬于知識范疇。從胎兒時期母親的胎教，到嬰幼兒階段的日常語音交流，再到小學階段語文（語言和文學）成為整個基礎教育階段的主課，這些經驗表明，語言是一種后天習得的知識體系。此外，人類所有的知識體系也均是用語言和思維建構的，如數學、物理、文學、哲學等學科知識的形成與發展，都離不開語言的參與。這些現象進一步表明，語言更是人類最重要的認知能力，并且是人類全部知識的基礎。

人類的知識系統表現為學科，如古希臘的“三科四藝”。其中，“三科”包括語言、邏輯和修辭，古希臘人認為這是人類最重要的三門知識；“四藝”則涵蓋算術、天文、幾何和音樂，被視為人類最基本的四種技藝和技能。從古希臘到中世紀，歐美教育傳統一直將“三科四藝”作為完善人格的基本途徑和重要認知方法。公元9世紀末，歐洲開始出現第一批大學，如法國的巴黎大學、意大利的博洛尼亞大學（被譽為“大學之母”，開設語法學、邏輯學、修辭學和法學課程）、英國的牛津大學和劍橋大學等。到12世紀，西方著名大學將“三科四藝”列為基本課程，形成基本的知識體系。由此看出，人類知識是形成體系的學科知識和技能，知識等同于學科知識。大學的出現強化了以學科為基礎的知識學習，現代大學則完全采用分科教育模式。近代以來，人類知識呈現指數級增長，知識和學科的劃分愈發精細，最終形成層級復雜、門類眾多的龐大現代學科體系。

語言是一種能力。從另一方面來看，語言的本質并非僅是知識或知識體系，其更是人類極為重要的認知能力。

美國語言學家諾姆·喬姆斯基（Noam Chomsky）的理論為我們重新審視語言的本質提供全新視角。喬姆斯基認為，行為主義語言學無法回答關于語言的兩個根本問題：其一，假如語言是后天習得，為何母親未教授孩子所有語句，孩子卻能舉一反三地學會無窮多的語句呢？其二，孩子能夠學會母語（第一語言）及其他民族語言，為何卻無法學會其他動物的語言呢？在與行為主義語言學家、心理學家伯爾赫斯·弗雷德里克·斯金納（B. F. Skinner）的論戰過程中，喬姆斯基提出新的語言理論，認為語言并非知識，而是能力，第一語言的認知能力是先天遺傳的，而非后天習得。人類憑借這種語言能力建構了所有的知識體系。這就是喬姆斯基的先天語言能力（Innate Language Faculty, ILF）假說，其后得到語言學家哥普尼克（M. Gopnik）等人的實證研究和實驗研究的支持。

生成轉換語法。在提出先天語言能力科學假說的同時，1957年，喬姆斯基出版《句法結構》，創立生成轉換語法（generative transformational grammar）。根據喬姆斯基的句法理論，第一語言的句法加工，并非如行為主義語言學所認為的自下而上（bottom-up）進行，而是自上而下（top-down）展開。以下展示一個英語“主-謂-賓”句式生成模型示例（見圖1）。

來源：作者自制

圖1 英語“主-謂-賓” 句式生成模型

借助此模型，可生成無數具有“主-謂-賓”句式的英語語句，如“the man hit the ball”“this boy love that girl”等。需注意，生成規則主要針對直接陳述句的構成進行分析，且動詞不作詞尾變化，直陳句之外的其他語句和單數第三人稱詞尾變化等句法結構，則由轉換規則予以說明。在該模型中，從樹根（sentence）到終端符（T,N,V,T,N）之間的結構，稱為深層結構（deep structure），而從終端符到語詞（the,man,hit,the,ball）之間的結構，稱為表層結構（surface structure）。顯然，喬姆斯基的句法理論和生成轉換規則，完美解答了行為主義語言學無法回答的關于語言的兩個根本問題，即語言的無限生成能力問題，以及不同自然語言之間為何能夠互相理解的問題。喬姆斯基的生成句法理論深刻揭示了語言系統的經濟性——僅需4種樹形結構（即“主-謂-賓”、“主-謂-雙賓”、“主-謂”、“主-系-表”），便能生成所有的英語語句。

喬姆斯基的理論不僅實現對所有自然語言的統一，還產生能夠統一所有形式語言的形式文法。眾所周知，計算機語言就是人類為機器設計的一種形式語言。喬姆斯基的重大貢獻可以歸為以下三點：其一，他認識到語言學是一種知識，而語言卻是一種能力，并提出先天語言能力假說，認為第一語言的能力是先天遺傳的。認知科學建立之后，語言被看作是人類最重要且基本的認知能力。其二，他的語言理論徹底改變人類對語言這一能力的認識，深刻影響語言知識的學習和語言能力測試，使重點從知識記憶轉向能力培養。其三，他認識到人類不僅能使用語言，而且會創造語言，并且人的語言創造力是無窮的。人類創造了表意的符號語言，從而脫離動物界，并在符號語言的基礎上發展出思維、建構知識體系，使知識積淀為文化。語言、思維和文化，共同構成人類特有的認知能力。

圖2是生命進化過程中產生的所有語言的分支圖，包括人類自發明語言以來所創造的所有語言。可以看出，人類語言包括非符號語言（信號語言）和符號語言兩種類型。非人類動物僅具備非符號語言，能傳達覓食、求偶、危險預警等與生存直接相關的信號，但無法表達抽象概念。非符號語言包括肢體語言和聲音語言：低等動物僅具備肢體語言，其表達依賴肢體接觸或視覺感知，傳達信息的速度和范圍受到限制。而更高級的動物進化出聲音語言，其傳播以聲速進行，語言交際無需身體接觸，語言傳播的速度和范圍顯著提高。

來源：作者自制

圖2 人類語言結構和語言分支圖

從語言演化視角看，人類語言被認為是在非符號語言基礎上發展而來的，自然包含肢體語言和聲音語言。需要注意的是，人類的肢體語言和聲音語言能夠表達概念，這與非人類動物存在本質區別。約200萬年前，人類發明了表意的符號語言（包括自然語言與人工語言）。根據文字特征，自然語言又分為聲音語言和象形語言兩類，前者如英語、法語、德語、俄語等，后者以漢語為代表。與自然語言對應的是人工語言，即為特定目的人為創造的語言，包括非形式的人工語言（如世界語）和形式的人工語言（廣泛應用于數學、邏輯、計算機和人工智能領域的一階語言、高階語言、模態語言、模糊語言）。

認知科學定義的知識和能力。人類認知五層級理論認為，在生命進化過程中，依次產生腦與神經、心理、語言、思維和文化五種心智，從而產生五個層級的認知能力，人類憑借此能力對內部信息和外部信息進行加工，從而形成生存和發展所需要的知識和文化。人類所有的知識體系，無一不是通過語言和思維來建構的。例如，數學就是由一套專用的符號系統，加上公理的推理規則構成。著名的皮亞諾算術系統（Peano Arithmetic, PA）就是其代表，基本內容如下：

語言

皮亞諾算術系統的語言是一種形式語言，其是在一階語言的基礎上增加以下符號而得：

公理

在這一語言的基礎上，可構造一個形式系統，使之能夠表明算術運算的系統特征，這就是皮亞諾算術系統，PA有以下7條公理：

公理(1)是說，零不是任何數的后繼數。公理(2)是說，對任何兩個數，如果它們的后繼相等，則此二數亦相等。公理(3)是說，任何數與零之和仍然是這個數。公理(4)是說，一個數與另一個數的后繼之和，等于此二數之和的后繼數。公理(5)是歸零律，即任何數與零之積為零。公理(6)是乘法對加法的分配律，即一個數乘以另一個數的后繼，等于此二數之積與第一數之和。公理(7)是著名的數學歸納法。

在皮亞諾算術系統中，可推導出一些重要定理。例如：

等等。

算術是整個數學的基礎，而數學又是自然科學和人類理性思維的基石，也是人類最早建立的知識體系之一。若數學基礎出現問題，便會引發人類理智和整個知識系統的危機。1901年，英國哲學家、邏輯學兼數學家伯特蘭·羅素（Bertrand Russell）在集合論中發現悖論。羅素悖論動搖了整個數學大廈的根基，引發了所謂“第三次數學危機”。悖論出現后，弗雷格、羅素、希爾伯特、哥德爾等一眾數學家、邏輯學家與數理哲學家紛紛擱置原有研究，投身于數學基礎的拯救工作。這一過程最終催生數學邏輯（mathematical logic）學科，涵蓋邏輯演算、公理集合論、模型論、證明論和遞歸論等重要分支。

在這樣的背景下，德國數學家、邏輯學家大衛·希爾伯特在20世紀20年代提出“希爾伯特方案”，即20世紀數學家應該解決的23個基本問題。其中，建立形式數學系統并證明其一致性，是希爾伯特方案的基本問題之一，至關重要。1930年，奧地利數學家、邏輯學家弗雷德里希·哥德爾（Friedrich G?del）證明了一階謂詞邏輯的完備性定理，該定理表明：在一階邏輯中，凡是邏輯有效的公式皆可在形式系統內得到證明，這為形式系統的可靠性提供重要支撐。然而，僅一年后，哥德爾發表更具顛覆性的不完全性定理，該定理由兩個部分組成：第一不完全性定理指出，任何一個足以表達自然數算術的一致形式系統，必定存在一個真而不可證的命題，因而該系統是不完全的；第二不完全性定理指出，這樣的系統無法在內部證明自身的一致性。

簡言之，形式數學系統的一致性與完全性不可兼得，一致則不完全，完全則不一致。一致性是任何數學系統或邏輯系統必須滿足的基本條件，即系統內部不能存在矛盾，任何一個命題p和非p不能同時為定理。而根據哥德爾定理，任何包括算術系統的數學系統或邏輯系統無法同時實現完全性，即至少存在一個真命題在系統內是不可證的。這一定理深刻揭示出形式系統內在的局限性。這一局限性不僅屬于數學。正如維特根斯坦在《邏輯哲學論》中所言：“我的語言的界限意味著我的世界的界限。”物理學家斯蒂芬·威廉·霍金（Stephen William Hawking）由此推論，依賴初等數學的物理學同樣受此約束，物理學家所追求的“終極理論”并不存在。因為物理學受底層邏輯的制約，哥德爾定理完全否定了這種無所不包的終極理論的可能性。哥德爾定理不僅約束數學與邏輯的邊界，更直接約束依賴形式化系統的人工智能。由于人工智能的邏輯計算本質是形式化推理，其必然面臨“一致則不完全”的局限，無法窮盡所有真理，這為理解人工智能與人類心智的根本差異提供邏輯哲學的解釋。

在這場從數學基礎危機到理性邊界反思的過程中，人類展現出卓越的語言發明能力，發明出一種新的語言——形式語言，并以此為基礎創造出計算機與人工智能。由此可見，人類用語言構建自身與人類社會，更創造出可能影響人類未來命運的人工智能。

然而，創造知識與駕馭知識的能力并非同一回事。從古希臘開始，西方教育似乎一直忽略一個根本性問題：教育的目標，究竟是向受教育者傳授知識，還是培養他們創造與運用知識的能力？這個問題的底層關聯著一個更為根本的問題：什么是知識？什么是能力？知識和能力之間是什么關系？直到20世紀50年代中期，這一問題才由喬姆斯基明確提出，并隨認知科學的建立而逐步得以回答。

認知科學的發展本身，體現出從關注靜態的學科知識，轉向探究動態認知能力的深刻轉變。筆者認為，心智是人類在進化過程中獲得的信息加工能力，從初階到高階依次分為腦與神經、心理、語言、思維、文化五種心智能力。人類運用這些心智能力進行信息加工的過程，稱為認知。因此，人類擁有與之對應的五個層級的認知能力，即腦與神經的認知能力、心理認知能力、語言認知能力、思維認知能力和文化認知能力。人類所具備的各種能力皆可歸入其中，人類所有的知識，均是心智和認知能力的產物。

五個層級的心智和認知能力，與認知科學所涵蓋的六大學科結構之間存在“一對多”的映射關系。然而，這種映射是單向的，即僅存在從心智和認知能力指向學科知識，不存在從學科知識到心智和認知能力之間的映射。這表明，認知能力生成了知識，而非知識創造了能力，人類的全部學科知識和學科體系，都是由人類的心智和認知能力所創造的。鑒于五個層級的心智與認知能力是一個瞬間貫通的整體，因此人類所生成的全部知識本然就應是綜合與交叉融合的。在認知空間中，知識本應是處處稠密、融會貫通的，然而學科的設置劃分往往是人為的、互相分隔的，這在一定程度上割裂知識的自然聯結，有悖于人類的認知特點與規律。隨著認知科學建立與人類認知能力增強，這種學科分隔的局面必將逐漸被打破，迎來學科深度融合、知識綜合創新的時代。

人工智能時代的語言認知

語言是人類在數百萬年漫長進化過程中獲得的特殊認知能力。大約在距今600萬年至200萬年前，南方古猿逐漸發展出表意的符號語言，這種語言不同于其他動物的信號語言，能夠協調更大范圍的群體行為。憑借這種關鍵的語言能力，這支在體格上并不占優勢的群體得以在生存競爭中取得主導權，最終在約200萬年前完成從猿到人的進化。可以說，人類在進化中脫穎而出的唯一優勢便是語言。

人類進化史中的另一重大事件，是文字（書面語言）的出現。大約在距今5000年至3500年間，文字的雛形出現并逐漸走向成熟。文字的發明意義深遠，它使得人類的經驗、知識與文化能夠被客觀記錄和跨代累積。此后，人類的演進不再僅僅依賴以百萬年計的緩慢基因進化，而是轉向語言、知識和文化的進化，這一過程可以用“代”（generation）來計算，一代約為30年。自從10萬代（約300萬年）前人類發明口語以來，人類社會呈現加速發展態勢，至信息化和人工智能時代，發展速度堪稱日新月異（見表2）。

表2 人類能力獲得重大發展的歷史

來源：米黑爾·羅科、威廉·班布里奇編：《聚合四大科技提高人類能力》，蔡曙山等譯，北京：清華大學出版社，2010年，第32頁

計算機語言系統和邏輯系統。語言對人類的生存與發展至關重要，即便在數字化與人工智能時代亦復如此。在數字化、信息化的人工智能時代，我們需要面對兩種核心語言：自然語言與人工語言。人工語言是為實現某種目標人為創造的語言，它又分為兩支：一支是非形式的人工語言，如世界語；另一支是形式的人工語言，如一階語言和高階語言。

一階語言和一階邏輯系統的強大之處在于它可以解釋全部的算術，而算術系統是全部數學的基礎。因此，一階語言和一階邏輯經過適當擴充，便可以解釋全部數學。作為形式化的人工語言的主要代表，一階語言為人工語言的精確性、可推導性奠定基礎，而計算機語言正是在此方向上發展出的二進制形式語言，是人工智能系統的底層語言支撐。

計算機語言是一個二進制的語言系統，這一系統只有兩個初始符號——“0”和“1”，我們通常稱之為數字化系統（digital system），它由初始符號和形成規則兩個部分構成。

初始符號

1：二進制數的一個位，稱為“比特”（bit），經解釋它表示命題的“真”，或對應線路的“開”，或對應存儲介質的“充磁”。

0：二進制數的一個位，稱為“比特”（bit），經解釋它表示命題的“假”，或對應線路的“關”，或對應存儲介質的“消磁”。

形成規則

字節（byte）：由8個二進制數組成，是二進制系統中存儲信息的最小單元。

ASCII碼（American Standard Code for Information Interchange）：用于信息交換的美國標準代碼，它將英文字母和所有的數字、標點符號和常用符號進行編碼。

擴展的ASCII碼：用兩個或更多的字節對漢語等非英語進行編碼，可存儲各種漢字字體（如宋體、仿宋、楷體、黑體）的點陣信息；可對聲音、顏色、圖形、圖像進行編碼。

在這個語言系統之上，我們可以建立一個形式系統，用以進行形式符號的數學運算和邏輯推理，由此得到一個計算機系統。計算機系統包括計算機的指令系統，涵蓋數據傳送指令、算術運算指令、邏輯運算指令、程序控制指令、輸入輸出指令等，這些指令則由中央處理器（CPU）負責執行，以完成計算機的各種任務。

人工智能語言系統和邏輯系統。從根本上看，當前階段的人工智能主要表現為計算機實現的智能。因此，探討人工智能的許多核心問題，可轉化為探討計算機系統如何實現智能的問題。為深入分析，我們不妨將計算機系統視為由兩個功能部分構成：處理符號與意義的語言系統，以及執行規則與演算的邏輯計算系統。相應地，對人工智能的考察也應從這兩個維度展開。

一個形式化的語言系統無法和一個自然語言系統完全對應，即兩個語言系統之間無法實現在句法、語義和語用上的完全對應和相互理解（在語義上的完全翻譯和語用上的完全分析），哪怕是兩個自然語言系統之間也難以實現。詩歌翻譯是典型例證，正如美國詩人羅伯特·弗羅斯特（Robert Frost）說過：“詩意就是在翻譯中要失去的東西。”金岳霖先生也曾指出：“詩意差不多是不能翻譯的。”杜甫《登高》中的頷聯“無邊落木蕭蕭下，不盡長江滾滾來”，其意象、聲律與文化意蘊，在任何另一種語言的翻譯中都必然有所損失。這深刻揭示了自然語言間語義與語用轉換的根本困境。

機器翻譯困境的核心在于自然語言理解與純粹符號處理之間的鴻溝。對于計算機所使用的人工（形式）語言系統，即便它能完美地進行句法轉換和符號操作，是否就意味著它像人類一樣理解自然語言的語義？語言和心智哲學家約翰·塞爾（John R. Searle）的中文房間論證模型（Chinese Room Argument, CRA），對這一問題作出回答（見圖3）。塞爾設計該實驗的目的是反駁“強人工智能”（strong AI），即認為只要程序正確，運行該程序的機器便具備與人同等的“心智”和“智能”。實驗中，房間內的操作者并不懂中文，但他憑借一本操作手冊（程序），就能將輸入的中文符號轉換為英文符號，并將其輸出房間，能讓房間外的人以為自己在與一個懂中文的人交流。塞爾指出，這個房間整體（模擬運行程序的計算機）只是模擬了人類的語言行為，但并未做到真正的語言理解。

來源：T. Cowen, "The Chinese Room Thinks," Marginal Revolution, 7 April 2022, https://marginalrevolution.com/marginalrevolution/2022/04/the-chinese-room-thinks.html

圖3 塞爾的中文房間論證模型

從語言認知的層級來看，當前人工智能的語言加工仍停留在語形加工層面，與人類的語言認知存在本質差距——人類兼具更高層級的語義加工（理解符號意義）與語用加工（在說話者、聽話者、時間、地點、語境因素中的理解和運用語言）能力，而這正是機器的語言能力與人類的語言能力的差異，也是人工智能未來的發展方向。認知科學表明，語言是思維與文化的載體：語言塑造文化，文化特質亦依附于特定的語言形式。脫離語言去理解文化，難免遺失其精髓。“我言，故我在”的哲學命題對人工智能同樣構成挑戰。人工智能的未來發展在于真正理解人類語言，進而達到對人類思維和文化的理解。

漢語的語形、語義、語用特質及認知優勢

漢語和其他語言一樣，由語音（口語）和文字（書面語）兩個部分構成。從語言發展的歷程看，任何民族的語言都是先有語音，后有文字，文字本質上是記錄語音的符號。文字的發展路徑大致分為兩種：一種是拼音化，如英、法、德、俄等語言，形成的是拼音文字；另一種是拼形化，形成的是象形文字，漢字是目前世界上唯一存在并仍在使用的表意文字體系。中國最早的成熟文字系統可追溯至商朝中晚期（距今約3600年）的甲骨文，歷經數千年發展，漢字系統逐漸形成象形、指事、會意、形聲、轉注和假借這六種造字法，即所謂“漢字六書”。漢代許慎編撰的第一部系統分析漢字形音義的字典《說文解字》，共收錄10516個字形，其中包括正篆漢字9353個、異體字（重文）1163個；清代《康熙字典》共收錄漢字47035個。此外，漢字是一種視覺文字，其核心的認知功能來源于“看”，因此漢字的書寫具有重要意義。在漢字發展的歷史上，形成了全人類獨一無二的書法藝術，這既是獨特的文化認知方式，也是重要的文化藝術形式。

在語言認知、思維認知與文化認知層面，漢語和漢字展現出獨特且不可比擬的優勢。該優勢可以從漢語的語形加工、語義加工和語用加工三個層次進行分析。語形上，漢字以拼形靈活、造詞能力極強為特征；語義上，其音形義統一的視覺屬性，有助于提升信息加工效率；語用上，格律詩詞、對聯等形式蘊含深厚文化語境與隱喻智慧，形成不可替代的認知表達體系。

20世紀50年代以來，語言學家和認知科學家致力于探究人類大腦中語言加工的機制與過程，并明確區分語形加工、語義加工和語用加工三種不同的方式和過程。語形加工主要針對語言符號自身進行操作，語義加工涉及對語言符號及其指稱的對象進行操作，語用加工則要對語言符號及其使用者（說者和聽者），以及語言使用的時間、地點和語境等多方面因素進行操作。對這三類加工過程的研究，分別對應并形成了語形學（syntax）、語義學（semantics）和語用學（pragmatics）三大領域，構成當代語言學的“三分框架”。

漢語的語形加工。漢語的語形加工是指大腦對漢語的符號進行空間排列的加工方式，主要分為詞法加工和句法加工兩種類型。詞法加工是指用五種基本筆畫（橫、豎、撇、點、折）組合成偏旁和部首，再由偏旁和部首排成漢字的加工過程。這種構型特征表明漢字是一種拼形文字，而非拼音文字。這種拼形法則具備極高靈活性，同一漢字可呈現不同結構形態。比如，“群”有左右結構“群”與上下結構“羣”之分，“秋”可演變為“禾火”左右結構的“秋”、“禾龜”組合的“龝”，以及“火禾”互換的“秌”。中國人特別喜歡并且最能表達中華文化心理的“福”“壽”二字，在漢字書法中均有一百多種不同的寫法，形成“百福”和“百壽”書法作品（漢字書法忌諱雷同，同一作品中若有兩個相同的漢字，一定會采用不同的寫法），以滿足中國人的文化心理需求。這種靈活性在漢字書法中得以充分體現，使漢字書法成為兼具規范性與個性化的藝術形式，而對個體差異性的追求，正是語言認知與認知科學的特質之一。

超強造詞能力是漢語詞法的另一核心優勢。6000個基本漢字本身即可獨立語詞（單字詞），通過排列和組合生成海量復合詞：二字詞數量介于組合數C(6000,2)=1799.7萬個與排列數A(6000,2)=3599.4萬個之間；三字詞數量在C(6000,3)=359.82002億個和A(6000,3)=2158.92012億個之間；四字詞（含多數漢語成語）的數量可達C(6000,4)=53.9460164985萬億個。僅從詞法上看，漢語可能是世界上所有語言中生成能力最強的語言。掌握6000個基本漢字即可滿足全部閱讀和書寫需求，而英語母語者需掌握2萬個單詞才能達成同等水平，即便掌握1萬個英文單詞也難以滿足日常需求。

漢語的語義加工。漢語的語義加工，即建立語言表達式與其指稱對象之間的映射關系，從而理解表達式意義的過程。在漢語中，語詞的指稱對象是論域中的個體，而語句的指稱對象是論域中的事件。漢字兼具音、形、義統一的視覺屬性，這一特性賦予其諸多獨特優勢。比如，對漢字的加工可以從字形直接獲得其意義，而無需經過聲音的轉換，從而使得漢語加工速度快于任何拼音文字。以閱讀《紅樓夢》為例，中國讀者只需快速瀏覽頁面，便能大致獲取篇章信息。而拼音文字（如英文）的閱讀過程則需先將視覺文字轉換為聲音信息，才能進一步獲取其意義。如果我們閱讀英文版或漢語拼音版《紅樓夢》，將無法直接獲取其意義。

漢語格律詩詞在語義加工方面也有其自身特色。語義問題的核心在于，判斷一個命題的真假與推理的有效性，而漢語詩詞常以悖論、隱喻等形式承載深層智慧。比如，《紅樓夢》第一回“太虛幻境”大門石牌坊上的對聯：“假作真時真亦假，無為有處有還無。”便蘊含一個邏輯悖論：從其假可以推知其真；從其真又可以推知其假；從其無可以看到其有，從其有可以看到其無。然而，這種悖論并非自相矛盾，而是需要讀者以“悟”領會的語言智慧。這與宋明理學、陽明心學強調的“悟”的認知理念高度契合。唐代劉禹錫《竹枝詞二首·其一》中“東邊日出西邊雨，道是無晴卻有晴”，以“晴”隱喻“情”，未提“情”字卻精準傳遞情感。這種語義表達高度依賴漢語語境與漢字特質，脫離其語言環境便難以精準解讀。這類作品的認知，往往需要融合語形、語義和語用三個層次，其中隱喻是語言認知的重要方法，屬于語用加工和語用學范疇，凸顯了漢語語義加工的獨特性。

漢語的語用加工。漢語的語用加工，是指通過將漢語與其使用者（說者、聽者）、使用場景（時間、地點、語境）關聯起來，從而獲得完整意義的一種加工方式。說者、聽者、時間、地點、語境合稱為五大語用要素。語用加工涵蓋語義加工和語形加工，任何語言表達式只有在語用加工或語用學的層面上，才能實現意義的完整呈現。而漢語作為典型的語用語言，從漢字、語詞、語句到語篇各個層面，均具備極為豐富且深刻的內涵，能夠傳遞其他語言難以表達的思想內容與認知效果。對聯“風聲雨聲讀書聲聲聲入耳，家事國事天下事事事關心”，是漢語語用加工的典范。上聯中的風雨聲和讀書聲不僅指自然界的風雨和書院中的讀書聲，更隱喻政治上的風雨和儒家經典所蘊含的士大夫情懷，下聯則源自“修身齊家治國平天下”的思想抱負，成為傳統知識分子家國情懷的典范表達。句法上，對聯嚴格遵循平仄對仗，兼具音律美感；語義上，雖未明確提及認知主體，卻能讓讀者深切感知到以天下為己任的讀書人形象；語用層次上，結合說話人顧憲成的東林黨領袖身份、聽話人天下儒生的定位，以及明萬歷年間的歷史背景、東林書院的場所屬性，方能領會其完整深意。對聯所運用的隱喻手法，既是語用加工的常用手法，也是認知科學的重要方法。而這種蘊含文化語境的表達體現了漢語的不可譯性，進一步證明漢語的獨特性和不可替代性。

深度求索（DeepSeek）等人工智能大模型之所以廣受關注，與漢語的特質存在深度關聯。其一，高效的語言處理能力，基于深度學習的語言處理系統，能夠高效理解和生成漢語，適應漢語的獨特性和復雜性；其二，精準的中文語境把握，通過持續收集新的文本數據，保持對中文語言最新發展的敏感度，不斷提升對中文語境的理解能力；其三，深層文化和語境挖掘，可理解文言文和現代漢語的多重含義；其四，有助于漢語全球化，借助人工智能技術為全球用戶提供漢語學習支持，進一步提升漢語在國際事務中的影響力。可以說，漢語的認知特質成就了人工智能大模型的中文優勢，其也為漢語在人工智能時代的傳播與應用開辟新路徑。

漢語認知的獨特價值。在2025年世界人工智能大會上，被譽為“人工智能之父”的杰弗里·辛頓（Geoffrey Hinton）在題為《數字智能是否會取代生物智能》報告中，對人工智能的智能水平給予高度評價。然而，其觀點存在部分爭議。首先，辛頓認為“人類理解語言的方式實際上很像大模型，因此人類實際上很像大語言模型，也會產生幻覺，經常編造東西”。事實上，人類認知并非基于大數據的語言模型，而是在基于小數據的語言模型上，實現直覺、頓悟、聯想和創新。如果我們讓人工智能大模型列出“中國最著名的10首古代詩歌”，王維的《山居秋暝》一定在列。但它卻無法創作一首同樣優美的“詩中有畫，畫中有詩”的五絕。這正是認知科學的本質：解釋人類認知的個體差異性，而語言認知的獨特性正是個體認知差異的根源。正如“我言，故我在”所揭示的，語言是人類認知世界的邊界。其次，關于辛頓提出的“人類實際上已經無法控制人工智能”的觀點，筆者認為，長期來看，人工智能在綜合的認知能力方面難以超越人類，必須通過倫理與法律框架防范人工智能帶來的風險，而非單純依賴技術約束。另外，對于辛頓“訓練人工智能向善”的主張，根本局限在于純粹的“訓練”難以賦予人工智能穩定的道德判斷框架。人工智能的道德問題必須超越技術訓練，從更深層的倫理與法律框架中尋求規范與約束。

從人類發明語言以來，語言和文字就決定著人類認知世界的方式和界限。維特根斯坦“我的語言的界限意味著我的世界的界限”的論斷，深刻揭示語言對人類認知的決定性作用。經喬姆斯基、奧斯汀和塞爾等學者的共同努力，語言回到心智與認知研究的核心，并奠定以語言為基礎的認知科學的統一框架。漢語是中華民族的共同語言，它不僅是中華文明的重要基石，更是信息化和人工智能時代中國人特有的認知能力和共同的認知工具。在人工智能和認知科學時代，漢語和漢字憑借其蘊含的豐富語言信息和文化內涵，將在未來的人工智能競爭中發揮自身的重要作用。

*文章轉載自《學術前沿》雜志2026年第4期。本文章僅限學習交流使用，版權歸原作者或機構所有，如有侵權，請聯系我們刪除。

——??——

Serving national strategies, focusing on university research and the transformation of scientific and technological achievements

特別聲明：以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布，本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.