徐揚生：人工智能是一個真實的泡沫，發展前景非常之大

新聞中心

首頁 > 新聞中心 > 院校動態

2025-12-22 17:34

香港中文大學深圳

作者：

http://www.michael-hudson.org/news/

關注教育在線

人工智能：突破口在哪里？——

徐揚生校長在深圳創投25周年大會上的主旨演講

　　各位朋友早上好，今天非常高興受邀到這里做演講，首先祝賀深圳創投25周年，深圳創投對深圳的發展與創新立下了汗馬功勞，了不起！我們大家都感謝深圳創投做出的巨大貢獻。

　　我從事人工智能機器人方面的研究大概40年，今天想跟大家分享一下這方面的思考，求教于諸位。人工智能發展到今天，無論是大語言模型、機器視覺，自動駕駛汽車，似乎基本上都到了一個頂端，那么，下一個突破口到底在哪里？

　　最近這段時間，不少投資界的朋友，無論是國內的還是國外的，包括來自硅谷的，都到我家里來問我同一個問題：人工智能有沒有泡沫？我給出的回答是：有，而且是巨大的。因為從價值(valuation)來看，如今幾乎所有與人工智能相關的投資都是出于狂熱。但是也不要太悲觀，我給人工智能的泡沫下了一個定義——這是一個“真實的泡沫”。所謂“真實”，體現在幾個關鍵點：

　　第一，人工智能的突破是根本性的。從美國的曼哈頓計劃開始，到今天，可能還沒有任何一項科學技術能像人工智能這樣，取得如此巨大的突破，具有這么重大的影響力，這可能是人類歷史上的第一次，注意，我說的是根本性突破！

　　第二，智能從現在開始成為了商品，生產力的潛力是巨大的，會滲透到各行各業，影響到千家萬戶，所有的行業都會發生變革，有著巨大的生產力提升空間。

　　第三，人工智能已經形成了產業。這一點其實非常了不起，回顧互聯網早期的發展，產業化的過程并不順利。而今天，人工智能已經形成了一個相當規模的產業體系。注意，形成產業后，事情是很難改變的，我是一輩子跟著產業走的，我喜歡給工業界做顧問，給很多著名企業都做過顧問。我的一個體會是：產業上來了以后，它會反過來引導你，甚至是不罷休的。舉個例子，今天所有的工業都用到的齒輪，有一天如果我說不用齒輪了，這件事情是做不到的，為什么？因為齒輪已經形成了一個產業了，它有做齒輪的機器和產業在那里，這是一定會做下去的，不會罷休的。我們都知道漸開線齒輪不是最好的，我從學生時代就知道，到現在還改不了，因為產業已經形成了。人們都關注科技對產業的影響，我想提醒大家產業對科技的影響也是巨大的。

　　第四，國家的戰略支撐，這是非常重要的。可以負責任地說：未來人工智能的競爭，就是中美兩國之間的較量。去年這個時候，我還不能這么肯定地說這句話，現在可以說了，明年會更明顯。這意味著什么？兩個國家的情況跟幾個國家的情況是不一樣的，幾個國家是講競爭(competition)，而兩個國家是講對峙(rival)，一旦形成這種關系，就不會輕易停下來。

　　基于以上幾點，我的分析是：人工智能是一個真實的泡沫，發展前景非常之大。

　　那么我們先回顧一下現實世界中的人工智能到底發展到了哪一步，我們現在在哪里？目前的人工智能大概在五個領域：一是語言模型，包括語音、文本，所有與語言有關的東西；二是Transformer架構，就是注意力的分布(attention-based)，它加強了語言的功能，當然也有很多功能。

　　三是擴散模型；四是圖像生成，圖像這件事情已經做了很多年，但圖像的生成這兩年做得特別好；五是代碼，代碼是這幾年開始的，我個人的判斷是，到今年年底，自動生成上百行代碼會非常普遍，代碼生成會像語文課寫作文造句一樣，系統會自己衍生出來。至于其他方面的東西，有沒有太大的本質性進步呢？我認為沒有。

　　如果把這些現狀放在一起看，人工智能今后應該往哪里走？首先，我們要從“語言”過渡到“非語言”，一定要從“語言”這個框里走出去。除人類以外，世界上有“智能”的東西，你去看看，比如說鳥、兔子、蛇，它們有語言嗎？沒有。

　　其次，要從“計算”到“非計算”，“非計算”指的不是“沒有數字”，指的是除了“數據(data)”以外的東西，以及數據本身代表的“智能”程度。現在都是圍繞著數據轉。正是在這個從“語言”走向“非語言”、從“計算”走向“非計算”的過程中，產生了“具身智能”。

　　什么叫具身智能？就是基于物理的、身體的，通過感知及與周邊的交互來進行學習和進化。比方說，你看到了我手在動，我的手是有感知的，是在與周邊交互的，如果你們不在的話，我會這么動嗎？這個過程就是具身智能。

　　具身智能的重點，首先是要有感知，沒有感知是不行的，人都是有感知的，像眼、耳、鼻、舌、身等等。語言只是感知的一個特殊的方面。其次是要有交互，比如說我看到你們在聽我的講演，通過聽、看、交流，形成一種互動。最后是要有學習，這是人工智能當中最根本的、不能忘記的三點。

　　講到具身智能，現在很多人都認為是在講人型機器人，我想與大家講，這可能是誤區。人型機器人是從90年代開始的，當時日本的科學家搞得很歡，但其他國家的大部分科學家并不太認同，為什么？因為人類創造機器人的目的，本來就不是要造一個“完全代替人類”的存在。所謂“機器人”，只是“像機器一樣的人”或者“像人一樣的機器”，你可以說它不是人，但它又多少帶著一點人的特征。所以，人類造的機器人并不一定非得像個“人”，而只是具有人類(或非人類)的某些能力或特征的機器而已。

　　現在大家一窩蜂在做人型機器人，這其實不是唯一的路，我在硅谷還見過一家做“炒菜機器人”的創業公司：就是用一個機械臂拿著鏟子在鍋里翻炒。我當時看了只覺得很好笑——如果你只是想讓機器炒菜，為什么非得給它一只“手”，再讓它去拿一把“鏟子”？我們完全可以直接讓機器從底下把菜翻起來就好。人是因為做不到這樣翻菜，才發明了鏟子。所以，用機械臂握著鏟子炒菜，其實挺傻的。真正要做具身智能，要把人工智能帶入千家萬戶，需要另辟蹊徑，不能只盯著人形機器人這一條路。人形機器人做出來，大家看了會很開心，去上春晚，相關部門也會很開心。這是可以的，但用不著所有人都去做人形機器人。

　　做人工智能的目的到底是什么？40年前我們做人工智能、做機器人，我們的初心是這樣：首先，是為了讓人遠離危險。比如，當年我所在的地方有一家全球最大的核電站公司，核電站有故障，人是進不去的，因為太危險了，那能不能讓機器人進去修理呢？因此，第一是避免危險；第二是去完成那些超越人類極限的事情。我們去到外太空，外太空環境可能是零下 250度，人類無法在那里生存，那機器人能不能去？這些都是“極限場景”的問題。另外，是為了擺脫重復勞動。我們為什么要造機器人、為什么要發展人工智能？就是為了讓人從危險、極限、重復的工作中被解放出來，而不只是簡單地“造一個人來代替人”。

　　那么，人類是不是這個世界上做各種工作或活動都最厲害的動物呢？其實并不是。比如，在平坦的路上，我們人類走一走還可以，但速度并不快，車就比我們快得多。我們也不會飛，人類想要飛行已經折騰了兩千多年，但始終沒能讓自己飛起來。現在的飛機其實也不是“會飛的鳥”，比鳥差遠了。鳥有兩只會拍動的翅膀，飛機的機翼卻動不了，只是做成一個類似鳥的形狀，中間挖個洞，把人裝進去而已。所以，在很多方面，人類其實并不如其他動物。

　　每天早上我都會在院子里散步，我很喜歡看鳥，觀察它們是怎么飛的，而鳥的飛行方式和昆蟲的飛行又完全不同；在海灘，我研究過螃蟹、龍蝦，兩者也有不同，它們適應不同的海灘環境，在沙灘上，人爬得再快也比不過螃蟹；森林里面你看松鼠，爬樹爬得很好，我們做了很多“爬樹機器人”，但是比松鼠還是差一點。我們能不能把自然界的其他動物的“智能”學出來？

　　現在稍微講一下動態與靜態，我個人其實更喜歡研究動態系統，不過今天時間有限，就不詳細展開了。人類對“動態”這件事其實相對比較陌生，這也是具身智能的空白處，但動態本身有著非常有趣的智能。最簡單的例子就是自行車。假設你從來沒見過自行車，也不知道它是用來騎的，突然有人遞給你一輛車，告訴你這個東西可以騎，你第一反應肯定是不相信：騎上去不是要摔倒嗎？但事實恰好相反——騎得越快，越不容易倒。這就是典型的“動態系統的平衡”。朋友們，靜態系統的智能和動態系統的智能，是完全不一樣的。在我們實驗室里，就有一些依靠動態平衡工作的機器人。

　　前面我們講了那么多具身智能、動物的智能，還有動態與靜態的智能，現在回到一個更根本的問題：人類最高層次的智能到底是什么？這個問題其實牽涉到教育的范式，也就是——我們究竟該如何教我們的孩子？在座的各位很多都有孩子，孩子在學校上學，如果老師跟你說：“你家孩子很聰明。” 那這個“聰明”到底指的是什么？按照我自己的研究結論，大概是：75%是記憶，20%是理性，5%是表達。我曾經分析過前五年的高考試卷，大致就是這么一個結構。里面幾乎沒有“感性”、“想象”、“直覺”，以及“創造”的內容。但恰恰在今天這個分享里，我要非常認真地說：人的最高智能，是直覺。我還是要強調：如果人工智能不往“直覺”這個層次走下去，我看這出戲即使唱得下去，也是不精彩的。為什么這么說？接下來我舉兩個簡單的例子：

　　比如說打籃球。你去打球的時候，隊友把球傳過來，有些真正的高手，接球的一瞬間“啪”一下就出手投籃了。這個出手的決定是怎么做出來的？他會先算一算：前面防守的人有多高、阻力隊員多少、投進的概率是多少，然后再決定要不要投嗎？不會。這個過程不是理性的計算，也不是靠記憶，而是純粹憑直覺完成的。所有高階的東西，背后幾乎都是直覺在起作用。

　　再舉個例子。前兩天有一位已經畢業的同學來我辦公室跟我說她快結婚了。我說：那恭喜你啊。她說：恭喜什么，家里吵得很厲害。

　　我問為什么？她說她的媽媽不喜歡她的男朋友，她把男朋友帶回家后，媽媽后來問她：“你說說看，這個男朋友到底好在哪里？”她自己也講不清楚，只好說：“他個子很高啊。”

　　媽媽就說：“我上次給你介紹的那個男孩，個子也很高啊。”后來兩個人來來回回說了很多，反正她媽媽就是不滿意。

　　她最后問我：“校長，我媽媽說得對不對？”

　　我對她說：“你媽媽說的是對的。”

　　她臉一下就拉下來了，不說話了。我接著說：“但是，你選的男朋友也是對的。”

　　她馬上就不理解了：“這不可能啊。如果我媽媽是對的，那我選的男朋友就是錯的；如果我選的是對的，那我媽媽肯定就是錯的。”

　　我說：“不是這樣的。你媽媽說得 ‘對’，是指她是用理性、用邏輯在評判。而你在選男朋友的時候，是用直覺。你的直覺里當然也包含理性的成分，但不只限于理性，還有很多說不清道不明的東西。”

　　所以，朋友們，我們每個人在生活當中都會遇到以上這種類似情況：直覺在起決定性作用。這也是我為什么說，直覺其實是人類最高級別的智能。

　　“直覺” 這個說法未必是最準確的，英文里叫 intuition，或者 heuristics，里面其實包含了很強的 “經驗” 成分。也正因為如此，我在學校里一直強調 “實踐” 有多重要。在我看來，學習大致有四個階段：學、思、踐、悟。第一是 “學” ，中國學生這一點做得很好，都很勤奮；第二是 “思” ，也有不少同學在思考方面做得不錯。第三是 “踐” ，也就是親身去做、去實踐，這一環節在今天的教育里基本是缺失的。第四是 “悟” ，就更少見了——沒有實踐，光靠讀書不可能產生真正的領悟。所以， “學–思–踐–悟” 是一個完整的過程。在我們學校里，我一直強調：要有經驗，要有感覺，要有理智，要有情感，這些東西要放在一起，才構成一種高維的智能。

　　那我們現在常說的“數據”是什么？本質上，數據是降維之后記錄下來的結果。維度被壓縮了，所以一定是不完整的。用這些數據去做一些相對簡單的事情，在一定程度上是有效的，但問題也會隨之而來：算力需求越來越高，能源需求越來越高。現在很多地方政府在討論、爭搶的焦點，就是“算力”。算力從哪里來、有什么用？

　　以圍棋為例：假設你明天要和一位高手對弈，今晚要復盤一下，人復盤兩三盤棋就已經很了不起了，AI一上來可以幫你復盤十盤。你會覺得：十盤當然比三盤好。如果是一百盤呢？那似乎更好；一千盤呢？好像更好了。照這個思路推下去，一萬盤、十萬盤是不是就更好？但如果你真正下過棋，你會在某個點上打斷這個邏輯——因為人知道什么時候該停，什么時間已經是夠了，機器卻不知道在哪里停，這就是當下人工智能的一個根本問題，就是數據到底是否反映了真正的智能。

　　而對“降維后的數字”，我們必須保持警惕：哪怕有最多的數據、最強的算力，它們這些數字所代表的“智能”，是否是全域性的、是可靠的，這是一個大問號。換句話說，如果你向一群非常“笨”的人學習——不管你學得多快、多好，這有意義嗎？我說得再不客氣一點，假如這群人本身就不可信，甚至全是在說謊，那你越認真向他們學習，結果會怎樣？同樣的道理：在這樣的前提下，你數據越多、算力越強、學習越快，越可能是毫無意義的。

　　回顧歷史，世界上發生過的最重要的事件，起決定性作用的是什么？我個人比較喜歡看一些傳記、歷史書籍，從一個又一個案例里，你會發現：很多關鍵時刻，尤其是在戰爭這類重大事件中，真正決定走向的，是領導的判斷力。那這種判斷力從哪里來？更多時候是來自直覺，而不是純粹的理性。回到現代教育和社會，對“理性”的強調已經到了有點“非理性”的程度了。所以有時候，孩子如果考試沒考好，不要罵他，他無非是在某些“理性”指標上表現一般而已，但在別的方面，可能非常出色。理性當然重要，但遠遠沒有我們今天想象得那么重要。

　　所以，回到人工智能本身：直覺是具身智能的下一個突破口。只有通過具身智能才可以達到直覺，只靠語言很難真正做到。想想我們人與人之間是怎么交流的。你們在座很多是領導，可以今天就做一個小實驗：比如，你要跟一位員工談話，告訴他今年經濟不太好，年終獎可能要低一點，大概會是多少。你認真跟他聊個十五分鐘，然后觀察一下對方的反應。我的問題是：對方的反應有多少是基于你說的“內容”。統計的結果大約為30%，而剩下70%，跟“內容”無關。你甚至可以再進一步驗證：用同樣的措辭、同樣的數字，讓另一個人去跟同一個員工講一遍，你會發現效果完全不一樣。那么，這70%是什么？就是我今天反復強調的那部分：直覺。你的態度、手勢、語氣、眼神、笑容，以及你們之間既有的關系基礎，都影響了溝通的結果——它們都在我們今天所說的直覺里。

　　前面講了很多關于“直覺”和“具身智能”的討論，我今天想要真正分享的一個核心理念是：真正顛覆性的創新，永遠無法用過去的數據推算出來，創新是來自于高維的直覺，這也是具身智能的挑戰所在。

　　總結一下，人工智能的突破口在具身智能，具身智能的突破口在基于直覺的智能框架，如果這兩件事情做好了，人工智能就能所向無敵。講到這里，我想引用日本作家村上春樹的一段話，我特地把它放在了這一頁的 PPT 上：每個人都有屬于自己的一片森林，也許我們從來不曾去過，但它一直在那里，總會在那里。我們都在人生的密林里獨行，在交錯的小徑上尋找屬于自己的方向，那里有陽光——斑駁的溫暖，也有月光——清冷的寂靜。

　　我為什么要寫這段話？其實沒有什么目的，我只是想告訴大家：這個PPT不是人工智能做的，人工智能做PPT的話是絕對不會有這一頁出現的。把這段話寫在PPT里其實也是我的一種直覺。

　　要強調直覺，強調人，強調心，要把人還給時代，把心還給人。我們這個時代，把注意力都放在機器上了：機器視覺、機器智能、機器人、機器翻譯……所以機器越來越像人，人越來越像機器。同時，要把心還給人，我們的心已經被手機拿走了，我們的靈魂已經在手機那里了。而人工智能的未來，應該在強調人性的基礎上來進行研究，這樣，才不至于迷路。

　　謝謝各位！

香港中文大學(深圳)校長徐揚生：要成就“帶著靈魂的優秀”

徐揚生：為粵港澳大灣區高質量發展提供人才支撐

徐揚生寄語2021屆本科畢業生：要直面人生旅程的不確定，用勇氣和智慧走出精彩

香港中文大學（深圳）校長徐揚生：面對疫情大考! 仁者不憂，勇者不懼

徐揚生：知識分子的家國情懷

港中大(深圳)校長徐揚生寄語畢業生：握時代的機遇，實現自己的價值與夢想

香港中文大學（深圳）校長徐揚生當選為美國國家工程院院士

香港中文大學（深圳）徐揚生校長：致高三考生的一封信

免責聲明：

① 凡本站注明“稿件來源：教育在線”的所有文字、圖片和音視頻稿件，版權均屬本網所有，任何媒體、網站或個人未經本網協議授權不得轉載、鏈接、轉貼或以其他方式復制發表。已經本站協議授權的媒體、網站，在下載使用時必須注明“稿件來源：教育在線”，違者本站將依法追究責任。

② 本站注明稿件來源為其他媒體的文/圖等稿件均為轉載稿，本站轉載出于非商業性的教育和科研之目的，并不意味著贊同其觀點或證實其內容的真實性。如轉載稿涉及版權等問題，請作者在兩周內速來電或來函聯系。