這是 Lex Fridman Podcast #472 與陶哲軒訪談的逐字稿。逐字稿中的時間戳記是可點擊的連結,可將您直接帶到主要影片中的該點。請注意,此逐字稿是由人工生成的,可能存在錯誤。以下是一些有用的連結:
回到本集的主要頁面
觀看完整 YouTube 版本的 Podcast
目錄
以下是談話的鬆散「章節」。點擊連結可大約跳到文字稿的該部分:
- 0:00 – 介紹
0:49 – 第一個難題
6:16 – 納維-斯托克斯方程式奇異性
26:26 – 生命遊戲- 33:01 – 無限
38:07 – 數學與物理的對決
44:26 – 真實的本質
1:07:09 – 萬有理論
1:13:10 – 廣義相對論
1:16:37 – 解決困難問題
1:20:01 – AI 輔助定理證明
1:32:51 – Lean 程式語言
1:42:51 – DeepMind 的 AlphaProof
1:47:45 – 人類數學家與 AI
1:57:37 – AI 贏得費爾茲獎
2:04:47 – 格里戈里·佩雷爾曼
2:17:30 – 孿生素數猜想
2:34:04 – 考拉茲猜想- 2:40:50 – P = NP
2:43:43 – 菲爾茲獎
2:51:18 – 安德魯·懷爾斯與費馬最後定理- 2:55:16 – 生產力
2:57:55 – 給年輕人的建議
3:06:17 – 史上最偉大的數學家
簡介
Lex Fridman
(00:00:00) 以下是對談陶哲軒 (Terence Tao) 的訪談。他被廣泛認為是史上最偉大的數學家之一,常被譽為「數學界的莫札特」。他曾榮獲菲爾茲獎 (Fields Medal) 和數學突破獎 (Breakthrough Prize in Mathematics),並對數學和物理學中一系列驚人的領域做出了開創性的貢獻。對我來說,這是一項莫大的榮幸,原因有很多,包括泰瑞 (Terry) 在我們所有的互動中,對我展現的謙遜和友善。這對我來說意義重大。這裡是 Lex Fridman Podcast。如要支持本節目,請查看說明中的贊助商,或造訪 LexFridman.com/sponsors。現在,親愛的朋友們,有請陶哲軒。
(00:00:00) 以下是對談陶哲軒 (Terence Tao) 的訪談。他被廣泛認為是史上最偉大的數學家之一,常被譽為「數學界的莫札特」。他曾榮獲菲爾茲獎 (Fields Medal) 和數學突破獎 (Breakthrough Prize in Mathematics),並對數學和物理學中一系列驚人的領域做出了開創性的貢獻。對我來說,這是一項莫大的榮幸,原因有很多,包括泰瑞 (Terry) 在我們所有的互動中,對我展現的謙遜和友善。這對我來說意義重大。這裡是 Lex Fridman Podcast。如要支持本節目,請查看說明中的贊助商,或造訪 LexFridman.com/sponsors。現在,親愛的朋友們,有請陶哲軒。
第一個難題
Lex Fridman
(00:00:49) 你遇到的第一個真正困難的研究級數學問題是什麼?一個讓你停下來思考的問題?
(00:00:49) 你遇到的第一個真正困難的研究級數學問題是什麼?一個讓你停下來思考的問題?
陶哲軒
(00:00:57) 嗯,在你的大學教育中,你會學到一些真正困難的、不可能解決的問題,比如黎曼猜想、孿生質數猜想。你可以隨意地把問題變得非常困難。但那並不是真正的問題。事實上,甚至有些問題我們知道是無法解決的。真正有趣的是那些介於我們能輕易解決和完全無望之間的問題,而是那些現有技術可以完成 90%的工作,而你只需要剩下的 10%的問題。我認為作為一名博士生,卡克亞問題(Kakeya Problem)肯定引起了我的注意。實際上它最近才被解決。這是我早期研究中花了很多時間研究的一個問題。從歷史上來說,它源於日本數學家掛谷宗一(Soichi Kakeya)在 1918 年左右提出的一個小謎題。所以,這個謎題是說,你在平面上有一根針,或者想像一下在路上開車,你想執行一個 U 型轉彎,你想把針轉過來,但你想盡可能地用最小的空間來完成這個動作。所以,你想用這個小區域來轉動它,但這根針是無限可操作的。所以,你可以想像只是旋轉它。作為單位針,你可以繞著它的中心旋轉,我想這會給你一個面積為,我想是四分之π的圓盤。或者你可以做一個三點 U 型轉彎,這也是我們在駕訓班教人們做的。而這實際上佔用了八分之π的面積,所以它比旋轉更有效率一點。所以有一段時間人們認為這是轉彎最有效率的方法,但別西科維奇(Besicovitch)證明了,事實上,你可以用任何你想要的那麼小的面積來轉動這根針。所以,0.01,有一些非常花哨的多重來回 U 型轉彎,你可以用它來轉動一根針,這樣做的時候,它會經過每一個中間方向。是
(00:00:57) 嗯,在你的大學教育中,你會學到一些真正困難的、不可能解決的問題,比如黎曼猜想、孿生質數猜想。你可以隨意地把問題變得非常困難。但那並不是真正的問題。事實上,甚至有些問題我們知道是無法解決的。真正有趣的是那些介於我們能輕易解決和完全無望之間的問題,而是那些現有技術可以完成 90%的工作,而你只需要剩下的 10%的問題。我認為作為一名博士生,卡克亞問題(Kakeya Problem)肯定引起了我的注意。實際上它最近才被解決。這是我早期研究中花了很多時間研究的一個問題。從歷史上來說,它源於日本數學家掛谷宗一(Soichi Kakeya)在 1918 年左右提出的一個小謎題。所以,這個謎題是說,你在平面上有一根針,或者想像一下在路上開車,你想執行一個 U 型轉彎,你想把針轉過來,但你想盡可能地用最小的空間來完成這個動作。所以,你想用這個小區域來轉動它,但這根針是無限可操作的。所以,你可以想像只是旋轉它。作為單位針,你可以繞著它的中心旋轉,我想這會給你一個面積為,我想是四分之π的圓盤。或者你可以做一個三點 U 型轉彎,這也是我們在駕訓班教人們做的。而這實際上佔用了八分之π的面積,所以它比旋轉更有效率一點。所以有一段時間人們認為這是轉彎最有效率的方法,但別西科維奇(Besicovitch)證明了,事實上,你可以用任何你想要的那麼小的面積來轉動這根針。所以,0.01,有一些非常花哨的多重來回 U 型轉彎,你可以用它來轉動一根針,這樣做的時候,它會經過每一個中間方向。是
Lex Fridman
(00:02:51) 這是指在二維平面上嗎?
(00:02:51) 這是指在二維平面上嗎?
陶哲軒
(00:02:52) 這是在二維平面上。所以,我們了解二維空間的一切。那麼,下一個問題是:三維空間會發生什麼事?假設哈伯太空望遠鏡是太空中的一個管子,而你想要觀察宇宙中的每一顆恆星,所以你想要旋轉望遠鏡以觸及每一個方向。這裡有個不切實際的部分,假設空間非常珍貴(實際上完全不是),你想要盡可能佔用最少的空間,以便旋轉你的針,從而看到天空中的每一顆恆星。你需要多小的空間才能做到這一點?你可以修改貝西科維奇的構造。如果你的望遠鏡沒有厚度,那麼你可以使用任意小的空間。這是二維構造的一個簡單修改。但問題是,如果你的望遠鏡不是零厚度,而是非常非常薄,只有某個厚度 delta,那麼能夠看到每個方向所需的最小體積作為 delta 的函數是什麼?
(00:02:52) 這是在二維平面上。所以,我們了解二維空間的一切。那麼,下一個問題是:三維空間會發生什麼事?假設哈伯太空望遠鏡是太空中的一個管子,而你想要觀察宇宙中的每一顆恆星,所以你想要旋轉望遠鏡以觸及每一個方向。這裡有個不切實際的部分,假設空間非常珍貴(實際上完全不是),你想要盡可能佔用最少的空間,以便旋轉你的針,從而看到天空中的每一顆恆星。你需要多小的空間才能做到這一點?你可以修改貝西科維奇的構造。如果你的望遠鏡沒有厚度,那麼你可以使用任意小的空間。這是二維構造的一個簡單修改。但問題是,如果你的望遠鏡不是零厚度,而是非常非常薄,只有某個厚度 delta,那麼能夠看到每個方向所需的最小體積作為 delta 的函數是什麼?
(00:03:45) 因此,隨著 delta 變小,隨著針變得更細,體積應該會下降。但它下降的速度有多快?猜測是它下降的速度非常非常慢,大致上是呈對數關係,而這是在經過大量工作後才證明的。所以,這看起來像是一個謎題。為什麼它會有趣?事實證明,它與偏微分方程式、數論、幾何學、組合學中的許多問題有著驚人的關聯。例如,在波的傳播中,你潑灑一些水,產生水波,它們會朝各個方向傳播,但波同時具有粒子和波動的特性。所以,你可以有所謂的波包,它是一個非常局部的波,在空間中是局部的,並且在時間中朝著特定方向移動。因此,如果你將它繪製在空間和時間中,它所佔據的區域看起來像一個管子。可能發生的情況是,你可能會有一個最初非常分散的波,但它會在稍後的某個時間點聚焦在一個單點上。你可以想像將一顆鵝卵石丟入池塘,漣漪擴散開來,但如果你將該情景進行時間反轉(波的運動方程式是時間可逆的),你可以想像漣漪會聚到一個單點,然後發生巨大的飛濺,甚至可能是奇異點。所以,這是可能發生的。從幾何學的角度來看,也存在光線,所以如果這個波代表光,例如,你可以將這個波想像成光子的疊加,所有光子都以光速行進。
(00:05:15) 它們都沿著這些光線傳播,並且都聚焦在這一點上。所以,你可以讓一個非常分散的波聚焦到空間和時間中的一個非常集中的波,但接著它又會散開,它會分離。但如果這個猜想有一個負面的解,這意味著有一種非常有效的方式,可以將指向不同方向的管子,堆疊到一個非常非常狹窄的區域,一個非常狹窄的體積中。那麼你也就能夠創造出一些波,它們一開始是一些...會有一些波的排列,它們一開始非常非常分散,但它們會集中,不只集中在單一點,而是會在空間和時間中有很多的集中。而且你可以創造出所謂的爆發,這些波的振幅變得非常大,以至於支配它們的物理定律不再是波動方程式,而是更複雜和非線性的東西。
納維-斯托克斯奇異點
(00:06:08) 所以在數學物理中,我們非常關心某些方程式和波動方程式是否穩定,它們是否會產生這些奇異點。有一個著名的未解問題叫做納維-斯托克斯正則性問題。所以,納維-斯托克斯方程式,是支配像水這樣的不可壓縮流體流動的方程式。這個問題問的是:如果你從一個平滑的水的速度場開始,它是否會集中到某種程度,以至於速度在某個點變成無限大?這就叫做奇異點。我們在現實生活中沒有看到過這種情況。如果你在浴缸裡潑水,它不會在你身上爆炸,也不會有水以光速離開之類的,但理論上這是可能的。
(00:06:49) 事實上,近年來,共識已經轉向一種信念,那就是,對於某些非常特殊的,比如說水的初始配置,奇異點是可以形成的,但人們還沒有能夠真正地建立起這一點。克雷數學研究所有七個千禧年大獎難題,解決其中一個問題,可以獲得 100 萬美元的獎金,而這就是其中之一。在這七個問題中,只有一個被解決了,那就是龐加萊猜想 [聽不清楚 00:07:18]。所以,卡克亞猜想與納維-斯托克斯問題沒有直接的關係,但理解它將有助於我們理解波的集中等方面的問題,這將間接地幫助我們更好地理解納維-斯托克斯問題。
Lex Fridman
(00:07:32) 你能談談納維-斯托克斯方程式嗎?關於解的光滑性存在問題,就像你說的,這是千禧年大獎難題之一,你在這方面取得了很大的進展。2016 年,你發表了一篇論文,題為「平均三維納維-斯托克斯方程式的有限時間爆破」。所以,我們試圖弄清楚這個東西… 通常它不會爆破,但我們能肯定地說它永遠不會爆破嗎?
(00:07:32) 你能談談納維-斯托克斯方程式嗎?關於解的光滑性存在問題,就像你說的,這是千禧年大獎難題之一,你在這方面取得了很大的進展。2016 年,你發表了一篇論文,題為「平均三維納維-斯托克斯方程式的有限時間爆破」。所以,我們試圖弄清楚這個東西… 通常它不會爆破,但我們能肯定地說它永遠不會爆破嗎?
陶哲軒
(00:07:56) 沒錯,是的。這確實是價值一百萬美元的問題。這也是數學家與幾乎所有其他人不同的地方。如果某件事在 99.99%的情況下都成立,對大多數事情來說就足夠了。但數學家是少數真正關心是否所有情況都被 100%涵蓋的人之一。所以,大多數流體,大多數時候水不會爆破,但你能設計一個非常特殊的初始狀態來讓它爆破嗎?
(00:07:56) 沒錯,是的。這確實是價值一百萬美元的問題。這也是數學家與幾乎所有其他人不同的地方。如果某件事在 99.99%的情況下都成立,對大多數事情來說就足夠了。但數學家是少數真正關心是否所有情況都被 100%涵蓋的人之一。所以,大多數流體,大多數時候水不會爆破,但你能設計一個非常特殊的初始狀態來讓它爆破嗎?
Lex Fridman
也許我們應該說,這是一組控制流體力學領域的方程式,試圖了解流體的行為。事實證明,這實際上是一個非常......流體是非常複雜的東西,很難建模。
也許我們應該說,這是一組控制流體力學領域的方程式,試圖了解流體的行為。事實證明,這實際上是一個非常......流體是非常複雜的東西,很難建模。
陶哲軒
是的,所以它具有實際的重要性。所以這個克雷研究所的難題涉及所謂的「不可壓縮 Navier-Stokes 方程式」,它控制著像水這樣的東西。還有一種叫做「可壓縮 Navier-Stokes 方程式」,它控制著像空氣這樣的東西,這對於天氣預報尤其重要。天氣預報需要大量的計算流體力學。其中很大一部分實際上只是盡可能地嘗試求解 Navier-Stokes 方程式。同時也收集大量數據,以便他們可以初始化方程式。有很多活動部件,所以從實用角度來看,它非常重要。
是的,所以它具有實際的重要性。所以這個克雷研究所的難題涉及所謂的「不可壓縮 Navier-Stokes 方程式」,它控制著像水這樣的東西。還有一種叫做「可壓縮 Navier-Stokes 方程式」,它控制著像空氣這樣的東西,這對於天氣預報尤其重要。天氣預報需要大量的計算流體力學。其中很大一部分實際上只是盡可能地嘗試求解 Navier-Stokes 方程式。同時也收集大量數據,以便他們可以初始化方程式。有很多活動部件,所以從實用角度來看,它非常重要。
Lex Fridman
(00:09:09) 為何要證明關於方程式集合的一般性,例如它不會爆炸,這麼困難?
(00:09:09) 為何要證明關於方程式集合的一般性,例如它不會爆炸,這麼困難?
陶哲軒
(00:09:17) 簡單來說,就是馬克士威妖(Maxwell’s Demon)。馬克士威妖是熱力學中的一個概念。如果你有一個裝有兩種氣體的箱子,氧氣和氮氣,也許你一開始把所有的氧氣放在一邊,氮氣放在另一邊,但它們之間沒有屏障。那麼它們就會混合,而且應該保持混合狀態。沒有理由它們會分離。但原則上,由於它們之間的所有碰撞,可能會有一些奇怪的陰謀,也許有一個叫做馬克士威妖的微觀惡魔會……每次氧原子和氮原子碰撞時,它們會以某種方式反彈,使氧氣漂移到一側,然後氮氣漂移到另一側。你可能會出現一種極不可能出現的配置,我們從未見過,而且統計上極不可能,但數學上這種情況是可能發生的,我們無法排除這種可能性。
(00:09:17) 簡單來說,就是馬克士威妖(Maxwell’s Demon)。馬克士威妖是熱力學中的一個概念。如果你有一個裝有兩種氣體的箱子,氧氣和氮氣,也許你一開始把所有的氧氣放在一邊,氮氣放在另一邊,但它們之間沒有屏障。那麼它們就會混合,而且應該保持混合狀態。沒有理由它們會分離。但原則上,由於它們之間的所有碰撞,可能會有一些奇怪的陰謀,也許有一個叫做馬克士威妖的微觀惡魔會……每次氧原子和氮原子碰撞時,它們會以某種方式反彈,使氧氣漂移到一側,然後氮氣漂移到另一側。你可能會出現一種極不可能出現的配置,我們從未見過,而且統計上極不可能,但數學上這種情況是可能發生的,我們無法排除這種可能性。
(00:10:06) 這種情況在數學中經常出現。一個基本的例子是圓周率π的位數,3.14159 等等。這些位數看起來沒有任何模式,我們也相信它們沒有模式。長期來看,你應該看到一樣多的 1 和 2 和 3,就像 4 和 5 和 6 一樣多,圓周率的位數不應該偏好,比如說,7 勝過 8。但也許圓周率的位數中存在某種惡魔,每次你計算出越來越多的位數時,它都會使一個位數偏向另一個位數。這是一種不應該發生的陰謀。沒有理由它會發生,但我們目前的技術無法證明這一點。回到納維-斯托克斯方程式,流體具有一定的能量,並且由於流體在運動,能量會被傳輸到周圍。
(00:10:53) 而且水也具有黏性,所以如果能量分散在許多不同的位置,流體的自然黏性就會阻尼能量,使其降至零。這就是我們實際用水做實驗時發生的情況。你四處潑灑,會有一些湍流和波浪等等,但最終它會平靜下來,振幅越低,速度越小,它就越平靜。但潛在地,存在某種惡魔,不斷將流體的能量推向越來越小的尺度,並且它會越來越快地移動。在更快的速度下,黏性的影響相對較小。因此,可能會產生某種所謂的自相似斑點情景,其中流體的能量從某個大的尺度開始,然後它將所有的能量轉移到流體的一個較小的區域,然後以更快的速度移動到一個更小的區域等等。
而每次這樣做,所需時間可能只有前一次的一半,然後你實際上可以收斂到所有能量在有限的時間內集中在一個點上。這種情況被稱為有限時間爆發。但實際上,這種情況不會發生。水是所謂的湍流。所以,如果有一個大的水渦,它會傾向於分解成更小的水渦,但它不會把所有能量從一個大的水渦轉移到一個小的水渦。它會轉移到三到四個,然後這些水渦再分裂成三到四個更小的水渦。所以能量會被分散,直到黏度可以控制一切。但如果它能以某種方式集中所有能量,把它們都放在一起,並且以足夠快的速度進行,使黏性效應沒有足夠的時間來平息一切,那麼這種爆發就會發生。
所以,有些論文聲稱,「喔,你只需要考慮能量守恆,並仔細使用黏度,就可以控制一切,不僅僅是 Navier-Stokes 方程,還有許多許多像這樣的方程式。」所以在過去,有很多嘗試想獲得 Navier-Stokes 方程的所謂全局正則性,這與有限時間爆發相反,也就是速度保持平滑。但所有嘗試都失敗了。總是有一些符號錯誤或一些細微的錯誤,無法挽救。
所以我感興趣的是,試圖解釋為什麼我們無法反駁有限時間爆發。我無法對實際的流體方程式做到這一點,因為它們太複雜了,但如果我可以平均 Navier-Stokes 的運動方程式,基本上如果我可以關閉某些水相互作用的方式,只保留我想要的方式。所以,特別是,如果有一種流體,它可以將能量從一個大的渦流轉移到這個小的渦流或另一個小的渦流,我會關閉將能量轉移到這個渦流的能量通道,並將其直接導入到這個較小的渦流中,同時仍然保持較低的能量守恆。
Lex Fridman
所以,你正在試圖製造一個爆發?
所以,你正在試圖製造一個爆發?
陶哲軒
(00:14:00)對,沒錯。所以,我基本上是透過改變物理規則來設計一個爆發,這是數學家可以做的事情之一。我們可以改變方程式。
(00:14:00)對,沒錯。所以,我基本上是透過改變物理規則來設計一個爆發,這是數學家可以做的事情之一。我們可以改變方程式。
Lex Fridman
(00:14:08)這如何幫助你更接近證明某件事?
(00:14:08)這如何幫助你更接近證明某件事?
陶哲軒
(00:14:11)沒錯。所以,它提供了數學上所謂的阻礙。所以我所做的是,基本上如果我關閉方程式的某些部分,通常當你關閉某些交互作用時,會使其較不具非線性,使其更規則,且較不可能爆發。但我發現,透過關閉一組設計良好的交互作用,我可以迫使所有能量在有限時間內爆發。所以,這意味著如果你想證明 Navier-Stokes 方程式的規律性,你必須使用真實方程式的某些特性,而我的人工方程式不滿足這些特性。所以,它排除了某些方法。
(00:14:11)沒錯。所以,它提供了數學上所謂的阻礙。所以我所做的是,基本上如果我關閉方程式的某些部分,通常當你關閉某些交互作用時,會使其較不具非線性,使其更規則,且較不可能爆發。但我發現,透過關閉一組設計良好的交互作用,我可以迫使所有能量在有限時間內爆發。所以,這意味著如果你想證明 Navier-Stokes 方程式的規律性,你必須使用真實方程式的某些特性,而我的人工方程式不滿足這些特性。所以,它排除了某些方法。
(00:14:55)所以數學的重點不只是採用一種會有效的技術並應用它,而是你需要避免採用無效的技術。對於真正困難的問題,通常有幾十種你可能認為可以應用來解決問題的方法,但只有在經歷很多經驗後,你才會意識到這些方法根本不可能奏效。所以,針對附近問題的反例排除了……它節省了你很多時間,因為你不會把精力浪費在你知道永遠不可能奏效的事情上。
Lex Fridman
(00:15:30) 這種連結與流體力學的特定問題有多深?還是說這是你建立起來關於數學的更普遍的直覺?
(00:15:30) 這種連結與流體力學的特定問題有多深?還是說這是你建立起來關於數學的更普遍的直覺?
陶哲軒
(00:15:38) 對,沒錯。所以,我的技術所利用的關鍵現象就是所謂的超臨界性。在偏[聽不清楚 00:15:46]微分方程式中,這些方程式通常就像不同力量之間的拉鋸戰。所以在納維-斯托克斯方程式中,存在著來自黏度的耗散力,而且人們對此非常了解。它是線性的,可以使事物平靜下來。如果只有黏度,那就不會發生任何糟糕的事情,但是能量也會從...空間中的某個位置,因為流體運動而被傳輸到其他位置。這是一種非線性效應,也是造成所有問題的原因。因此,在納維-斯托克斯方程式中,存在著兩種相互競爭的項,即耗散項和傳輸項。如果耗散項占主導地位,如果它很大,那麼基本上你就會得到規律性。如果傳輸項占主導地位,那麼我們就不知道會發生什麼。這是一個非常非線性的情況,它是不可預測的,它是湍流的。
(00:15:38) 對,沒錯。所以,我的技術所利用的關鍵現象就是所謂的超臨界性。在偏[聽不清楚 00:15:46]微分方程式中,這些方程式通常就像不同力量之間的拉鋸戰。所以在納維-斯托克斯方程式中,存在著來自黏度的耗散力,而且人們對此非常了解。它是線性的,可以使事物平靜下來。如果只有黏度,那就不會發生任何糟糕的事情,但是能量也會從...空間中的某個位置,因為流體運動而被傳輸到其他位置。這是一種非線性效應,也是造成所有問題的原因。因此,在納維-斯托克斯方程式中,存在著兩種相互競爭的項,即耗散項和傳輸項。如果耗散項占主導地位,如果它很大,那麼基本上你就會得到規律性。如果傳輸項占主導地位,那麼我們就不知道會發生什麼。這是一個非常非線性的情況,它是不可預測的,它是湍流的。
(00:16:32) 因此,有時這些力在小尺度上是平衡的,但在大尺度上則不然,反之亦然。納維-斯托克斯方程式被稱為超臨界。因此,在越來越小的尺度上,傳輸項比黏度項強得多。所以黏度項是使事物平靜下來的東西。這就是問題困難的原因。在二維中,蘇聯數學家 Ladyzhenskaya 在 60 年代證明了在二維中沒有爆發。在二維中,納維-斯托克斯方程式被稱為臨界的,即使在非常非常小的尺度上,傳輸效應和黏度效應也大致相同。我們有很多技術來處理臨界方程式和亞臨界方程式,並證明其規律性。但是對於超臨界方程式,目前尚不清楚會發生什麼,我做了很多工作,然後有很多後續工作表明,對於許多其他類型的超臨界方程式,你可以創建各種爆發的例子。
(00:17:27) 一旦非線性效應在小尺度上支配了線性效應,你可能會遇到各種糟糕的事情。因此,這可以說是這項工作的主要見解之一,即超臨界性與臨界性和亞臨界性相比,這會產生很大的差異。這是一個關鍵的定性特徵,它將一些方程式區分為良好且可預測的……就像行星運動一樣,有些方程式你可以預測數百萬年或至少數千年。同樣,這並不是一個真正的問題,但我們無法預測未來兩週以上天氣的原因是因為它是一個超臨界方程式。在非常精細的尺度上,正在發生許多非常奇怪的事情。
Lex Fridman
(00:18:04) 所以,每當出現巨大的非線性來源時,就會對預測將會發生的事情造成巨大的問題,對吧?
(00:18:04) 所以,每當出現巨大的非線性來源時,就會對預測將會發生的事情造成巨大的問題,對吧?
陶哲軒
(00:18:13) 是的。如果非線性在小尺度上以某種方式變得越來越重要且有趣。有很多方程式是非線性的,但在許多方程式中,你可以透過整體來近似事物。例如,行星運動,如果你想了解月球或火星的軌道,你不需要月球地震學的微觀結構,也不需要知道質量的確切分布。基本上,你可以將這些行星近似為質點,而重要的只是總體行為。但是如果你想模擬流體,比如天氣,你不能簡單地說:「在洛杉磯,溫度是這樣,風速是這樣。」對於超臨界方程式,精細尺度的資訊非常重要。
(00:18:13) 是的。如果非線性在小尺度上以某種方式變得越來越重要且有趣。有很多方程式是非線性的,但在許多方程式中,你可以透過整體來近似事物。例如,行星運動,如果你想了解月球或火星的軌道,你不需要月球地震學的微觀結構,也不需要知道質量的確切分布。基本上,你可以將這些行星近似為質點,而重要的只是總體行為。但是如果你想模擬流體,比如天氣,你不能簡單地說:「在洛杉磯,溫度是這樣,風速是這樣。」對於超臨界方程式,精細尺度的資訊非常重要。
Lex Fridman
(00:18:54) 如果我們可以稍微停留在納維-斯托克斯方程式上。你曾建議,也許你可以描述一下,解決它或以否定方式解決它的方法之一是建立一種液體計算機,然後證明計算理論中的停機問題對流體力學有影響,以此來證明。你能描述一下這個想法嗎?
(00:18:54) 如果我們可以稍微停留在納維-斯托克斯方程式上。你曾建議,也許你可以描述一下,解決它或以否定方式解決它的方法之一是建立一種液體計算機,然後證明計算理論中的停機問題對流體力學有影響,以此來證明。你能描述一下這個想法嗎?
陶哲軒
(00:19:22) 對,沒錯。這源於我建構這個平均方程式,結果它爆炸了。作為我必須這樣做的一部分,有一種很天真的方法,你只要不斷推進。每次你得到一個尺度,你就會盡快地把它推到下一個尺度。這是一種強迫爆炸的天真方法。結果發現,在五維及以上,這種方法有效,但在三維空間中,我發現了一種有趣的現象,如果你改變物理定律,你總是試圖將能量推入越來越小的尺度,結果是能量開始同時分散到許多尺度,所以你在一個尺度上有能量。你把它推到下一個尺度,然後一旦它進入那個尺度,你也會把它推到下一個尺度,但前一個尺度仍然有一些能量殘留。
(00:19:22) 對,沒錯。這源於我建構這個平均方程式,結果它爆炸了。作為我必須這樣做的一部分,有一種很天真的方法,你只要不斷推進。每次你得到一個尺度,你就會盡快地把它推到下一個尺度。這是一種強迫爆炸的天真方法。結果發現,在五維及以上,這種方法有效,但在三維空間中,我發現了一種有趣的現象,如果你改變物理定律,你總是試圖將能量推入越來越小的尺度,結果是能量開始同時分散到許多尺度,所以你在一個尺度上有能量。你把它推到下一個尺度,然後一旦它進入那個尺度,你也會把它推到下一個尺度,但前一個尺度仍然有一些能量殘留。
(00:20:16) 你試圖一次做所有的事情,這會使能量過度分散。結果發現,這使得黏性很容易介入,並實際上抑制所有的事情。所以,這種直接中止的方式實際上是行不通的。另外一些作者發表了一篇獨立的論文,實際上在三維空間中證明了這一點。所以我需要的是編寫一個延遲程序,有點像氣閘。所以我需要一個方程式,這個方程式開始時會讓流體在一個尺度上做一些事情,然後它會將這個能量推到下一個尺度,但它會停留在那里,直到來自較大尺度的所有能量都被轉移。只有在你將所有能量都推進去之後,你才能打開下一個閘門,然後你也將能量推進去。
(00:21:01) 透過這樣做,能量以一種一次只集中在一個尺度的方式向前推進,然後它可以抵抗黏性的影響,因為它沒有分散。為了實現這一點,我必須構建一個相當複雜的非線性。它基本上就像一個電子電路。所以我實際上要感謝我的妻子,因為她接受過電機工程師的訓練,她談到她必須設計電路等等。如果你想要一個能做某件事的電路,也許有一個燈會閃爍,然後關閉,然後打開和關閉。你可以用更原始的元件,電容器和電阻器等等來構建它,而且你必須建立一個圖表。
(00:21:47) 這些圖表,你可以用你的眼睛追蹤,然後說:「喔,沒錯,電流會在這裡積累,然後它會停止,然後它會那樣做。」所以我知道如何構建基本電子元件的類比,像是電阻器和電容器等等。我會將它們堆疊在一起,以創建可以打開一個閘門的東西。然後會有一個時鐘,一旦時鐘達到某個閾值,它就會關閉它。它會變成一種魯布·戈德堡機械(Rube Goldberg machine),但以數學方式描述。而這最終奏效了。所以我意識到的是,如果你可以對實際的方程式做同樣的事情,所以如果水的方程式支持計算......你可以想像一種蒸汽龐克,但它實際上是水龐克類型的東西,其中......所以,現代計算機是電子式的,它們由電子通過非常細小的電線並與其他電子相互作用來驅動。
(00:22:39) 但是,你可以想像這些水脈以一定的速度移動,而不是電子。也許有兩種不同的配置,對應於一個位元是向上還是向下。可能如果你有兩個這些移動的水體碰撞,它們會產生一些新的配置,這會像是一個「及閘」(AND gate)或「或閘」(OR gate),輸出將以一種非常可預測的方式取決於輸入。你可以將它們鏈接在一起,也許可以創建一個圖靈機。然後你有了完全由水製成的計算機。如果你有計算機,那麼也許你可以做機器人,像是液壓等等。所以你可以創造一些基本上是流體類比的機器,這被稱為馮·紐曼機(von Neumann machine)。
(00:23:26) 所以,馮·諾伊曼提出,如果你想殖民火星,將人類和機器運送到火星的成本簡直荒謬,但如果你能運送一台機器到火星,而這台機器有能力開採星球,創造更多材料,冶煉它們並製造更多相同的機器副本,那麼隨著時間的推移,你就可以殖民整個星球。所以,如果你能製造出一台流體機器,是的,它是一個流體機器人。它會做的是,它的人生目標,它的程式設定是,它會在某種冷卻狀態下創造一個較小版本的自己。它不會立即啟動。一旦準備就緒,大型機器人的水配置會將其所有能量轉移到較小的配置中,然後關閉電源。然後它們會清理自己,剩下的就是這個最新的狀態,然後它會啟動並做同樣的事情,但更小更快。
(00:24:19) 然後這個方程式具有某種縮放對稱性。一旦你這樣做了,它就可以不斷迭代。所以,原則上,這會為實際的納維-斯托克斯方程式創造一個爆破。這就是我成功為這個平均納維-斯托克斯方程式做到的。所以,它為解決這個問題提供了一個路線圖。現在,這是一個白日夢,因為要實現這一目標,還有很多東西缺失。所以我無法創建這些基本的邏輯閘。我沒有這些特殊的水配置。有一些候選者,包括可能起作用的渦環。但與數位計算相比,類比計算也非常糟糕,因為總是存在錯誤。你必須沿途進行大量的錯誤修正。
(00:25:05) 我不知道如何完全關閉大型機器,所以它不會干擾較小機器的寫入,但原則上一切都有可能發生。它不違反任何物理定律,所以這可以算是這個東西是可能的證據。現在有其他團隊正在尋找使納維-斯托克斯方程式爆破的方法,這些方法遠沒有這個方法那麼複雜。他們實際上正在追求更接近直接自相似模型的方法,這種模型可以……它本身並不能完全起作用,但可能有一些更簡單的方案,他們想描述一下,讓它起作用。
Lex Fridman
(00:25:40) 從納維-斯托克斯方程式到這個圖靈機,這裡有一個真正的天才般的飛躍。所以,它從你試圖讓越來越小的自相似斑點情景,變成了現在擁有一個越來越小的液體圖靈機,並以某種方式看到如何利用它來說明爆破。這是一個很大的飛躍。
(00:25:40) 從納維-斯托克斯方程式到這個圖靈機,這裡有一個真正的天才般的飛躍。所以,它從你試圖讓越來越小的自相似斑點情景,變成了現在擁有一個越來越小的液體圖靈機,並以某種方式看到如何利用它來說明爆破。這是一個很大的飛躍。
生命遊戲
陶哲軒
(00:26:08) 所以,這是有先例的。數學的奧妙之處在於,它非常擅長發現看似完全不同的問題之間的關聯,但如果數學形式相同,你就可以建立聯繫。所以,之前有很多關於所謂細胞自動機的研究,其中最著名的是康威的生命遊戲。這是一個無限的離散網格,在任何給定的時間,網格要嘛被一個細胞佔據,要嘛是空的。有一個非常簡單的規則告訴你這些細胞是如何演化的。所以,有時細胞會存活,有時會死亡。當我還是學生的時候,這是一個非常流行的螢幕保護程式,讓這些動畫持續播放,它們看起來非常混亂。事實上,它們有時看起來有點像紊流,但在某個時候,人們在這個生命遊戲中發現了越來越有趣的結構。例如,他們發現了一種叫做滑翔機的東西。
(00:26:08) 所以,這是有先例的。數學的奧妙之處在於,它非常擅長發現看似完全不同的問題之間的關聯,但如果數學形式相同,你就可以建立聯繫。所以,之前有很多關於所謂細胞自動機的研究,其中最著名的是康威的生命遊戲。這是一個無限的離散網格,在任何給定的時間,網格要嘛被一個細胞佔據,要嘛是空的。有一個非常簡單的規則告訴你這些細胞是如何演化的。所以,有時細胞會存活,有時會死亡。當我還是學生的時候,這是一個非常流行的螢幕保護程式,讓這些動畫持續播放,它們看起來非常混亂。事實上,它們有時看起來有點像紊流,但在某個時候,人們在這個生命遊戲中發現了越來越有趣的結構。例如,他們發現了一種叫做滑翔機的東西。
(00:27:00) 所以,滑翔機是一個非常小的配置,由四或五個細胞組成,它會演化並朝某個方向移動。這就像渦環[聽不清楚 00:27:09]。是的,所以這是一個類比,生命遊戲是一個離散方程式,而流體納維爾-斯托克斯方程式是一個連續方程式,但在數學上它們有一些相似的特徵。隨著時間的推移,人們發現了越來越多可以在生命遊戲中構建的有趣事物。生命遊戲是一個非常簡單的系統。它只有三或四個規則,但你可以在其中設計各種有趣的配置。有一種叫做滑翔機槍的東西,它什麼都不做,只會一次吐出一個滑翔機。經過大量的努力,人們設法為滑翔機創建了 AND 閘和 OR 閘。
(00:27:48) 有一個非常荒謬的龐大結構,如果你在這裡輸入一股滑翔機,在這裡輸入一股滑翔機,那麼你可能會產生輸出滑翔機。也許如果兩股都有滑翔機,那麼就會有一個輸出流,但如果只有一股有,那麼就什麼都不會輸出。所以,他們可以建造類似的東西。一旦你能建造這些基本的閘,那麼僅僅從軟體工程的角度來看,你幾乎可以建造任何東西。你可以建造一台圖靈機。它們是巨大的蒸汽龐克式裝置。它們看起來很荒謬。但後來人們也在生命遊戲中產生了自我複製的物體,一個巨大的機器,一個[聽不清楚 00:28:31]機器,它在很長一段時間內,看起來總是像裡面的滑翔機槍在做這些非常蒸汽龐克的計算。它會創建另一個可以複製自己的版本。
Lex Fridman
(00:28:42) 真是太不可思議了。
(00:28:42) 真是太不可思議了。
陶哲軒
(00:28:42) 很多這類研究實際上是由業餘數學家以社群協作的方式完成的。所以我知道這項工作。這也是啟發我提出對納維-斯托克斯方程式做同樣嘗試的原因之一。說真的,類比遠比數位更糟。它會…你不能直接把生命遊戲中的解構搬過去。但同樣地,這顯示這是可能的。
(00:28:42) 很多這類研究實際上是由業餘數學家以社群協作的方式完成的。所以我知道這項工作。這也是啟發我提出對納維-斯托克斯方程式做同樣嘗試的原因之一。說真的,類比遠比數位更糟。它會…你不能直接把生命遊戲中的解構搬過去。但同樣地,這顯示這是可能的。
Lex Fridman
(00:29:06) 這些細胞自動機的局部規則會產生一種湧現現象…也許和流體相似,我不知道,但在大規模運作下的局部規則可以創造出極其複雜的動態結構。你認為其中有任何部分適合數學分析嗎?我們是否有工具可以對此說出一些深刻的見解?
(00:29:06) 這些細胞自動機的局部規則會產生一種湧現現象…也許和流體相似,我不知道,但在大規模運作下的局部規則可以創造出極其複雜的動態結構。你認為其中有任何部分適合數學分析嗎?我們是否有工具可以對此說出一些深刻的見解?
陶哲軒
(00:29:34) 問題是,你可以得到這些湧現的非常複雜的結構,但前提是必須有非常精心準備的初始條件。所以,這些滑翔機槍和閘門以及自推進機器,如果你只是隨機地放上一些細胞並將它們取消連結,你將不會看到任何這些現象。這與納維-斯托克斯方程式的情況類似,在典型的初始條件下,你不會看到任何這種奇怪的計算發生。但基本上通過工程設計,以一種非常特殊的方式來特別設計事物,你可以做出巧妙的構造。
(00:29:34) 問題是,你可以得到這些湧現的非常複雜的結構,但前提是必須有非常精心準備的初始條件。所以,這些滑翔機槍和閘門以及自推進機器,如果你只是隨機地放上一些細胞並將它們取消連結,你將不會看到任何這些現象。這與納維-斯托克斯方程式的情況類似,在典型的初始條件下,你不會看到任何這種奇怪的計算發生。但基本上通過工程設計,以一種非常特殊的方式來特別設計事物,你可以做出巧妙的構造。
Lex Fridman
我想知道是否有可能證明反面,基本上是證明只能透過工程才能創造出有趣的東西。
我想知道是否有可能證明反面,基本上是證明只能透過工程才能創造出有趣的東西。
陶哲軒
是的,這在數學中是一個反覆出現的挑戰,我稱之為「結構與隨機性之間的二分法」,也就是說,你在數學中可以產生的絕大多數物體都是隨機的。它們看起來是隨機的,就像數位供應一樣,我們認為這是一個很好的例子。但只有極少數的東西具有模式。但是,現在你可以透過構造來證明某事物具有模式......如果某事物具有簡單的模式,並且你有證據表明它會重複出現,你可以做到這一點,並且你可以證明......例如,你可以證明大多數數字序列都沒有模式。所以,如果你只是隨機選擇數字,就會出現所謂的「大數法則」。它告訴你,從長遠來看,你會得到一樣多的一和二。但是我們擁有的工具要少得多......
是的,這在數學中是一個反覆出現的挑戰,我稱之為「結構與隨機性之間的二分法」,也就是說,你在數學中可以產生的絕大多數物體都是隨機的。它們看起來是隨機的,就像數位供應一樣,我們認為這是一個很好的例子。但只有極少數的東西具有模式。但是,現在你可以透過構造來證明某事物具有模式......如果某事物具有簡單的模式,並且你有證據表明它會重複出現,你可以做到這一點,並且你可以證明......例如,你可以證明大多數數字序列都沒有模式。所以,如果你只是隨機選擇數字,就會出現所謂的「大數法則」。它告訴你,從長遠來看,你會得到一樣多的一和二。但是我們擁有的工具要少得多......
(00:31:01) 如果我給你一個特定的模式,像是圓周率的數字,我要如何證明它沒有什麼奇怪的模式?我花了很多時間做的另一項工作是證明所謂的結構定理或反定理,這些定理提供了檢驗事物是否具有高度結構性的方法。有些函數被稱為加性函數。如果你有一個從自然數到自然數的函數,比如說 2 對應到 4,3 對應到 6 等等,有些函數被稱為加性函數,這意味著如果你將兩個輸入加在一起,輸出也會相加。例如,乘以一個常數。如果你將一個數字乘以 10…… 如果你將 A 加 B 乘以 10,這與將 A 乘以 10 和 B 乘以 10,然後將它們加在一起是相同的。所以,有些函數是加性的,有些函數有點像加性的,但不是完全加性的。
(00:31:47) 舉例來說,如果我取一個數字,然後乘以 2 的平方根,然後取它的整數部分,那麼 10 乘以 2 的平方根就像是 14 點多,所以 10 變成 14,20 變成 28。所以在這種情況下,加性是成立的,所以 10 加 10 等於 20,14 加 14 等於 28。但由於這種四捨五入,有時會有進位誤差,有時當你把 A 加 A 時,這個函數並不能完全給你兩個單獨輸出的總和,而是總和加/減一。所以它幾乎是加性的,但不是完全加性的。
(00:32:21) 所以,數學中有很多有用的結果,我花了很多精力開發類似的東西,也就是說,如果一個函數表現出像這樣的結構,那麼它必然有其成立的原因。而原因是,存在一些其他附近的函數,它們實際上是完全結構化的,可以解釋你所擁有的這種部分模式。因此,如果你有這些逆定理,它會創造出一種二分法,即你研究的對象要么根本沒有結構,要么它們與某種有結構的東西有關。無論哪種情況,你都可以取得進展。一個很好的例子是數學中的一個古老定理——
無限
陶哲軒
(00:33:01) 這有個很好的例子,數學裡有個古老的定理叫塞邁雷迪定理(Szemerédi’s Theorem),是 1970 年代證明的。它探討的是在一組數字中尋找特定類型的模式,也就是等差數列模式。像是 3、5、7 或 10、15、20 這種。塞邁雷迪(Endre Szemerédi)證明了任何夠大的數字集合,也就是所謂的正密度集合,都包含任何你想要的長度的等差數列。
(00:33:01) 這有個很好的例子,數學裡有個古老的定理叫塞邁雷迪定理(Szemerédi’s Theorem),是 1970 年代證明的。它探討的是在一組數字中尋找特定類型的模式,也就是等差數列模式。像是 3、5、7 或 10、15、20 這種。塞邁雷迪(Endre Szemerédi)證明了任何夠大的數字集合,也就是所謂的正密度集合,都包含任何你想要的長度的等差數列。
(00:33:28) 舉例來說,奇數的密度是二分之一,而且它們包含任何長度的等差數列。所以在這種情況下,這很明顯,因為奇數非常有結構。我可以隨便取 11、13、15、17,我可以很容易地在這個集合中找到等差數列,但塞邁雷迪定理也適用於隨機集合。如果我取一組奇數,然後為每個數字擲一枚硬幣,我只保留擲出正面的數字……所以我只是擲硬幣,我只是隨機取出數字的一半,保留一半。這是一個完全沒有模式的集合,但僅僅因為隨機波動,你仍然會在這個集合中得到很多等差數列。
Lex Fridman
(00:34:10) 你能證明在一個隨機的集合中存在任意長度的等差數列嗎?
(00:34:10) 你能證明在一個隨機的集合中存在任意長度的等差數列嗎?
陶哲軒
(00:34:17) 可以。你聽過無限猴子定理嗎?通常,數學家會給定理起一些很無聊的名字,但偶爾他們也會起一些色彩繽紛的名字。
(00:34:17) 可以。你聽過無限猴子定理嗎?通常,數學家會給定理起一些很無聊的名字,但偶爾他們也會起一些色彩繽紛的名字。
Lex Fridman
沒錯。
陶哲軒
(00:34:24) 無限猴子定理的流行版本是,如果你在一個房間裡有無數隻猴子,每隻猴子都有一台打字機,牠們隨機地打出文字,幾乎可以肯定的是,其中一隻猴子會產生《哈姆雷特》的完整劇本,或任何其他有限的文字字串。這需要一些時間,實際上需要相當長的時間,但如果你有無數隻猴子,那麼這件事就會發生。
(00:34:24) 無限猴子定理的流行版本是,如果你在一個房間裡有無數隻猴子,每隻猴子都有一台打字機,牠們隨機地打出文字,幾乎可以肯定的是,其中一隻猴子會產生《哈姆雷特》的完整劇本,或任何其他有限的文字字串。這需要一些時間,實際上需要相當長的時間,但如果你有無數隻猴子,那麼這件事就會發生。
(00:34:44) 所以基本上,這個定理是說,如果你取一個無限長的數字串或任何東西,最終你想要的任何有限模式都會出現。這可能需要很長時間,但它最終會發生。特別是,任何長度的等差數列最終都會出現,但你需要一個極長的隨機序列才能讓這件事發生。
Lex Fridman
(00:35:04) 我想這是直觀的。這就是無限。
(00:35:04) 我想這是直觀的。這就是無限。
陶哲軒
是啊,無限大吸收了很多罪惡。
是啊,無限大吸收了很多罪惡。
Lex Fridman
是啊。我們人類要如何應對無限大?
是啊。我們人類要如何應對無限大?
陶哲軒
嗯,你可以把無限大想成是一個有限數字的抽象概念,而你沒有對其設限。現實生活中沒有任何東西是真正無限的,但你可以問自己這樣的問題:「如果我想要多少錢就有多少錢呢?」,或者,「如果我能想跑多快就跑多快呢?」,而數學家將其形式化的一種方式是,數學已經找到一種形式主義來理想化,而不是讓某件事變得極大或極小,而是讓它真正地無限大或零,而且通常這樣做數學會變得更簡潔。我的意思是,在物理學中,我們開玩笑地假設球形的牛,現實世界的問題有各種各樣的現實世界效應,但你可以理想化,將一些東西送到無限大,將一些東西送到零,然後數學就會變得更容易處理。
嗯,你可以把無限大想成是一個有限數字的抽象概念,而你沒有對其設限。現實生活中沒有任何東西是真正無限的,但你可以問自己這樣的問題:「如果我想要多少錢就有多少錢呢?」,或者,「如果我能想跑多快就跑多快呢?」,而數學家將其形式化的一種方式是,數學已經找到一種形式主義來理想化,而不是讓某件事變得極大或極小,而是讓它真正地無限大或零,而且通常這樣做數學會變得更簡潔。我的意思是,在物理學中,我們開玩笑地假設球形的牛,現實世界的問題有各種各樣的現實世界效應,但你可以理想化,將一些東西送到無限大,將一些東西送到零,然後數學就會變得更容易處理。
Lex Fridman
我好奇使用無限大會有多常迫使我們偏離現實的物理現象。
我好奇使用無限大會有多常迫使我們偏離現實的物理現象。
陶哲軒
(00:36:17) 所以有很多陷阱。所以我們花很多時間在大學數學課上教授分析,而分析通常是有關如何取極限以及是否...
(00:36:17) 所以有很多陷阱。所以我們花很多時間在大學數學課上教授分析,而分析通常是有關如何取極限以及是否...
(00:36:28) 舉例來說,A 加 B 永遠等於 B 加 A。當你有有限個項相加時,你可以交換它們,沒有問題,但是當你有無限個項時,你可以玩一些展示遊戲,你可以讓一個級數收斂到一個值,但是你重新排列它,它突然收斂到另一個值,所以你可能會犯錯。當你允許無限時,你必須知道自己在做什麼。你必須引入這些 epsilon 和 delta,並且有一種特定的推理方式可以幫助你避免錯誤。
(00:36:58) 近年來,人們開始採用在無限極限中成立的結果,並將其「有限化」。所以你知道某件事最終會成立,但你不知道何時。現在給我一個速率。所以...如果我沒有無限隻猴子,而是有大量有限隻猴子,我必須等多久哈姆雷特才會出現?這是一個更量化的問題,你可以用純粹的有限方法來解決它,你可以使用你的有限直覺,在這種情況下,結果證明它與你試圖生成的文本長度成指數關係。
(00:37:36) 這就是為什麼你永遠不會看到猴子創造哈姆雷特。你或許可以看見牠們創造一個四個字母的單字,但沒有那麼大的東西。所以我個人覺得,一旦你將無限的陳述有限化,它就會變得更加直觀,也不再那麼奇怪。
Lex Fridman
(00:37:51) 所以即使你處理的是無限,最好還是將其有限化,這樣你才能有一些直覺?
(00:37:51) 所以即使你處理的是無限,最好還是將其有限化,這樣你才能有一些直覺?
陶哲軒
(00:37:57) 是的,缺點是有限化的群體會變得非常非常混亂。所以通常會先發現無限的群體,而且往往早幾十年,然後人們才會將它們有限化。
(00:37:57) 是的,缺點是有限化的群體會變得非常非常混亂。所以通常會先發現無限的群體,而且往往早幾十年,然後人們才會將它們有限化。
數學與物理的區別
Lex Fridman
(00:38:07) 既然我們提到了許多數學和物理,那麼作為學科,作為理解和看待世界的方式,數學和物理之間有什麼區別?也許我們可以把工程學也加進來,你提到你的妻子是工程師,這給了你對電路的新觀點。鑑於你做過數理物理,你戴過所有的帽子,所以從不同的角度來看待這個世界。
(00:38:07) 既然我們提到了許多數學和物理,那麼作為學科,作為理解和看待世界的方式,數學和物理之間有什麼區別?也許我們可以把工程學也加進來,你提到你的妻子是工程師,這給了你對電路的新觀點。鑑於你做過數理物理,你戴過所有的帽子,所以從不同的角度來看待這個世界。
陶哲軒
(00:38:30) 是的。我認為廣義的科學是三件事之間的互動。有真實世界,有我們對真實世界的觀察,也就是觀測,然後是我們認為世界如何運作的心理模型。
(00:38:30) 是的。我認為廣義的科學是三件事之間的互動。有真實世界,有我們對真實世界的觀察,也就是觀測,然後是我們認為世界如何運作的心理模型。
(00:38:46) 我們無法直接接觸現實。我們所擁有的只是觀測,這些觀測是不完整的,而且有誤差。在許多情況下,我們想知道,例如,明天的天氣如何,但我們還沒有觀測到,但我們很想知道。這就是預測。
(00:39:04) 接著我們會有這些簡化的模型,有時會做出不切實際的假設,像是球形乳牛之類的東西。那些就是數學模型。
(00:39:11) 數學關注的是模型。科學收集觀察結果,並提出可能解釋這些觀察結果的模型。數學所做的,是我們留在模型中,並詢問該模型的後果是什麼?該模型會對未來的觀察結果或過去的觀察結果做出什麼觀察、什麼預測?它是否符合?觀察數據?
(00:39:35) 所以這絕對是一種共生關係。我猜數學在其他學科中很不尋常,因為我們從假設開始,像是模型的公理,然後詢問從該模型中得出什麼結論。幾乎在任何其他學科中,你都是從結論開始。「我想要做這個。我想要建造一座橋樑,我想要賺錢,我想要做這個」,然後你找到達到目標的路徑。關於「假設我這樣做了,會發生什麼事?」的推測就少了很多。像是規劃和建模。思辨小說可能是另一個例子,但實際上就只有這樣了。我們生活中所做的大多數事情都是結論驅動的,包括物理學和科學。我的意思是,他們想知道「這顆小行星將會去哪裡?明天的天氣會如何?」,但數學也有另一個方向,即從公理出發。
Lex Fridman
(00:40:32) 你認為……物理學中存在理論與實驗之間的張力。你認為發現關於現實的真正新穎想法,哪一種方式更強大?
(00:40:32) 你認為……物理學中存在理論與實驗之間的張力。你認為發現關於現實的真正新穎想法,哪一種方式更強大?
陶哲軒
(00:40:42) 嗯,兩者都需要,由上而下和由下而上。這實際上是所有這些之間的互動……所以隨著時間的推移,觀察、理論和模型都應該更接近現實,但最初,而且一直都是這樣,它們一開始總是相差甚遠,但你需要一個來弄清楚該往哪個方向推動另一個。
(00:40:42) 嗯,兩者都需要,由上而下和由下而上。這實際上是所有這些之間的互動……所以隨著時間的推移,觀察、理論和模型都應該更接近現實,但最初,而且一直都是這樣,它們一開始總是相差甚遠,但你需要一個來弄清楚該往哪個方向推動另一個。
(00:41:04) 所以如果你的模型預測了實驗未預測到的異常現象,那就告訴實驗人員去哪裡尋找更多數據來完善模型。所以它是來回反覆的。
(00:41:21) 在數學本身中,也存在理論和實驗成分。只是直到最近,理論幾乎完全佔據主導地位。99% 的數學是理論數學,只有極少量的實驗數學。人們確實會做。如果他們想研究質數或其他什麼,他們可以產生大型數據集。
(00:41:41) 所以一旦我們有了電腦,我們就必須稍微做一下。雖然甚至在……嗯,像高斯為例,他發現了一個重新猜想,數論中最基本的定理,叫做質數定理,它可以預測一百萬以內、一兆以內有多少個質數。這不是一個顯而易見的問題,基本上他所做的就是計算,大部分是他自己計算的,但也聘請了人肉計算機,那些以算術為職業的人,來計算前十萬個質數或類似的東西,並製作表格並做出預測。那是實驗數學的一個早期例子,但直到最近,它還不是……
(00:42:22) 我的意思是,理論數學更為成功。當然,在不久之前,進行複雜的數學計算是不可行的,即使在今天,儘管我們擁有強大的電腦,也只有一部分數學問題可以透過數值方式探索。
(00:42:37) 有一種現象叫做組合爆炸。例如,你想研究 Szemerédi 定理,你想研究從 1 到 1000 的所有可能的數字子集。只有 1000 個數字。情況能有多糟?結果發現,從 1 到 1000 的不同子集的數量是 2 的 1000 次方,這遠遠超過目前任何電腦可以枚舉的數量。
(00:42:59) 因此,某些數學問題很快就變得難以透過直接的暴力計算來解決。象棋是另一個著名的例子。象棋的棋局數量,我們無法讓電腦完全探索,但現在我們有了人工智慧,我們有了探索這個空間的工具,雖然不能保證 100%成功,但可以透過實驗。所以我們現在可以透過實驗來解決象棋問題。例如,我們有非常非常出色的人工智慧,它們不會探索遊戲樹中的每一個位置,但它們找到了一些非常好的近似解,人們實際上正在使用這些象棋引擎來進行實驗性的象棋研究。他們正在重新審視舊的象棋理論,例如「喔,當你使用這種開局時……這是一種好的走法,這不是」,他們可以使用這些象棋引擎來實際改進,並且在某些情況下,推翻關於象棋的傳統觀念,我確實希望數學在未來會有更大的實驗成分,也許是由人工智慧驅動的。
Lex Fridman
(00:44:05) 我們當然會談到這個,但在象棋的例子中,數學中也有類似的情況,我不認為它提供了不同位置的某種正式解釋。它只是說哪個位置更好或更差,你可以像人類一樣直觀地感受到,然後從那裡,我們人類可以建構關於這個問題的理論。
(00:44:05) 我們當然會談到這個,但在象棋的例子中,數學中也有類似的情況,我不認為它提供了不同位置的某種正式解釋。它只是說哪個位置更好或更差,你可以像人類一樣直觀地感受到,然後從那裡,我們人類可以建構關於這個問題的理論。
現實的本質
(00:44:27)你提到了柏拉圖的洞穴寓言。以防有人不知道,這個寓言描述的是人們觀察現實的影子,而非現實本身,他們相信自己所觀察到的就是現實。在某種程度上,數學家,或許是所有人類,是否都在做著同樣的事情,即觀察現實的影子?我們有可能真正接觸到現實嗎?
陶哲軒
(00:44:55)嗯,這裡有三種本體論上的東西。有實際的現實、有觀察結果和我們的模型,嚴格來說,它們是不同的,而且我認為它們永遠都會是不同的,但隨著時間的推移,它們可以變得更接近,而變得更接近的過程往往意味著你必須拋棄最初的直覺。天文學提供了一些很好的例子,例如,最初的世界模型是平的,因為它看起來是平的而且很大,而宇宙的其餘部分,天空,則不是。例如,太陽看起來非常小。
(00:44:55)嗯,這裡有三種本體論上的東西。有實際的現實、有觀察結果和我們的模型,嚴格來說,它們是不同的,而且我認為它們永遠都會是不同的,但隨著時間的推移,它們可以變得更接近,而變得更接近的過程往往意味著你必須拋棄最初的直覺。天文學提供了一些很好的例子,例如,最初的世界模型是平的,因為它看起來是平的而且很大,而宇宙的其餘部分,天空,則不是。例如,太陽看起來非常小。
(00:45:38)所以你從一個實際上與現實相去甚遠的模型開始,但它符合你所擁有的觀察結果。所以事情看起來不錯,但隨著時間的推移,當你進行越來越多的觀察,使它更接近現實時,模型也會隨之改變,因此隨著時間的推移,我們必須意識到地球是圓的,它會自轉,它繞著太陽系運行,太陽系繞著銀河系運行,等等,而且宇宙正在膨脹。膨脹是自我膨脹的,加速的,事實上,就在今年…所以即使是宇宙本身的加速,現在的證據也顯示它不是恆定的。
Lex Fridman
(00:46:13) 背後的原因是…
(00:46:13) 背後的原因是…
陶哲軒
(00:46:16) 它正在迎頭趕上。
(00:46:16) 它正在迎頭趕上。
Lex Fridman
(00:46:18) 正在迎頭趕上。我的意思是,仍然是暗物質、暗能量之類的東西。
(00:46:18) 正在迎頭趕上。我的意思是,仍然是暗物質、暗能量之類的東西。
陶哲軒
(00:46:23) 我們有一個模型可以解釋,可以很好地擬合數據。它只需要指定幾個參數。所以人們會說:「喔,那是調整係數。有了足夠的調整係數,你可以解釋任何事情」,但數學模型的重點是,你希望模型中的參數少於觀測數據集中的數據點。
(00:46:23) 我們有一個模型可以解釋,可以很好地擬合數據。它只需要指定幾個參數。所以人們會說:「喔,那是調整係數。有了足夠的調整係數,你可以解釋任何事情」,但數學模型的重點是,你希望模型中的參數少於觀測數據集中的數據點。
(00:46:43) 所以如果你有一個用 10 個參數來解釋 10 個觀測結果的模型,那這個模型完全沒用,這叫做過度擬合。但如果你有一個用兩個參數來解釋一兆個觀測結果的模型,就像暗物質模型,我認為它有 14 個參數,並且解釋了天文學家擁有的數 PB(Petabytes)的數據。
(00:47:06) 你可以想像一個理論。思考物理數學理論的一種方式是,它對宇宙的一種壓縮,一種數據壓縮。所以你有這些 PB 級的觀測數據,你希望把它壓縮成一個模型,你可以用五頁紙來描述,並指定一定數量的參數,如果它可以擬合,達到合理的精度,幾乎所有的觀測數據,你做的壓縮越多,你的理論就越好。
Lex Fridman
(00:47:32) 事實上,我們宇宙和其中一切事物最令人驚訝的事情之一是,它竟然是可以壓縮的。這就是數學令人難以置信的有效性。
(00:47:32) 事實上,我們宇宙和其中一切事物最令人驚訝的事情之一是,它竟然是可以壓縮的。這就是數學令人難以置信的有效性。
陶哲軒
(00:47:40) 沒錯,愛因斯坦也說過類似的話:「宇宙最令人費解之處,就在於它是可以理解的。」
(00:47:40) 沒錯,愛因斯坦也說過類似的話:「宇宙最令人費解之處,就在於它是可以理解的。」
Lex Fridman
(00:47:45) 沒錯,而且不只是可以理解。你還可以寫出像 e=MC2 這樣的方程式。
(00:47:45) 沒錯,而且不只是可以理解。你還可以寫出像 e=MC2 這樣的方程式。
陶哲軒
(00:47:49) 實際上,對於這種現象有一些可能的解釋。數學中存在一種稱為普適性的現象。許多巨觀尺度上的複雜系統,都是由微觀尺度上大量微小的互動產生的。通常,由於組合爆炸,你可能會認為巨觀尺度的方程式必定比微觀尺度的方程式複雜無限多倍,而且如果你想完全精確地求解它們,它們確實如此。如果你想模擬一盒空氣中的所有原子…
(00:47:49) 實際上,對於這種現象有一些可能的解釋。數學中存在一種稱為普適性的現象。許多巨觀尺度上的複雜系統,都是由微觀尺度上大量微小的互動產生的。通常,由於組合爆炸,你可能會認為巨觀尺度的方程式必定比微觀尺度的方程式複雜無限多倍,而且如果你想完全精確地求解它們,它們確實如此。如果你想模擬一盒空氣中的所有原子…
(00:48:21) 就像亞佛加厥數一樣,非常龐大。有極大量的粒子。如果你真的試圖追蹤每一個粒子,那將會非常荒謬,但是某些定律會在微觀尺度上出現,而且幾乎不取決於巨觀尺度上發生的事情,或者只取決於非常少量的參數。
(00:48:35) 所以如果你想模擬一個盒子裡有 100 萬兆個粒子的氣體,你只需要知道它的溫度、壓力和體積,以及一些參數,像是五六個,它就能模擬幾乎所有你需要知道的關於這些 10 的 23 次方或更多粒子的資訊。我們在數學上對普適性的理解遠不如我們希望的那樣,但有一些更簡單的玩具模型,我們對普適性為何發生有很好的理解。最基本的一個是中心極限定理,它解釋了為什麼鐘形曲線會出現在自然界的各個地方,這麼多事物都按照所謂的高斯分佈,也就是著名的鐘形曲線分佈。現在甚至有一個關於這個曲線的迷因。
Lex Fridman
(00:49:18) 甚至這個迷因也廣泛適用。這個迷因的普適性。
(00:49:18) 甚至這個迷因也廣泛適用。這個迷因的普適性。
陶哲軒
(00:49:22) 是的,如果你想更深入地探討也行,但這裡面有很多很多的過程。舉例來說,你可以取很多獨立的隨機變數,然後用各種方式將它們平均起來。你可以用簡單的平均,或者更複雜的平均,我們可以在不同的情況下證明,這些鐘形曲線,這些高斯分佈,會浮現出來,這是一個令人滿意的解釋。
(00:49:22) 是的,如果你想更深入地探討也行,但這裡面有很多很多的過程。舉例來說,你可以取很多獨立的隨機變數,然後用各種方式將它們平均起來。你可以用簡單的平均,或者更複雜的平均,我們可以在不同的情況下證明,這些鐘形曲線,這些高斯分佈,會浮現出來,這是一個令人滿意的解釋。
(00:49:44) 有時候它們並不會出現。所以如果你有很多不同的輸入,而且它們都以某種系統性的方式相關聯,那麼你可能會得到非常不像鐘形曲線的東西,這在[聽不清楚 00:49:55]失效時也必須要知道。所以普遍性並不是一個百分之百可靠的東西。全球金融危機就是一個著名的例子。人們認為房屋貸款違約具有這種高斯類型的行為,如果針對擁有房屋貸款的十萬美國人進行調查,詢問他們之中有多少人會違約,如果所有事物都不相關聯,那會是一條漂亮的鐘形曲線,你可以管理選擇權和衍生性金融商品的風險等等,並且存在一個非常漂亮的理論,但如果經濟中存在系統性的衝擊,可能導致每個人同時違約,那就是非常非高斯的行為,而這在 2008 年並沒有被充分考量。
(00:50:45) 現在我認為人們更加意識到這種系統性風險實際上是一個更大的問題,而且僅僅因為模型看起來很漂亮很好,並不代表它符合現實。所以計算出模型會如何運作的數學非常重要,但驗證模型何時符合現實、何時不符合現實的科學也很重要……兩者都需要,但數學可以提供幫助,例如,這些中心極限定理告訴你,如果你有某些像是非相關性的公理,也就是如果所有輸入彼此之間都不相關聯,那麼你就會有這種高斯行為,一切都會很好。它會告訴你模型的弱點在哪裡。
(00:51:25) 所以如果你對塞邁雷迪定理 (Szemerédi's theorem) 有數學上的理解,而有人提議使用這些高斯[聽不清楚 00:51:32]或其他東西來模擬違約風險,如果你受過數學訓練,你會說:「好,但是你所有輸入之間的系統性關聯是什麼?」,然後你就可以問經濟學家:「那有多大的風險?」,然後你就可以去尋找它。所以科學和數學之間總是存在這種協同作用。
Lex Fridman
(00:51:52) 稍微談一下普遍性的話題,你以在極其廣泛的數學領域工作而聞名和受到讚揚,讓人想起一個世紀前的希爾伯特。事實上,偉大的菲爾茲獎得主數學家提姆·高爾斯(Tim Gowers)曾說,你是我們最接近希爾伯特的人。他是你的同事。
(00:51:52) 稍微談一下普遍性的話題,你以在極其廣泛的數學領域工作而聞名和受到讚揚,讓人想起一個世紀前的希爾伯特。事實上,偉大的菲爾茲獎得主數學家提姆·高爾斯(Tim Gowers)曾說,你是我們最接近希爾伯特的人。他是你的同事。
陶哲軒
(00:52:16) 哦,對啊,好朋友。
(00:52:16) 哦,對啊,好朋友。
Lex Fridman
(00:52:16) 但無論如何,你以在數學領域既深入又廣泛的能力而聞名。所以你是最適合問這個問題的人。你認為在數學所有不同的領域之間,是否存在著聯繫的線索?在所有數學中,是否存在一種深刻的、潛在的結構?
(00:52:16) 但無論如何,你以在數學領域既深入又廣泛的能力而聞名。所以你是最適合問這個問題的人。你認為在數學所有不同的領域之間,是否存在著聯繫的線索?在所有數學中,是否存在一種深刻的、潛在的結構?
陶哲軒
(00:52:36) 當然有很多聯繫的線索,而且數學的許多進展可以透過這樣的故事來呈現……也就是,原本兩個不相關的數學領域,找到了聯繫。
(00:52:36) 當然有很多聯繫的線索,而且數學的許多進展可以透過這樣的故事來呈現……也就是,原本兩個不相關的數學領域,找到了聯繫。
(00:52:50) 一個古老的例子就是幾何學和數論。在古希臘時代,這被認為是不同的學科。我的意思是,數學家兩者都有研究。歐幾里得最著名的是幾何學,但也研究數字,但它們實際上並沒有被認為是相關的。我的意思是,有一點點,你可以說這個長度是這個長度的五倍,因為你可以取這個長度的五個副本等等,但直到笛卡爾發展了解析幾何,你才能用兩個實數參數化平面,也就是幾何物件。因此,幾何問題可以轉化為關於數字的問題。
(00:53:35) 今天這感覺幾乎是微不足道的。這裡面沒有內容。當然,一個平面是 X 和 Y,因為我們就是這樣教的,而且已經內化了,但這是一個重要的發展,這兩個領域被統一了,而且這個過程在整個數學中一遍又一遍地發生。代數和幾何被分開了,現在我們有了這種流動的代數幾何,將它們連接起來,而且一遍又一遍地發生,這當然是我最喜歡的數學類型。
(00:54:06) 我認為數學家的風格各異。就像是刺蝟和狐狸…狐狸博聞廣識,但刺蝟對某件事非常、非常專精。在數學界,刺蝟和狐狸都存在,也有人能同時扮演這兩種角色。我認為理想的合作,英國數學家之間的合作,需要多樣性,像是狐狸與許多刺蝟合作,反之亦然。但我主要認為自己是狐狸。我喜歡套利,學習一個領域的運作方式,學習其中的訣竅,然後運用到另一個人們認為不相關的領域,但我可以調整這些訣竅。
Lex Fridman
(00:54:49) 所以要看見各領域之間的連結。
(00:54:49) 所以要看見各領域之間的連結。
陶哲軒
(00:54:52) 是的。還有其他數學家比我更深入。他們真的是刺蝟型。他們精通一個領域的所有知識,並且在那個領域中更快更有效率,但我可以給他們這些額外的工具。
(00:54:52) 是的。還有其他數學家比我更深入。他們真的是刺蝟型。他們精通一個領域的所有知識,並且在那個領域中更快更有效率,但我可以給他們這些額外的工具。
Lex Fridman
(00:55:05) 我是說,你曾說過,你可以根據情境,根據合作情況,同時成為刺蝟和狐狸。如果可能的話,你能談談這兩種思考問題方式的區別嗎?比如說,你遇到一個新問題,是在尋找連結還是非常專注於單一方向。
(00:55:05) 我是說,你曾說過,你可以根據情境,根據合作情況,同時成為刺蝟和狐狸。如果可能的話,你能談談這兩種思考問題方式的區別嗎?比如說,你遇到一個新問題,是在尋找連結還是非常專注於單一方向。
陶哲軒
(00:55:26) 我更喜歡狐狸的範例。是的。所以,是的,我喜歡尋找類比、敘事。我花很多時間……如果我在一個領域看到一個結果,而且我喜歡這個結果,這是一個很酷的結果,但我不喜歡這個證明,它使用了我不太熟悉的數學類型,我經常嘗試使用我喜歡的工具自己重新證明它。
(00:55:26) 我更喜歡狐狸的範例。是的。所以,是的,我喜歡尋找類比、敘事。我花很多時間……如果我在一個領域看到一個結果,而且我喜歡這個結果,這是一個很酷的結果,但我不喜歡這個證明,它使用了我不太熟悉的數學類型,我經常嘗試使用我喜歡的工具自己重新證明它。
(00:55:53) 通常,我的證明比較差,但透過他們做的練習,所以我可以說:「喔,現在我可以看到另一個證明試圖做什麼了」,從那裡,我可以對該領域使用的工具獲得一些理解。所以這非常具有探索性,非常…在瘋狂的領域做瘋狂的事情,並且大量地重新發明輪子,而刺蝟風格,我認為,更具學術性。你非常以知識為基礎。你隨時掌握這個領域的所有發展,你了解所有的歷史,你對每種特定技術的優缺點都有非常好的理解。我認為你更多地依賴計算,而不是試圖找到敘述。所以,是的,我也可以做到,但其他人非常擅長。
Lex Fridman
(00:56:44) 讓我們退一步,也許看看數學的一個有點浪漫化的版本。所以我認為你曾說過,在你生命早期,數學更像是一種解謎活動,當你還年輕的時候。你什麼時候第一次遇到一個問題或證明,讓你意識到數學可以具有一種優雅和美麗?
(00:56:44) 讓我們退一步,也許看看數學的一個有點浪漫化的版本。所以我認為你曾說過,在你生命早期,數學更像是一種解謎活動,當你還年輕的時候。你什麼時候第一次遇到一個問題或證明,讓你意識到數學可以具有一種優雅和美麗?
陶哲軒
(00:57:11) 這是個好問題。當我來到普林斯頓的研究院時,當時約翰·康威也在那裡,他幾年前去世了,但我記得我參加的第一批研究講座之一是康威關於他所謂的極端證明的講座。
(00:57:11) 這是個好問題。當我來到普林斯頓的研究院時,當時約翰·康威也在那裡,他幾年前去世了,但我記得我參加的第一批研究講座之一是康威關於他所謂的極端證明的講座。
(00:57:28) 所以康威用一種你通常不會想到的方式來思考各種事物,他有一種令人驚嘆的方式。所以他認為證明本身佔據某種空間。所以如果你想證明某件事,比方說有無限多個質數,你有所有不同的證明,但你可以用不同的軸來排列它們。有些證明很優雅,有些證明很長,有些證明很基本等等,所以有這樣一團雲,所以所有證明的空間本身具有某種形狀,所以他對這種形狀的極端點感興趣。在所有這些證明中,哪個是其中一個,最短的,以犧牲其他一切為代價,或者最基本的或任何東西?
(00:58:09) 所以他舉了一些著名的定理為例,然後他會給出他認為在這些不同方面最極端的證明。我發現這真的讓人大開眼界,不僅僅是得到一個有趣的結果的證明,而是一旦你有了這個證明,試圖以各種方式優化它,這個證明本身就帶有某種工藝性。
(00:58:40) 這確實影響了我的寫作風格,就像你做數學作業,當你還是大學生的時候,你的作業等等,你基本上是被鼓勵隨便寫下任何可行的證明並交上去,只要它能得到一個勾,你就可以繼續前進,但如果你希望你的成果真正具有影響力並被人們閱讀,它不能僅僅是正確的。它也應該讓人讀起來感到愉快,有動機,並且可以適應推廣到其他事物。這在許多其他學科中也是一樣的,比如編碼。數學和編碼之間有很多相似之處。我喜歡類比,如果你還沒注意到的話。你可以編寫出可以執行特定任務的義大利麵條式代碼,它快速而骯髒並且有效,但是有很多好的原則可以編寫出好的代碼,以便其他人可以使用它、在此基礎上構建,從而減少錯誤等等,數學也有類似之處。
Lex Fridman
(00:59:37) 是的,首先,那裡有很多美好的事物,而 [聽不清楚 00:59:42] 是有史以來數學界最偉大的思想家之一,以及計算機科學,甚至僅僅考慮證明的空間並說,「好的,這個空間看起來像什麼,極端情況是什麼?」
(00:59:37) 是的,首先,那裡有很多美好的事物,而 [聽不清楚 00:59:42] 是有史以來數學界最偉大的思想家之一,以及計算機科學,甚至僅僅考慮證明的空間並說,「好的,這個空間看起來像什麼,極端情況是什麼?」
(00:59:56) 就像你提到的,以編碼作為類比很有趣,因為也有一種叫做程式碼高爾夫的活動,我也覺得它很美妙和有趣,人們使用不同的程式語言來嘗試編寫盡可能短的程式來完成特定的任務,而且我相信甚至還有關於這個的比賽,這也是一種很好的壓力測試方式,不僅僅是程式,或者在這種情況下是證明,還有不同的語言。也許這是一種不同的符號或任何用於完成不同任務的東西。
陶哲軒
(01:00:31)是啊,你會學到很多。我的意思是,這看起來可能像是一個無聊的練習,但它可以產生所有這些見解,如果你沒有這個人為的目標去追求,你可能不會看到……
(01:00:31)是啊,你會學到很多。我的意思是,這看起來可能像是一個無聊的練習,但它可以產生所有這些見解,如果你沒有這個人為的目標去追求,你可能不會看到……
Lex Fridman
(01:00:43)對你來說,數學中最美麗或優雅的方程式是什麼?我的意思是,人們經常在美中尋找的東西之一是簡單性。所以如果你看看 e=MC2……所以當幾個概念結合在一起時,這就是為什麼歐拉恆等式經常被認為是數學中最美麗的方程式。你覺得那個美嗎?在歐拉恆等式中?
(01:00:43)對你來說,數學中最美麗或優雅的方程式是什麼?我的意思是,人們經常在美中尋找的東西之一是簡單性。所以如果你看看 e=MC2……所以當幾個概念結合在一起時,這就是為什麼歐拉恆等式經常被認為是數學中最美麗的方程式。你覺得那個美嗎?在歐拉恆等式中?
陶哲軒
(01:01:08)是的。嗯,正如我所說,我發現最吸引人的是不同事物之間的聯繫……所以如果你……π 等於負一。所以,是的,人們使用所有基本常數。好吧。我的意思是,這很可愛,但對我來說……
(01:01:08)是的。嗯,正如我所說,我發現最吸引人的是不同事物之間的聯繫……所以如果你……π 等於負一。所以,是的,人們使用所有基本常數。好吧。我的意思是,這很可愛,但對我來說……
(01:01:24)所以指數函數,由歐拉提出,是用來衡量指數增長的。所以複利或衰減,任何持續增長、持續減少的東西,增長和衰減,或膨脹或收縮,都由指數函數建模,而 π 來自圓和旋轉,對吧?例如,如果你想旋轉一根指針一百度,你需要旋轉 π 弧度,而 i,複數,表示 90 度旋轉的交換虛軸。所以方向的改變。
(01:01:53) 所以指數函數代表著你既有方向上的成長和衰退。當你把一個 i 放進指數裡時,現在不是朝著與你目前位置相同的方向移動,而是以與你目前位置成直角的方向移動。所以是旋轉,然後,所以 E 的 pi i 次方等於負一告訴你,如果你旋轉 pi 的時間,你最終會到達另一個方向。所以它通過膨脹和指數增長或動力學,通過複數化的行為,旋轉 pi i,統一幾何學。所以它將數學、動力學、幾何學和複數這四者連接在一起。它們幾乎都被認為是……因為這個恆等式,它們都是數學中隔壁的鄰居。
Lex Fridman
(01:02:37) 你認為你提到的 Q,這些來自不同領域的符號碰撞,只是一個無關緊要的副作用,還是你認為當符號……雖然我們的老朋友們在夜晚相聚時,存在著真正的價值?
(01:02:37) 你認為你提到的 Q,這些來自不同領域的符號碰撞,只是一個無關緊要的副作用,還是你認為當符號……雖然我們的老朋友們在夜晚相聚時,存在著真正的價值?
陶哲軒
(01:02:54) 嗯,這是你擁有正確概念的確認。所以當你第一次學習任何東西時,你必須測量事物,並給它們命名,一開始有時,因為你的模型再次與現實相差太遠,你會給錯誤的東西最好的名字,而你只會在之後才發現什麼是真正重要的。
(01:02:54) 嗯,這是你擁有正確概念的確認。所以當你第一次學習任何東西時,你必須測量事物,並給它們命名,一開始有時,因為你的模型再次與現實相差太遠,你會給錯誤的東西最好的名字,而你只會在之後才發現什麼是真正重要的。
Lex Fridman
(01:03:14) 物理學家有時會這樣做,但結果還可以。
(01:03:14) 物理學家有時會這樣做,但結果還可以。
陶哲軒
(01:03:18) 所以實際上,物理學[聽不清楚 01:03:19] e=MC2。其中一件大事就是 E,對吧?所以當亞里斯多德最初提出他的運動定律,然後是伽利略和牛頓等等,他們看到他們可以測量的東西,他們可以測量質量、加速度和力等等,所以例如牛頓力學,F=ma,是著名的牛頓第二運動定律。所以那些是主要的對象。所以他們在理論中給予它們核心地位。
(01:03:18) 所以實際上,物理學[聽不清楚 01:03:19] e=MC2。其中一件大事就是 E,對吧?所以當亞里斯多德最初提出他的運動定律,然後是伽利略和牛頓等等,他們看到他們可以測量的東西,他們可以測量質量、加速度和力等等,所以例如牛頓力學,F=ma,是著名的牛頓第二運動定律。所以那些是主要的對象。所以他們在理論中給予它們核心地位。
(01:03:44) 只是在人們開始分析這些方程式之後,才發現似乎總是有這些守恆的量。特別是動量和能量,而且事物具有能量並非顯而易見。這不是你可以像測量質量和速度一樣直接測量的東西,所以兩者都是,但隨著時間的推移,人們意識到這實際上是一個非常基本的概念。
(01:04:05) 漢密爾頓最終在 19 世紀將牛頓的物理定律重新表述為所謂的漢密爾頓力學,其中能量(現在稱為漢密爾頓量)是主要對象。一旦你知道如何測量任何系統的漢密爾頓量,你就可以完整地描述動力學,就像所有狀態會發生什麼一樣。它確實是一個核心角色,這最初並不明顯,而這種觀點的轉變在量子力學出現時確實有所幫助,因為早期研究量子力學的物理學家在試圖調整他們的牛頓思維時遇到了很多麻煩,因為一切都是粒子等等,對於量子力學來說,因為一切都是波,但它看起來真的很奇怪。
(01:04:51) 你問:「F=ma 的量子版本是什麼?」,要給出一個答案真的非常困難,但事實證明,漢密爾頓量在古典力學中隱藏在幕後,它也是量子力學中的關鍵對象,那裡也有一個稱為漢密爾頓量的對象。它是一種不同類型的對象。它被稱為算符而不是函數,但同樣,一旦你指定了它,你就指定了整個動力學。
(01:05:17) 所以有一個叫做薛丁格方程式的東西,它會告訴你一旦你有了哈密頓量,量子系統是如何演化的。所以並排來看,它們看起來是完全不同的物體。一個涉及粒子,一個涉及波等等,但有了這種中心性,你實際上可以開始將許多來自古典力學的直覺和事實轉移到量子力學中。例如,在古典力學中,有一種叫做諾特定理的東西。每次物理系統中存在對稱性時,就存在守恆定律。所以物理定律是平移不變的。就像如果我向左移動十步,我所經歷的物理定律和我現在在這裡所經歷的一樣,這對應於動量守恆。如果我轉身一定的角度,我仍然會經歷相同的物理定律。這對應於角動量守恆。如果我等十分鐘,我還是有相同的物理定律。
陶哲軒
(01:06:00) 如果我等十分鐘,我還是有相同的物理定律。所以存在時間平移不變性。這對應於能量守恆定律。所以對稱性和守恆之間存在著這種基本的聯繫。這在量子力學中也是如此,即使方程式完全不同,但由於它們都來自哈密頓量,哈密頓量控制著一切,每次哈密頓量具有對稱性時,方程式就會具有守恆壁。一旦你掌握了正確的語言,它實際上會使事情變得更加清晰。
(01:06:00) 如果我等十分鐘,我還是有相同的物理定律。所以存在時間平移不變性。這對應於能量守恆定律。所以對稱性和守恆之間存在著這種基本的聯繫。這在量子力學中也是如此,即使方程式完全不同,但由於它們都來自哈密頓量,哈密頓量控制著一切,每次哈密頓量具有對稱性時,方程式就會具有守恆壁。一旦你掌握了正確的語言,它實際上會使事情變得更加清晰。
(01:06:32) 我們無法統一量子力學和廣義相對論的原因之一是,我們還沒有弄清楚基本物件是什麼。例如,我們必須放棄空間和時間是這些幾乎是歐幾里得類型空間的概念,而且必須是,我們知道在非常小的尺度上會存在量子漲落。存在時空泡沫,並且試圖使用笛卡爾坐標 X、Y、Z。這是行不通的,但我們不知道用什麼來代替它。我們實際上沒有概念,沒有可以組織一切的類比哈密頓量。
萬有理論
Lex Fridman
(01:07:09) 你的直覺是否認為存在一種萬有理論,所以這甚至有可能統一,找到這種統一廣義相對論和量子力學的語言?
(01:07:09) 你的直覺是否認為存在一種萬有理論,所以這甚至有可能統一,找到這種統一廣義相對論和量子力學的語言?
陶哲軒
(01:07:19) 我相信會的。物理學的歷史一直都像數學一樣,都在尋求統一。在過去,[聽不清楚 01:07:26] 磁學是獨立的理論,然後馬克士威將它們統一了。牛頓統一了天體的運動和地球上物體的運動等等。所以這應該會發生。只不過,再回到觀察和理論這個模型,我們的部分問題是物理學是它自己成功的受害者。我們現有的兩大物理學理論,廣義相對論和量子力學,都非常優秀,它們加起來涵蓋了我們所能做的所有觀察的 99.9%。你必須要么進行極其瘋狂的粒子加速,要么研究早期宇宙,要么研究那些非常難以測量的東西,才能從這兩個理論中得到任何偏差,進而找出如何將它們結合在一起。但我相信我們已經做了幾個世紀了,而且我們之前也取得了進展。我們沒有理由停下來。
(01:07:19) 我相信會的。物理學的歷史一直都像數學一樣,都在尋求統一。在過去,[聽不清楚 01:07:26] 磁學是獨立的理論,然後馬克士威將它們統一了。牛頓統一了天體的運動和地球上物體的運動等等。所以這應該會發生。只不過,再回到觀察和理論這個模型,我們的部分問題是物理學是它自己成功的受害者。我們現有的兩大物理學理論,廣義相對論和量子力學,都非常優秀,它們加起來涵蓋了我們所能做的所有觀察的 99.9%。你必須要么進行極其瘋狂的粒子加速,要么研究早期宇宙,要么研究那些非常難以測量的東西,才能從這兩個理論中得到任何偏差,進而找出如何將它們結合在一起。但我相信我們已經做了幾個世紀了,而且我們之前也取得了進展。我們沒有理由停下來。
Lex Fridman
(01:08:18) 你認為你會成為一個發展出萬有理論的數學家嗎?
(01:08:18) 你認為你會成為一個發展出萬有理論的數學家嗎?
陶哲軒
(01:08:24) 通常發生的情況是,當物理學家需要一些數學理論時,往往有一些數學家早先研究出來的前身。所以當愛因斯坦開始意識到空間是彎曲的時候,他去找了一些數學家,問道:「有沒有一些關於彎曲空間的理論是數學家已經提出的,而且可能是有用的?」然後他們說:「喔,是的,我想黎曼提出了一些東西。」所以是的,黎曼已經發展出了黎曼幾何,這正是一種以各種一般方式彎曲的空間理論,結果幾乎完全是愛因斯坦理論所需要的。這又回到了數學的弱點和不合理的有效性。我認為那些運行良好、解釋宇宙的理論,往往也涉及到那些能夠很好地解決數學問題的相同的數學對象。最終,它們都只是以有用的方式組織數據的方法。
(01:08:24) 通常發生的情況是,當物理學家需要一些數學理論時,往往有一些數學家早先研究出來的前身。所以當愛因斯坦開始意識到空間是彎曲的時候,他去找了一些數學家,問道:「有沒有一些關於彎曲空間的理論是數學家已經提出的,而且可能是有用的?」然後他們說:「喔,是的,我想黎曼提出了一些東西。」所以是的,黎曼已經發展出了黎曼幾何,這正是一種以各種一般方式彎曲的空間理論,結果幾乎完全是愛因斯坦理論所需要的。這又回到了數學的弱點和不合理的有效性。我認為那些運行良好、解釋宇宙的理論,往往也涉及到那些能夠很好地解決數學問題的相同的數學對象。最終,它們都只是以有用的方式組織數據的方法。
Lex Fridman
(01:09:17) 就感覺好像你可能需要去到某個很奇怪的領域,那裡非常難以直觀理解。你有弦論。
(01:09:17) 就感覺好像你可能需要去到某個很奇怪的領域,那裡非常難以直觀理解。你有弦論。
陶哲軒
(01:09:25) 對,弦論在過去幾十年裡一直是個領先的候選者。但我認為它正在慢慢地退出流行。它與實驗不符。
(01:09:25) 對,弦論在過去幾十年裡一直是個領先的候選者。但我認為它正在慢慢地退出流行。它與實驗不符。
Lex Fridman
(01:09:33) 所以,當然,其中一個巨大的挑戰,就像你說的,是因為這兩種理論都非常有效,實驗非常困難。但另一個挑戰是,你不僅僅是偏離了時空。你正在進入一些瘋狂的維度。你正在做各種奇怪的事情,對我們來說,我們已經離我們開始時的那個平坦地球太遠了,就像你提到的,現在我們很難用我們有限的,作為猿類後代的認知能力,來直觀地理解那個現實到底是什麼。
(01:09:33) 所以,當然,其中一個巨大的挑戰,就像你說的,是因為這兩種理論都非常有效,實驗非常困難。但另一個挑戰是,你不僅僅是偏離了時空。你正在進入一些瘋狂的維度。你正在做各種奇怪的事情,對我們來說,我們已經離我們開始時的那個平坦地球太遠了,就像你提到的,現在我們很難用我們有限的,作為猿類後代的認知能力,來直觀地理解那個現實到底是什麼。
陶哲軒
(01:10:10) 這就是為什麼類比如此重要。所以,是的,圓形地球並不直觀,因為我們被困在它上面。但一般來說,我們對圓形物體有相當好的直覺,我們對光線的運作等等也很有興趣。而實際上,做一個好的練習是,實際計算出日食和月亮的陰晴圓缺等等,如何能被圓形地球和圓形月亮的模型輕鬆解釋。你可以拿一個籃球和一個高爾夫球,以及一個光源,然後自己做這些事情。所以直覺是存在的,但你必須轉移它。
(01:10:10) 這就是為什麼類比如此重要。所以,是的,圓形地球並不直觀,因為我們被困在它上面。但一般來說,我們對圓形物體有相當好的直覺,我們對光線的運作等等也很有興趣。而實際上,做一個好的練習是,實際計算出日食和月亮的陰晴圓缺等等,如何能被圓形地球和圓形月亮的模型輕鬆解釋。你可以拿一個籃球和一個高爾夫球,以及一個光源,然後自己做這些事情。所以直覺是存在的,但你必須轉移它。
Lex Fridman
(01:10:47) 從平坦到球狀地球,這對我們來說是智識上的一大躍進,因為我們大部分的生活都生活在平坦的土地上。要載入這些資訊,而我們都覺得理所當然。我們認為很多事情都是理所當然的,因為科學已經為這類事情建立了大量的證據,但我們卻是在太空中飛行的球狀岩石上。沒錯,這是一大躍進。而且你必須經歷一連串的躍進。我們進展得越多,就越多。
(01:10:47) 從平坦到球狀地球,這對我們來說是智識上的一大躍進,因為我們大部分的生活都生活在平坦的土地上。要載入這些資訊,而我們都覺得理所當然。我們認為很多事情都是理所當然的,因為科學已經為這類事情建立了大量的證據,但我們卻是在太空中飛行的球狀岩石上。沒錯,這是一大躍進。而且你必須經歷一連串的躍進。我們進展得越多,就越多。
陶哲軒
(01:11:15) 沒錯,是的。所以現代科學也許,再次地,是它自身成功的受害者,為了更準確,它必須越來越遠離你最初的直覺。因此,對於沒有經歷過完整科學教育過程的人來說,它看起來會更加可疑。所以我們需要更多的基礎。有些科學家做了很棒的推廣工作,但有很多科學的東西你可以在家裡做。我最近在 YouTube 上做了一個 YouTube 影片,Grant Sanderson,我們之前談到過他,關於古希臘人如何能夠測量像月球的距離、地球的距離,以及使用你也可以自己複製的技術。它不一定都要是花哨的太空望遠鏡和非常嚇人的數學。
(01:11:15) 沒錯,是的。所以現代科學也許,再次地,是它自身成功的受害者,為了更準確,它必須越來越遠離你最初的直覺。因此,對於沒有經歷過完整科學教育過程的人來說,它看起來會更加可疑。所以我們需要更多的基礎。有些科學家做了很棒的推廣工作,但有很多科學的東西你可以在家裡做。我最近在 YouTube 上做了一個 YouTube 影片,Grant Sanderson,我們之前談到過他,關於古希臘人如何能夠測量像月球的距離、地球的距離,以及使用你也可以自己複製的技術。它不一定都要是花哨的太空望遠鏡和非常嚇人的數學。
Lex Fridman
(01:12:01) 是的,我非常推薦。我相信您做過一場演講,而且也和 Grant 製作了一部非常棒的影片。嘗試把自己置身於那個時代的人的思維之中,那是一種很棒的體驗,那個時代充滿了神秘感。你身處於這個星球上,你不知道它的形狀、大小。你看到一些星星,你看到一些事物,然後你試著在這個世界上定位自己,並且試著對遙遠的地方做出一些概括性的描述。
(01:12:01) 是的,我非常推薦。我相信您做過一場演講,而且也和 Grant 製作了一部非常棒的影片。嘗試把自己置身於那個時代的人的思維之中,那是一種很棒的體驗,那個時代充滿了神秘感。你身處於這個星球上,你不知道它的形狀、大小。你看到一些星星,你看到一些事物,然後你試著在這個世界上定位自己,並且試著對遙遠的地方做出一些概括性的描述。
陶哲軒
(01:12:29) 轉換視角非常重要。常言道,旅行開闊視野,這是一種智識上的旅行。把自己放在古希臘人或任何其他時代的人的思維裡,提出假設,球形的[聽不清楚 01:12:41],諸如此類的,進行推測。這就是數學家所做的事情,以及一些其他的,實際上也是藝術家所做的事情。
(01:12:29) 轉換視角非常重要。常言道,旅行開闊視野,這是一種智識上的旅行。把自己放在古希臘人或任何其他時代的人的思維裡,提出假設,球形的[聽不清楚 01:12:41],諸如此類的,進行推測。這就是數學家所做的事情,以及一些其他的,實際上也是藝術家所做的事情。
Lex Fridman
(01:12:48) 在極端的限制下,你仍然可以說出非常有力的話語,這真是令人難以置信。這就是它鼓舞人心的地方。回顧歷史,當你沒有太多資源可以進行研究時,有多少東西是可以被發現的。
(01:12:48) 在極端的限制下,你仍然可以說出非常有力的話語,這真是令人難以置信。這就是它鼓舞人心的地方。回顧歷史,當你沒有太多資源可以進行研究時,有多少東西是可以被發現的。
陶哲軒
(01:13:01) 如果你提出公理,那麼數學就會成立。你遵循這些公理得出結論,有時你可以從最初的假設中走得很遠。
(01:13:01) 如果你提出公理,那麼數學就會成立。你遵循這些公理得出結論,有時你可以從最初的假設中走得很遠。
廣義相對論
Lex Fridman
(01:13:10) 如果我們能繼續停留在奇異的領域。你提到了廣義相對論。你對愛因斯坦場方程的數學理解做出了貢獻。你能解釋一下這項工作,並從數學的角度來看,廣義相對論有哪些方面讓你覺得有趣?又有哪些方面對你來說具有挑戰性?
(01:13:10) 如果我們能繼續停留在奇異的領域。你提到了廣義相對論。你對愛因斯坦場方程的數學理解做出了貢獻。你能解釋一下這項工作,並從數學的角度來看,廣義相對論有哪些方面讓你覺得有趣?又有哪些方面對你來說具有挑戰性?
陶哲軒
(01:13:31) 我研究過一些方程式。有一種叫做波映射方程式或 Sigma 場模型,它不完全是時空重力本身的方程式,而是可能存在於時空之上的某些場的方程式。所以愛因斯坦的相對論方程式只是描述空間和時間本身。但還有其他存在於其之上的場。有電磁場,有稱為楊-米爾斯場的東西,還有這個不同的方程式的整個層次結構,其中愛因斯坦的方程式被認為是最非線性且最困難的方程式之一,但在層次結構中相對較低的是這個叫做波映射方程式的東西。所以它是一個波,在任何給定點都固定在一個球體上。所以我可以想像空間和時間中的一堆箭頭。是的,所以它指向不同的方向,但它們像波一樣傳播。如果你擺動一個箭頭,它會傳播並使所有的箭頭移動,有點像麥田裡的麥穗。
(01:13:31) 我研究過一些方程式。有一種叫做波映射方程式或 Sigma 場模型,它不完全是時空重力本身的方程式,而是可能存在於時空之上的某些場的方程式。所以愛因斯坦的相對論方程式只是描述空間和時間本身。但還有其他存在於其之上的場。有電磁場,有稱為楊-米爾斯場的東西,還有這個不同的方程式的整個層次結構,其中愛因斯坦的方程式被認為是最非線性且最困難的方程式之一,但在層次結構中相對較低的是這個叫做波映射方程式的東西。所以它是一個波,在任何給定點都固定在一個球體上。所以我可以想像空間和時間中的一堆箭頭。是的,所以它指向不同的方向,但它們像波一樣傳播。如果你擺動一個箭頭,它會傳播並使所有的箭頭移動,有點像麥田裡的麥穗。
(01:14:27) 我對全局正則性問題感興趣。同樣針對這個問題,這裡的能量有可能集中在一個點嗎?所以我考慮的方程式實際上被稱為臨界方程式,在所有尺度上的行為大致相同。我勉強能夠證明你實際上無法強迫所有能量集中在一個點的情景,能量必須在瞬間分散一點,只是一點點。它會保持正則。是的,這是在 2000 年。這也是我後來對[聽不清楚 01:14:58]產生興趣的部分原因。所以我開發了一些技術來解決這個問題。部分原因是,由於球體的曲率,這個問題實際上是非線性的。存在某種非線性效應,這是一種非微擾效應。當你正常觀察它時,它看起來比波動方程式的線性效應更大。所以即使你的能量很小,也很難控制住一切。
(01:15:23) 但我開發了一種叫做規範轉換的東西。所以這個方程式有點像是麥穗的演變,它們都在來回彎曲,所以有很多運動。但如果你想像一下,透過在空間中的不同點連接小攝影機來穩定流動,這些攝影機試圖以一種捕捉大部分運動的方式移動,並且在這種穩定的流動下,流動會變得更加線性。我發現了一種轉換方程式的方法,可以減少非線性效應的量,然後我就能夠解出這個方程式。我在拜訪我在澳洲的阿姨時發現了這個轉換,我試圖理解所有這些場的動力學,但我無法用筆和紙來做,而且我沒有足夠的電腦設備來進行任何電腦模擬。
(01:16:08) 所以我最後閉上眼睛,躺在地板上,想像自己就是這個向量場,然後滾來滾去,試著找出如何改變坐標,讓各個方向的事物都能以合理線性的方式呈現。然後,我阿姨走進來看到我這樣,就問我「你在幹嘛?」。
Lex Fridman
(01:16:28) 答案是,這很複雜。
(01:16:28) 答案是,這很複雜。
陶哲軒
(01:16:30) 「對,對。好啦,好吧。你還年輕,我不問太多。」
(01:16:30) 「對,對。好啦,好吧。你還年輕,我不問太多。」
解決難題
Lex Fridman
(01:16:34) 我必須問一下,當你在思考時,如果可以進入你的思緒,你是如何解決難題的?你是在腦海中視覺化數學物件、符號,還是你在腦海中視覺化什麼?通常你在思考時?
(01:16:34) 我必須問一下,當你在思考時,如果可以進入你的思緒,你是如何解決難題的?你是在腦海中視覺化數學物件、符號,還是你在腦海中視覺化什麼?通常你在思考時?
陶哲軒
(01:16:57) 大量使用紙筆。身為數學家,你會學到一件事,我稱之為策略性作弊。數學的優美之處在於,你可以隨意改變問題和規則。你在其他領域做不到這一點。如果你是工程師,有人說:「在這條河上建造一座橋樑」,你不能說:「我想在這裡建造這座橋樑」,或者「我想用纸而不是鋼來建造它」,但作為數學家,你可以隨心所欲。這就像試圖解決一個擁有無限作弊碼的電腦遊戲。你可以設定,這裡有一個很大的維度。我把它設為一。我將首先解決一維問題。所以有一個主要項和一個誤差項。我將做出球形調用假設[聽不清楚 01:17:45]項為零。
(01:16:57) 大量使用紙筆。身為數學家,你會學到一件事,我稱之為策略性作弊。數學的優美之處在於,你可以隨意改變問題和規則。你在其他領域做不到這一點。如果你是工程師,有人說:「在這條河上建造一座橋樑」,你不能說:「我想在這裡建造這座橋樑」,或者「我想用纸而不是鋼來建造它」,但作為數學家,你可以隨心所欲。這就像試圖解決一個擁有無限作弊碼的電腦遊戲。你可以設定,這裡有一個很大的維度。我把它設為一。我將首先解決一維問題。所以有一個主要項和一個誤差項。我將做出球形調用假設[聽不清楚 01:17:45]項為零。
(01:17:45) 所以解決這些問題的方法,不應該是像鋼鐵人模式一樣,把事情搞到最困難,實際上,你應該用來解決任何合理的數學問題的方式是,如果有十件事讓你的生活變得困難,那就找到一個問題的版本,關掉九個困難,只保留一個,然後解決它。然後你就解決了九個作弊。好,你解決了十個作弊,那遊戲就很簡單了,但你解決了九個作弊。你解決了一個問題,教會你如何應對那個特定的困難。然後你關掉那個,然後打開另一個,然後解決那個。在你學會如何分別解決這十個問題、十個困難之後,你必須開始一次合併幾個。
(01:18:26) 小時候,我看了很多我們文化的香港動作片,其中一件事是,每次有打鬥場面,比方說英雄被一百個壞蛋嘍囉圍攻之類的,但它總是經過精心設計,讓他每次只和一個人打,打敗那個人,然後繼續前進。正因為如此,他才能打敗所有人。但如果他們更聰明一點,直接一擁而上,那樣電影會更糟糕,但他們會贏。
Lex Fridman
(01:19:02) 你通常用筆和紙嗎?還是用電腦和 LaTeX?
(01:19:02) 你通常用筆和紙嗎?還是用電腦和 LaTeX?
陶哲軒
(01:19:08) 實際上,我大多用筆和紙。所以在我的辦公室裡,我有四個巨大的黑板,有時候我必須把我對這個問題的所有了解都寫在四個黑板上,然後坐在我的沙發上,看看整個過程。
(01:19:08) 實際上,我大多用筆和紙。所以在我的辦公室裡,我有四個巨大的黑板,有時候我必須把我對這個問題的所有了解都寫在四個黑板上,然後坐在我的沙發上,看看整個過程。
Lex Fridman
(01:19:20) 都是符號和標記,還是會有繪圖?
(01:19:20) 都是符號和標記,還是會有繪圖?
陶哲軒
(01:19:23) 喔,有很多繪圖,還有很多只有我才看得懂的客製塗鴉。黑板的美妙之處在於你可以擦掉,它是非常有機的東西。我開始越來越多地使用電腦,部分原因是人工智慧讓做一些簡單的程式碼變得容易許多。以前如果我想繪製一個函數,它有點複雜,需要一些迭代或其他東西,我必須回憶起如何設定 Python 程式、迴圈如何運作,然後除錯,這會花我兩個小時等等。但現在我可以在 10 到 15 分鐘內完成。我越來越多地使用電腦來做簡單的探索。
(01:19:23) 喔,有很多繪圖,還有很多只有我才看得懂的客製塗鴉。黑板的美妙之處在於你可以擦掉,它是非常有機的東西。我開始越來越多地使用電腦,部分原因是人工智慧讓做一些簡單的程式碼變得容易許多。以前如果我想繪製一個函數,它有點複雜,需要一些迭代或其他東西,我必須回憶起如何設定 Python 程式、迴圈如何運作,然後除錯,這會花我兩個小時等等。但現在我可以在 10 到 15 分鐘內完成。我越來越多地使用電腦來做簡單的探索。
人工智慧輔助定理證明
Lex Fridman
(01:20:01) 如果可以的話,我們來聊聊人工智慧。也許一個好的切入點是談談一般的電腦輔助證明。你能描述一下 Lean 形式化證明程式語言,以及它如何作為證明助手提供幫助,也許還有你如何開始使用它,以及它如何幫助你嗎?
(01:20:01) 如果可以的話,我們來聊聊人工智慧。也許一個好的切入點是談談一般的電腦輔助證明。你能描述一下 Lean 形式化證明程式語言,以及它如何作為證明助手提供幫助,也許還有你如何開始使用它,以及它如何幫助你嗎?
陶哲軒
(01:20:25) 所以 Lean 是一種電腦語言,很像 Python 和 C 之類的標準語言,只不過大多數語言的重點是用於執行程式碼。程式碼的每一行都有作用,它們會翻轉位元、讓機器人移動,或是在網路上傳送你的文字之類的。所以 Lean 也是一種可以做到這些的語言。它也可以像標準的傳統語言一樣執行,但它也可以產生憑證。像是 Python 這樣的軟體語言可能會進行運算,然後告訴你答案是 7。好,3 加 4 的總和等於 7 嗎?
(01:20:25) 所以 Lean 是一種電腦語言,很像 Python 和 C 之類的標準語言,只不過大多數語言的重點是用於執行程式碼。程式碼的每一行都有作用,它們會翻轉位元、讓機器人移動,或是在網路上傳送你的文字之類的。所以 Lean 也是一種可以做到這些的語言。它也可以像標準的傳統語言一樣執行,但它也可以產生憑證。像是 Python 這樣的軟體語言可能會進行運算,然後告訴你答案是 7。好,3 加 4 的總和等於 7 嗎?
(01:20:59) 但 Lean 不只能產生答案,還能產生證明,證明它是如何得到 3 加 4 等於 7 這個答案的,以及所有相關的步驟。所以它會建立更複雜的物件,不只是陳述,而是附加證明的陳述。每一行程式碼都只是將先前的陳述拼湊起來,以建立新的陳述的一種方式。所以這個概念並不新穎。這些東西稱為證明助理,它們提供的語言可以用來建立相當複雜的數學證明。它們會產生這些憑證,如果信任 Lean 的編譯器,就能 100% 保證你的論證是正確的,而且他們讓編譯器變得非常小,而且 Lean 有好幾種不同的編譯器可用。
Lex Fridman
(01:21:45) 你可以跟人們稍微說明一下用筆在紙上寫字和使用 Lean 程式語言之間的差異嗎?將陳述形式化有多困難?
(01:21:45) 你可以跟人們稍微說明一下用筆在紙上寫字和使用 Lean 程式語言之間的差異嗎?將陳述形式化有多困難?
陶哲軒
(01:21:56) 很多數學家都有參與 Lean 的設計。所以它的設計方式是讓程式碼的每一行都像是數學論證的每一行。你可能想要引入一個變數,你想要證明一個矛盾。你可以做各種標準的事情,而且它是這樣寫的。所以理想情況下,應該會有一對一的對應關係。實際上並非如此,因為 Lean 正在向一位極度迂腐的同事解釋一個證明,這位同事會指出:「好,你真的是這個意思嗎?如果這是零會怎麼樣?好,你如何證明這一點?」所以 Lean 裡面有很多自動化功能,試圖減少煩人的情況。例如,每個數學物件都必須帶有一個類型。如果我談論 X,X 是一個實數、自然數還是函數之類的?如果你用非正式的方式書寫,通常是因為你有上下文。你會說:「顯然 X 等於讓 X 成為 Y 和 Z 的總和,而 Y 和 Z 已經是實數,所以 X 也應該是實數。」所以 Lean 可以做到很多這樣的程度,但它偶爾會說,等一下,你可以告訴我更多關於這個物件的事情嗎?它是什麼類型的物件?你必須在哲學層面思考更多,不只是你在進行的運算,而是在某種意義上每個物件實際上是什麼。
(01:21:56) 很多數學家都有參與 Lean 的設計。所以它的設計方式是讓程式碼的每一行都像是數學論證的每一行。你可能想要引入一個變數,你想要證明一個矛盾。你可以做各種標準的事情,而且它是這樣寫的。所以理想情況下,應該會有一對一的對應關係。實際上並非如此,因為 Lean 正在向一位極度迂腐的同事解釋一個證明,這位同事會指出:「好,你真的是這個意思嗎?如果這是零會怎麼樣?好,你如何證明這一點?」所以 Lean 裡面有很多自動化功能,試圖減少煩人的情況。例如,每個數學物件都必須帶有一個類型。如果我談論 X,X 是一個實數、自然數還是函數之類的?如果你用非正式的方式書寫,通常是因為你有上下文。你會說:「顯然 X 等於讓 X 成為 Y 和 Z 的總和,而 Y 和 Z 已經是實數,所以 X 也應該是實數。」所以 Lean 可以做到很多這樣的程度,但它偶爾會說,等一下,你可以告訴我更多關於這個物件的事情嗎?它是什麼類型的物件?你必須在哲學層面思考更多,不只是你在進行的運算,而是在某種意義上每個物件實際上是什麼。
Lex Fridman
(01:23:17) 他是用類似 LLMs 的東西來做類型推斷,還是你用實數來匹配?
(01:23:17) 他是用類似 LLMs 的東西來做類型推斷,還是你用實數來匹配?
陶哲軒
(01:23:23) 它是使用更傳統的,所謂的傳統 AI。你可以把所有這些東西表示為樹,並且總是有算法可以將一棵樹匹配到另一棵樹。
(01:23:23) 它是使用更傳統的,所謂的傳統 AI。你可以把所有這些東西表示為樹,並且總是有算法可以將一棵樹匹配到另一棵樹。
Lex Fridman
(01:23:30) 所以實際上可以弄清楚某個東西是實數還是自然數。
(01:23:30) 所以實際上可以弄清楚某個東西是實數還是自然數。
陶哲軒
(01:23:36) 每個對象都帶有它來自哪裡的歷史,你可以追蹤它。
(01:23:36) 每個對象都帶有它來自哪裡的歷史,你可以追蹤它。
Lex Fridman
(01:23:40) 哦,我明白了。
(01:23:40) 哦,我明白了。
陶哲軒
(01:23:41) 是的。所以它的設計目標是可靠性。現代人工智慧並未應用於此,這是個獨立的技術。人們開始在 Lean 之上使用人工智慧。當數學家試圖在 Lean 中編寫證明時,通常會有一個步驟。好,現在我想用微積分的基本定理,比如說,來進行下一步。所以 Lean 的開發者們建立了一個名為 Mathlib 的大型專案,它收集了數以萬計關於數學物件的有用事實。
(01:23:41) 是的。所以它的設計目標是可靠性。現代人工智慧並未應用於此,這是個獨立的技術。人們開始在 Lean 之上使用人工智慧。當數學家試圖在 Lean 中編寫證明時,通常會有一個步驟。好,現在我想用微積分的基本定理,比如說,來進行下一步。所以 Lean 的開發者們建立了一個名為 Mathlib 的大型專案,它收集了數以萬計關於數學物件的有用事實。
(01:24:09) 其中某處包含了微積分基本定理,但你需要找到它。所以現在的瓶頸實際上是引理搜尋。你知道某個工具就在那裡,但你需要找到它。所以有一些專門用於 Mathlib 的搜尋引擎可以使用,但現在也有大型語言模型,你可以說:「我現在需要微積分基本定理。」然後它可能會說,好的。例如,當我編碼時,我安裝了 GitHub Copilot 作為我的 IDE 的插件,它會掃描我的文字,並查看我需要什麼。我甚至可能會輸入,現在我需要使用微積分基本定理。然後它可能會建議:「好的,試試這個」,大約有 25% 的時間它會完全奏效。另外有 10% 到 15% 的時間它不會完全奏效,但它已經足夠接近了,我可以說,哦,是的,如果我稍微在這裡和這裡修改一下,它就會奏效。然後有一半的時間它會給我完全是垃圾的東西。但人們開始在上面稍微使用人工智慧,主要是在基本上是花俏的自動完成的層面上,你可以輸入一行證明的一半,它會找到,它會告訴你。
Lex Fridman
(01:25:11) 是的,但一個花俏的,尤其是用大寫字母 F 的花俏,可以消除數學家在從紙筆轉向形式化時可能感受到的一些阻力。
(01:25:11) 是的,但一個花俏的,尤其是用大寫字母 F 的花俏,可以消除數學家在從紙筆轉向形式化時可能感受到的一些阻力。
陶哲軒
(01:25:23) 是的。沒錯。所以現在我估計,形式化一個證明所需的時間和精力大約是寫出來的 10 倍。所以這是可行的,但很煩人。
(01:25:23) 是的。沒錯。所以現在我估計,形式化一個證明所需的時間和精力大約是寫出來的 10 倍。所以這是可行的,但很煩人。
Lex Fridman
(01:25:36) 但有個愛吹毛求疵的同事,不會破壞數學家的氣氛嗎?
(01:25:36) 但有個愛吹毛求疵的同事,不會破壞數學家的氣氛嗎?
陶哲軒
(01:25:42) 對吧?沒錯,如果那只是其中一個面向,但在某些情況下,正式地做事情實際上更令人愉快。所以我形式化了一個定理,並且在最終的陳述中出現了一個常數 12。因此,這個 12 被貫穿於整個證明過程中,並且所有其他必須與最終數字 12 一致的數字都必須經過檢查。因此,我們用數字 12 發表了一篇關於這個定理的論文。然後幾週後,有人說:「喔,我們可以透過修改其中的一些步驟,將這個 12 提高到 11。」而當你在紙筆上進行這種修改時,每次你更改參數,你都必須逐行檢查證明的每一行是否仍然有效。而且可能有一些你沒有完全意識到的微妙之處,一些性質,而不是數字 12,你甚至沒有意識到你在利用它們。所以一個證明可能會在一個微妙的地方崩潰。
(01:25:42) 對吧?沒錯,如果那只是其中一個面向,但在某些情況下,正式地做事情實際上更令人愉快。所以我形式化了一個定理,並且在最終的陳述中出現了一個常數 12。因此,這個 12 被貫穿於整個證明過程中,並且所有其他必須與最終數字 12 一致的數字都必須經過檢查。因此,我們用數字 12 發表了一篇關於這個定理的論文。然後幾週後,有人說:「喔,我們可以透過修改其中的一些步驟,將這個 12 提高到 11。」而當你在紙筆上進行這種修改時,每次你更改參數,你都必須逐行檢查證明的每一行是否仍然有效。而且可能有一些你沒有完全意識到的微妙之處,一些性質,而不是數字 12,你甚至沒有意識到你在利用它們。所以一個證明可能會在一個微妙的地方崩潰。
(01:26:29) 所以我們用常數 12 將這個證明形式化了,然後當這篇新論文出來時,我們說:「喔」,光是形式化這個原始證明就花了三個星期和 20 個人。我說:「現在讓我們把證明更新為 11。」而使用 Lean,你可以在你的標題定理中,將你的 12 改為 11,你運行編譯器,在成千上萬行的程式碼中,有 90% 仍然有效,只有幾個地方會用紅色標示。現在,我無法證明這些步驟是合理的,但它會立即隔離你需要更改的步驟,但你可以跳過所有其他運作良好的部分。
(01:27:04) 而且如果你用良好的程式設計習慣正確地編寫程式,你的大多數程式碼行都不會是紅色的。只有少數地方,如果你不硬式編碼你的常數,而是使用聰明的策略等等,你可以將你需要更改的東西定位在非常短的時間內。所以在一天或兩天內,我們更新了我們的證明,因為這是一個非常快速的過程,你做一個更改。現在有 10 件事不 work。對於每一件事,你做一個更改,現在又有五件事不 work,但這個過程比用筆和紙更順利地收斂。
Lex Fridman
(01:27:40) 這是為了寫作嗎?你能讀懂它嗎?如果其他人有一個證明,你能夠,它與紙本相比如何?
(01:27:40) 這是為了寫作嗎?你能讀懂它嗎?如果其他人有一個證明,你能夠,它與紙本相比如何?
陶哲軒
(01:27:48) 是的,所以證明過程會更長,但每個獨立的部分更容易閱讀。如果你拿起一篇數學論文,跳到第 27 頁,看到第六段,裡面有一行數學式子,我通常無法立即讀懂,因為它假設了各種定義,我必須回頭,可能在 10 頁之前有定義,而且證明分散在各處,你基本上被迫按順序閱讀。不像小說,你可以從中間打開,直接開始閱讀。它有很多上下文。但在[聽不清楚 01:28:23] Lean 中,如果你把游標放在一行程式碼上,那裡的每個物件,你可以把游標移到上面,它會告訴你它是什麼,從哪裡來的,哪裡被驗證過。你可以比翻閱數學論文更容易追溯事物。
(01:27:48) 是的,所以證明過程會更長,但每個獨立的部分更容易閱讀。如果你拿起一篇數學論文,跳到第 27 頁,看到第六段,裡面有一行數學式子,我通常無法立即讀懂,因為它假設了各種定義,我必須回頭,可能在 10 頁之前有定義,而且證明分散在各處,你基本上被迫按順序閱讀。不像小說,你可以從中間打開,直接開始閱讀。它有很多上下文。但在[聽不清楚 01:28:23] Lean 中,如果你把游標放在一行程式碼上,那裡的每個物件,你可以把游標移到上面,它會告訴你它是什麼,從哪裡來的,哪裡被驗證過。你可以比翻閱數學論文更容易追溯事物。
(01:28:34) 所以 Lean 真正實現的一件事,實際上是以一種非常原子化的規模協作證明,這在過去你真的做不到。所以傳統上用筆和紙,當你想與另一位數學家合作時,你可以選擇在黑板上進行,在那裡你可以真正互動,但如果你是透過電子郵件之類的方式進行,基本上,是的,你必須把它們分開。比如說,「我要完成第三節,你做第四節」,但你不能真正同時處理同一件事,同時協作。
(01:29:03) 但透過 Lean,你可以嘗試將證明的一部分形式化,然後說:「我在第 67 行卡住了。我需要證明這個東西,但它不太行得通。這是讓我困擾的三行程式碼。」但因為所有的上下文都在那裡,其他人可以說:「喔,好,我知道你需要做什麼。你需要應用這個技巧或這個工具」,然後你們就可以進行非常原子級別的對話。所以因為 Lean,我可以和世界各地數十人合作,他們大多數我從未親身見過,而且我甚至可能不知道他們在證明領域有多可靠,但 Lean 給了我一個信任憑證,所以我可以進行無信任數學。
Lex Fridman
(01:29:43) 這裡面有很多有趣的問題。首先,你以善於合作聞名。那麼,在合作時,解決數學難題的正確方法是什麼?你們是採用分而治之的方式嗎?還是專注於某個特定部分並集思廣益?
(01:29:43) 這裡面有很多有趣的問題。首先,你以善於合作聞名。那麼,在合作時,解決數學難題的正確方法是什麼?你們是採用分而治之的方式嗎?還是專注於某個特定部分並集思廣益?
陶哲軒
(01:30:05) 通常一開始會有個腦力激盪的過程。數學研究計畫的本質是,當你開始時,你並不知道該如何解決這個問題。這不像工程項目,工程項目的理論已經確立數十年,主要的困難在於實施。你必須弄清楚什麼才是正確的道路。這就是我之前說的「作弊」的意思。就像回到建造橋樑的比喻。首先假設你有無限的預算和無限的人力等等。現在你能建造這座橋樑嗎?好,現在有無限的預算,但只有有限的人力,對吧?現在你能做到嗎?等等。所以,當然沒有工程師能真的這樣做。就像我說的,他們有固定的要求。是的,一開始總會有這種即興會議,你嘗試各種瘋狂的事情,並且做出所有這些不切實際的假設,但你計劃稍後再修正。
(01:30:05) 通常一開始會有個腦力激盪的過程。數學研究計畫的本質是,當你開始時,你並不知道該如何解決這個問題。這不像工程項目,工程項目的理論已經確立數十年,主要的困難在於實施。你必須弄清楚什麼才是正確的道路。這就是我之前說的「作弊」的意思。就像回到建造橋樑的比喻。首先假設你有無限的預算和無限的人力等等。現在你能建造這座橋樑嗎?好,現在有無限的預算,但只有有限的人力,對吧?現在你能做到嗎?等等。所以,當然沒有工程師能真的這樣做。就像我說的,他們有固定的要求。是的,一開始總會有這種即興會議,你嘗試各種瘋狂的事情,並且做出所有這些不切實際的假設,但你計劃稍後再修正。
(01:30:57) 你試著看看是否有一些可能可行的方法的骨架。然後希望這能將問題分解成更小的子問題,即使你不知道該怎麼做。但接著你專注於子問題。有時不同的合作者更擅長處理某些事情。所以我的一個我為之聞名的主題是 Ben Green 的主題,現在被稱為 Green-Tao 定理。這個定理指出質數包含任意長度的等差數列。這是對他[聽不清楚 01:31:26]的修改。我們的合作方式是 Ben 已經證明了一個類似的結果,適用於長度為三的數列。他證明了某些質數(更精確地說,是質數的某些子集)包含大量的長度為三的等差數列,但他的技術只適用於長度為三的數列。它們不適用於更長的數列。
(01:31:46) 但我有一些來自[聽不清楚 01:31:48]理論的技巧,當時我對這個理論比 Ben 更熟悉。所以如果我可以證明某些與質數相關的集合的隨機性,有一個特定的技術條件,如果我能擁有它,如果 Ben 能提供我這個事實,我就能得出這個定理。但我提出的是一個在數論中非常困難的問題,他說:「我們不可能證明這個。」所以他說:「你能用一個我有可能證明的較弱假設來證明你的定理部分嗎?」他提出了一些他可以證明的東西,但對我來說太弱了。我沒辦法用這個。所以我們之間來來回回地進行了這樣的對話,一個駭客-
Lex Fridman
(01:32:29) 不同的作弊方法是-
(01:32:29) 不同的作弊方法是-
陶哲軒
(01:32:31) 對,對,我想要作弊多一點。他想要作弊少一點,但最終我們找到了一個屬性,A,他可以證明,B,我可以利用,然後我們就可以證明我們的定理。所以這裡面有很多動態。每一次的合作都有一些故事。沒有兩次是相同的。
(01:32:31) 對,對,我想要作弊多一點。他想要作弊少一點,但最終我們找到了一個屬性,A,他可以證明,B,我可以利用,然後我們就可以證明我們的定理。所以這裡面有很多動態。每一次的合作都有一些故事。沒有兩次是相同的。
Lean 程式語言
Lex Fridman
(01:32:51) 另一方面,就像你提到的 Lean 程式設計,情況幾乎完全不同,因為你可以創建,我想你說過,一個問題的藍圖,然後你可以用 Lean 真正地分而治之,你在不同的部分工作,而且他們使用電腦系統的證明檢查器來確保一路上的所有事情都是正確的。
(01:32:51) 另一方面,就像你提到的 Lean 程式設計,情況幾乎完全不同,因為你可以創建,我想你說過,一個問題的藍圖,然後你可以用 Lean 真正地分而治之,你在不同的部分工作,而且他們使用電腦系統的證明檢查器來確保一路上的所有事情都是正確的。
陶哲軒
(01:33:17) 所以它使一切都相容且可信任。是的,所以目前只有少數數學專案可以以這種方式切割。在目前的技術水平下,大多數 Lean 的活動都是在形式化已經由人類證明的證明。數學論文基本上在某種意義上就是一張藍圖。它是將一個困難的陳述,比如一個大定理,分解成一百個小引理,但通常並非所有引理都寫得足夠詳細,以至於每個引理都可以直接形式化。
(01:33:17) 所以它使一切都相容且可信任。是的,所以目前只有少數數學專案可以以這種方式切割。在目前的技術水平下,大多數 Lean 的活動都是在形式化已經由人類證明的證明。數學論文基本上在某種意義上就是一張藍圖。它是將一個困難的陳述,比如一個大定理,分解成一百個小引理,但通常並非所有引理都寫得足夠詳細,以至於每個引理都可以直接形式化。
(01:33:46) 藍圖就像是用非常吹毛求疵的方式撰寫的論文,每個步驟都盡可能詳細地解釋,並且試圖讓每個步驟都是獨立的,或者僅僅依賴於之前已經證明的非常具體的陳述。這樣,生成的藍圖圖中的每個節點都可以獨立處理。你甚至不需要知道整個東西是如何運作的。這就像一個現代供應鏈。如果你想創造一個 iPhone 或其他複雜的物件,沒有人可以單獨建造出一個完整的物件,但你可以有專家,如果他們從其他公司得到一些小零件,他們可以將它們組合起來,形成一個稍微大一點的零件。
Lex Fridman
(01:34:27) 我認為這是一個非常令人興奮的可能性,因為如果你能找到可以用這種方式分解的問題,那麼你就可以擁有成千上萬的貢獻者,對吧?完全分散式的。
(01:34:27) 我認為這是一個非常令人興奮的可能性,因為如果你能找到可以用這種方式分解的問題,那麼你就可以擁有成千上萬的貢獻者,對吧?完全分散式的。
陶哲軒
(01:34:39) 我之前跟你提過理論數學和實驗數學之間的區別。目前大多數數學都是理論性的,只有一小部分是實驗性的。我認為 Lean 這個平台和其他軟體工具,像是 GitHub 之類的東西,將使實驗數學能夠擴展到比我們現在更大的程度。所以現在,如果你想對某種數學模式或其他東西進行任何數學探索,你需要一些程式碼來寫出這個模式。我的意思是,有時候有些電腦代數套件可以提供幫助,但通常只是一個數學家編寫大量的 Python 或其他程式。而且因為編碼是一項容易出錯的活動,所以讓其他人與你合作編寫程式碼模組是不切實際的,因為如果其中一個模組有錯誤,整個東西就不可靠了。所以你會得到這些由非專業程式設計師(數學家)編寫的客製化義大利麵式程式碼,它們笨拙而緩慢。正因為如此,很難真正大量生產實驗結果。
(01:34:39) 我之前跟你提過理論數學和實驗數學之間的區別。目前大多數數學都是理論性的,只有一小部分是實驗性的。我認為 Lean 這個平台和其他軟體工具,像是 GitHub 之類的東西,將使實驗數學能夠擴展到比我們現在更大的程度。所以現在,如果你想對某種數學模式或其他東西進行任何數學探索,你需要一些程式碼來寫出這個模式。我的意思是,有時候有些電腦代數套件可以提供幫助,但通常只是一個數學家編寫大量的 Python 或其他程式。而且因為編碼是一項容易出錯的活動,所以讓其他人與你合作編寫程式碼模組是不切實際的,因為如果其中一個模組有錯誤,整個東西就不可靠了。所以你會得到這些由非專業程式設計師(數學家)編寫的客製化義大利麵式程式碼,它們笨拙而緩慢。正因為如此,很難真正大量生產實驗結果。
(01:35:45) 但我認為透過 Lean,我已經開始了一些專案,我們不僅僅是用數據做實驗,還用證明做實驗。所以我有一個叫做「方程式理論專案」的專案。基本上,我們在抽象代數中產生了大約 2200 萬個小問題。也許我應該先退一步,告訴你這個專案是什麼。好的,所以抽象代數研究的是像乘法、加法這樣的運算以及抽象性質。例如,乘法是可交換的。X 乘以 Y 總是等於 Y 乘以 X,至少對於數字來說是這樣。它也是結合律。X 乘以 Y 乘以 Z 等於 X 乘以 Y 乘以 Z。所以這些運算遵守一些定律,而不遵守其他定律。例如,X 乘以 X 並不總是等於 X。所以這個定律並不總是成立。所以給定任何運算,它遵守一些定律而不遵守其他定律。因此,我們產生了大約 4000 個這些可能的代數定律,某些運算可以滿足這些定律。
(01:36:38) 而我們的問題是,哪些定律可以推導出其他定律,例如,交換律是否意味著結合律?答案是否定的,因為你可以描述一種符合交換律但不符合結合律的運算。因此,透過舉例,你可以證明交換律並不意味著結合律。但是,某些其他定律確實可以透過替換等方式推導出其他定律,你可以寫下一些代數證明。因此,我們研究了這 4,000 個定律之間的所有配對,總共有 2,200 萬個配對。對於每一對,我們都會問,這個定律是否意味著那個定律?如果是,請給出證明。如果不是,請給出反例。所以是 2,200 萬個問題,每一個問題你都可以給一個大學代數學的學生,他們有相當大的機會解決這個問題,儘管其中有一些,至少有 2,200 萬個,大約有一百個左右非常困難,但很多都很容易。這個專案就是要計算出完整的圖,哪些定律可以推導出哪些定律。
Lex Fridman
(01:37:31) 順帶一提,這是一個令人難以置信的專案。真是個好主意,也是一個很好的測試,以如此驚人的規模來測試我們一直在談論的事情。
(01:37:31) 順帶一提,這是一個令人難以置信的專案。真是個好主意,也是一個很好的測試,以如此驚人的規模來測試我們一直在談論的事情。
陶哲軒
(01:37:38) 這在過去是不可行的。文獻中的最新技術大約是 15 個方程式,以及它們如何應用,這已經是人類用筆和紙可以做到的極限。所以你需要擴大規模。因此,你需要群眾外包,但你也需要信任所有的,沒有人可以檢查這 2,200 萬個證明。你需要它被電腦化。因此,它只有在 Lean 的幫助下才成為可能。我們也希望使用大量的人工智慧。所以這個專案幾乎完成了。在這 2,200 萬個問題中,除了兩個之外,都已經解決了。
(01:37:38) 這在過去是不可行的。文獻中的最新技術大約是 15 個方程式,以及它們如何應用,這已經是人類用筆和紙可以做到的極限。所以你需要擴大規模。因此,你需要群眾外包,但你也需要信任所有的,沒有人可以檢查這 2,200 萬個證明。你需要它被電腦化。因此,它只有在 Lean 的幫助下才成為可能。我們也希望使用大量的人工智慧。所以這個專案幾乎完成了。在這 2,200 萬個問題中,除了兩個之外,都已經解決了。
Lex Fridman
(01:38:11) 哇。
陶哲軒
(01:38:12) 實際上,這兩個猜想我們都有筆紙證明,並且正在將其形式化。事實上,今天早上我還在努力完成它,所以我們快完成了。
(01:38:12) 實際上,這兩個猜想我們都有筆紙證明,並且正在將其形式化。事實上,今天早上我還在努力完成它,所以我們快完成了。
Lex Fridman
(01:38:22) 太不可思議了。
(01:38:22) 太不可思議了。
陶哲軒
(01:38:22) 是啊,太棒了。
(01:38:22) 是啊,太棒了。
Lex Fridman
(01:38:25) 你總共找到了多少人?
(01:38:25) 你總共找到了多少人?
陶哲軒
(01:38:26) 大約 50 位,這在數學界被認為是個巨大的數字。
(01:38:26) 大約 50 位,這在數學界被認為是個巨大的數字。
Lex Fridman
(01:38:30) 這真是個巨大的數字,太瘋狂了。
(01:38:30) 這真是個巨大的數字,太瘋狂了。
陶哲軒
(01:38:32) 是的。所以我們將會有一篇由 50 位作者共同署名的論文,並附上詳細的附錄,說明每個人貢獻了什麼。
(01:38:32) 是的。所以我們將會有一篇由 50 位作者共同署名的論文,並附上詳細的附錄,說明每個人貢獻了什麼。
Lex Fridman
(01:38:38) 這裡有個問題,或許可以更廣泛地討論一下。當你擁有一群人時,有沒有辦法按照貢獻者的專業水平來組織他們的貢獻?好吧,我可能問了很多有點異想天開的問題,但我正在想像一群人,也許未來還會有 AI,是否可以建立類似 ELO 等級分的系統?
(01:38:38) 這裡有個問題,或許可以更廣泛地討論一下。當你擁有一群人時,有沒有辦法按照貢獻者的專業水平來組織他們的貢獻?好吧,我可能問了很多有點異想天開的問題,但我正在想像一群人,也許未來還會有 AI,是否可以建立類似 ELO 等級分的系統?
Lex Fridman
(01:39:00) 是否有可能建立一個像 Elo 等級制度,將其遊戲化?
(01:39:00) 是否有可能建立一個像 Elo 等級制度,將其遊戲化?
陶哲軒
(01:39:07) 這些精實專案的美妙之處在於,你可以自動獲得所有這些數據,所以一切都會上傳到 GitHub。GitHub 會追蹤誰貢獻了什麼。所以你可以在之後的任何時間點產生統計數據。你可以說:「喔,這個人貢獻了這麼多行程式碼」等等。這些都是非常粗略的指標。我絕對不希望這成為你終身職審查的一部分。但我的意思是,我認為在企業運算中,人們已經使用其中一些指標來評估員工的績效。同樣地,這個方向對於學術界來說有點可怕。我們不太喜歡指標。
(01:39:07) 這些精實專案的美妙之處在於,你可以自動獲得所有這些數據,所以一切都會上傳到 GitHub。GitHub 會追蹤誰貢獻了什麼。所以你可以在之後的任何時間點產生統計數據。你可以說:「喔,這個人貢獻了這麼多行程式碼」等等。這些都是非常粗略的指標。我絕對不希望這成為你終身職審查的一部分。但我的意思是,我認為在企業運算中,人們已經使用其中一些指標來評估員工的績效。同樣地,這個方向對於學術界來說有點可怕。我們不太喜歡指標。
Lex Fridman
(01:39:49) 然而,學術界也在使用指標。他們只是使用舊的指標,像是論文數量。
(01:39:49) 然而,學術界也在使用指標。他們只是使用舊的指標,像是論文數量。
陶哲軒
(01:39:56) 是的,的確...
(01:39:56) 是的,的確...
Lex Fridman
(01:39:59) 感覺上,這是一個指標,雖然有缺陷,但它正朝著正確的方向發展。對吧。
(01:39:59) 感覺上,這是一個指標,雖然有缺陷,但它正朝著正確的方向發展。對吧。
陶哲軒
(01:40:05) 嗯。
Lex Fridman
(01:40:06) 這很有趣。至少這是一個非常有趣的指標。
(01:40:06) 這很有趣。至少這是一個非常有趣的指標。
陶哲軒
(01:40:08) 是的,我認為研究它很有趣。我認為你可以研究這些是否是更好的預測指標。這裡有個問題叫做古德哈特定律。如果一個統計數據實際上被用來激勵績效,它就會被鑽漏洞,然後它就不再是一個有用的衡量標準。
(01:40:08) 是的,我認為研究它很有趣。我認為你可以研究這些是否是更好的預測指標。這裡有個問題叫做古德哈特定律。如果一個統計數據實際上被用來激勵績效,它就會被鑽漏洞,然後它就不再是一個有用的衡量標準。
Lex Fridman
(01:40:22) 喔,人類啊。總是想玩弄…
(01:40:22) 喔,人類啊。總是想玩弄…
陶哲軒
(01:40:25) 這是很合理的。所以我們這個專案所做的是自我報告。實際上,科學界對於人們貢獻的類型有標準的分類。像是概念、驗證、資源、程式碼等等。大約有十二個左右的標準類別,我們只是要求每位貢獻者… 有一個很大的矩陣,列出所有作者和所有類別,讓他們勾選他們認為自己有貢獻的地方,給出一個大概的想法。例如,你寫了一些程式碼,提供了一些計算資源,但你沒有做任何筆算驗證之類的工作。
(01:40:25) 這是很合理的。所以我們這個專案所做的是自我報告。實際上,科學界對於人們貢獻的類型有標準的分類。像是概念、驗證、資源、程式碼等等。大約有十二個左右的標準類別,我們只是要求每位貢獻者… 有一個很大的矩陣,列出所有作者和所有類別,讓他們勾選他們認為自己有貢獻的地方,給出一個大概的想法。例如,你寫了一些程式碼,提供了一些計算資源,但你沒有做任何筆算驗證之類的工作。
(01:41:02) 我認為這行得通。傳統上,數學家只是按照姓氏的字母順序排列。所以我們不像科學界那樣有「第一作者」和「第二作者」的傳統,我們對此感到自豪。我們讓所有作者的地位平等,但這不能完全擴展到這種規模。十年前,我參與了一些叫做「數學家群體合作計畫」(polymath projects) 的東西。那是一種群眾外包數學,但沒有精實 (lean) 的成分。所以它受到限制,你需要一位人類主持人來實際檢查所有傳入的貢獻是否有效。這實際上是一個巨大的瓶頸,但我們仍然有 10 位左右作者的專案。但當時我們決定,不試圖決定誰做了什麼,而是使用一個假名。所以我們創造了一個叫做 DHJ Polymath 的虛構人物,其精神是效仿 [聽不清楚 01:41:51]。這是 20 世紀一個著名數學家團體的假名。
(01:41:56) 所以論文是以這個假名發表的,所以我們沒有人獲得作者署名。事實證明,這並不是很好,原因有幾個。首先,如果你實際上想被考慮升等或什麼的,你不能在你的… 作為你提交的出版物之一使用這篇論文,因為它沒有正式的作者署名。但我們後來意識到的另一件事是,當人們提到這些專案時,他們自然而然地會提到參與該專案中最著名的人。像是「這是提姆·高爾斯 (Tim Gower) 的數學家群體合作計畫。」「這是陶哲軒 (Terence Tao) 的數學家群體合作計畫」,而沒有提到其他 19 位或更多的參與者。
Lex Fridman
(01:42:36) 喔,對啊。
(01:42:36) 喔,對啊。
陶哲軒
(01:42:37) 所以這次我們嘗試一些不同的做法,讓每個人都是作者,但我們會附上這個矩陣作為附錄,看看效果如何。
(01:42:37) 所以這次我們嘗試一些不同的做法,讓每個人都是作者,但我們會附上這個矩陣作為附錄,看看效果如何。
DeepMind 的 AlphaProof
Lex Fridman
(01:42:45) 這兩個計畫都很棒,光是你參與這麼大型的合作就令人驚嘆。但我記得幾年前看過 Kevin Buzzard 關於 Lean 程式語言的演講,而你說這可能是數學的未來。所以,世界上最偉大的數學家之一擁抱這種似乎正在鋪設數學未來道路的東西,也令人感到興奮。
(01:42:45) 這兩個計畫都很棒,光是你參與這麼大型的合作就令人驚嘆。但我記得幾年前看過 Kevin Buzzard 關於 Lean 程式語言的演講,而你說這可能是數學的未來。所以,世界上最偉大的數學家之一擁抱這種似乎正在鋪設數學未來道路的東西,也令人感到興奮。
(01:43:12) 所以我必須問你關於 AI 整合到整個過程中的問題。DeepMind 的 AlphaProof 透過強化學習,在 IMO 問題的正式 Lean 證明(無論成功或失敗)上進行訓練。所以這算是高階的高中程度?
陶哲軒
(01:43:32) 哦,非常高階,沒錯。
(01:43:32) 哦,非常高階,沒錯。
Lex Fridman
(01:43:33) 很高階、高中程度的數學問題。你怎麼看待這個系統?這個系統能夠證明高中程度的問題,和研究所程度的問題之間,差距在哪裡?
(01:43:33) 很高階、高中程度的數學問題。你怎麼看待這個系統?這個系統能夠證明高中程度的問題,和研究所程度的問題之間,差距在哪裡?
陶哲軒
(01:43:47) 是的,難度隨著證明步驟的增加呈指數級增長。這是一種組合爆炸。大型語言模型的問題在於它們會犯錯,因此如果一個證明有 20 個步驟,而你的 [聽不清楚 01:44:01] 在每一步都犯了 10% 的錯誤率,那麼實際上到達終點的可能性極低。
(01:43:47) 是的,難度隨著證明步驟的增加呈指數級增長。這是一種組合爆炸。大型語言模型的問題在於它們會犯錯,因此如果一個證明有 20 個步驟,而你的 [聽不清楚 01:44:01] 在每一步都犯了 10% 的錯誤率,那麼實際上到達終點的可能性極低。
Lex Fridman
(01:44:09) 實際上,稍微岔個題,將自然語言映射到形式化程式這個問題有多難?
(01:44:09) 實際上,稍微岔個題,將自然語言映射到形式化程式這個問題有多難?
陶哲軒
(01:44:19) 喔,是的。實際上這非常困難。自然語言的容錯率很高。你可以犯一些小的文法錯誤,用第二語言說話,別人也能大致了解你在說什麼。但形式語言,如果你出錯一個小地方,那麼整個句子就沒有意義了。即使是形式語言之間的轉換也非常困難。有不同的、不相容的詞彙和語言。有 Lean,還有 Cox 和 Isabelle 等等。甚至將一個形式化的動作轉換成形式語言,都是一個尚未解決的問題。
(01:44:19) 喔,是的。實際上這非常困難。自然語言的容錯率很高。你可以犯一些小的文法錯誤,用第二語言說話,別人也能大致了解你在說什麼。但形式語言,如果你出錯一個小地方,那麼整個句子就沒有意義了。即使是形式語言之間的轉換也非常困難。有不同的、不相容的詞彙和語言。有 Lean,還有 Cox 和 Isabelle 等等。甚至將一個形式化的動作轉換成形式語言,都是一個尚未解決的問題。
Lex Fridman
(01:44:52) 太令人著迷了。好。但一旦你有了非正式語言,他們就會使用他們經由強化學習(RL)訓練的模型,類似於 AlphaZero,然後試圖開發工具,也有一個模型。我相信幾何問題有一個獨立的模型。
(01:44:52) 太令人著迷了。好。但一旦你有了非正式語言,他們就會使用他們經由強化學習(RL)訓練的模型,類似於 AlphaZero,然後試圖開發工具,也有一個模型。我相信幾何問題有一個獨立的模型。
陶哲軒
(01:44:52) 是的。
Lex Fridman
(01:45:12) 那麼,這個系統讓你印象深刻的地方是什麼?你認為差距在哪裡?
(01:45:12) 那麼,這個系統讓你印象深刻的地方是什麼?你認為差距在哪裡?
陶哲軒
(01:45:18) 沒錯,我們稍早聊過,隨著時間推移,再驚人的事物也會變得稀鬆平常。所以現在不知怎地,幾何學當然成了解決問題的萬靈丹。
(01:45:18) 沒錯,我們稍早聊過,隨著時間推移,再驚人的事物也會變得稀鬆平常。所以現在不知怎地,幾何學當然成了解決問題的萬靈丹。
Lex Fridman
(01:45:27) 沒錯,的確是這樣,的確是這樣。我的意思是,欣賞它仍然很美妙……
(01:45:27) 沒錯,的確是這樣,的確是這樣。我的意思是,欣賞它仍然很美妙……
陶哲軒
(01:45:31) 沒錯,這些是很棒的研究,展示了什麼是可能的。但這種方法目前無法擴展。Google 伺服器三天才能解決一個高中數學格式問題。這不是一個可擴展的前景,尤其是隨著複雜性增加,呈指數級增長。
(01:45:31) 沒錯,這些是很棒的研究,展示了什麼是可能的。但這種方法目前無法擴展。Google 伺服器三天才能解決一個高中數學格式問題。這不是一個可擴展的前景,尤其是隨著複雜性增加,呈指數級增長。
Lex Fridman
(01:45:49) 我們應該提到,他們獲得了銀牌表現。相當於銀牌表現的成績。
(01:45:49) 我們應該提到,他們獲得了銀牌表現。相當於銀牌表現的成績。
陶哲軒
(01:45:55) 首先,他們花費的時間遠遠超過了分配的時間,而且他們有這個輔助工具,人類開始協助形式化,但他們也給自己解決方案的滿分,我想這是經過正式驗證的。所以我想這很公平。目前有一些努力,未來會有一項提案,實際舉辦一個 AI 數學奧林匹亞競賽,在人類參賽者拿到實際的奧林匹亞問題的同時,AI 也會拿到同樣的問題,同樣的時間限制,而產出的結果必須由同一批評審來評分,這意味著它必須以自然語言而不是形式語言來書寫。
(01:45:55) 首先,他們花費的時間遠遠超過了分配的時間,而且他們有這個輔助工具,人類開始協助形式化,但他們也給自己解決方案的滿分,我想這是經過正式驗證的。所以我想這很公平。目前有一些努力,未來會有一項提案,實際舉辦一個 AI 數學奧林匹亞競賽,在人類參賽者拿到實際的奧林匹亞問題的同時,AI 也會拿到同樣的問題,同樣的時間限制,而產出的結果必須由同一批評審來評分,這意味著它必須以自然語言而不是形式語言來書寫。
Lex Fridman
(01:46:37) 喔,我希望這能成真。我希望這次的 IMO 能順利舉行。我希望下一次也能。
(01:46:37) 喔,我希望這能成真。我希望這次的 IMO 能順利舉行。我希望下一次也能。
陶哲軒
(01:46:41) 這次國際數學奧林匹亞競賽(IMO)不會發生這種事。在時限內,AI 的表現還不夠好。但還有規模較小的競賽,有些競賽的答案是一個數字,而不是長篇證明。而 AI 在有明確數字答案的問題上,實際上表現更好,因為它很容易進行強化學習。 你得到了正確答案,你得到了錯誤答案。」這是一個非常明確的信號,但長篇證明要么是形式化的,然後 Lean 可以給它贊成或反對,要么是非形式化的,但你需要人類來創建它並判斷。如果你想進行數十億次的強化學習,你不可能僱用足夠的人來評分。光是對人們收到的常規文本進行語言模型的強化學習就已經夠困難了。但現在我們實際上要僱用人員,而不僅僅是給予贊成或反對,而是要實際在數學上檢查輸出結果,這樣做太昂貴了。
(01:46:41) 這次國際數學奧林匹亞競賽(IMO)不會發生這種事。在時限內,AI 的表現還不夠好。但還有規模較小的競賽,有些競賽的答案是一個數字,而不是長篇證明。而 AI 在有明確數字答案的問題上,實際上表現更好,因為它很容易進行強化學習。 你得到了正確答案,你得到了錯誤答案。」這是一個非常明確的信號,但長篇證明要么是形式化的,然後 Lean 可以給它贊成或反對,要么是非形式化的,但你需要人類來創建它並判斷。如果你想進行數十億次的強化學習,你不可能僱用足夠的人來評分。光是對人們收到的常規文本進行語言模型的強化學習就已經夠困難了。但現在我們實際上要僱用人員,而不僅僅是給予贊成或反對,而是要實際在數學上檢查輸出結果,這樣做太昂貴了。
人類數學家 vs. AI
Lex Fridman
(01:47:45) 所以,如果我們探索這個可能的未來,人類在數學中最特別的地方是什麼?你認為人工智慧在一段時間內還無法破解的是什麼?是發明新理論嗎?是提出新猜想,還是證明這些猜想?是建立新的抽象概念?新的表述方式?或許人工智慧會在看到不同領域之間的新聯繫時,產生一個轉捩點?
(01:47:45) 所以,如果我們探索這個可能的未來,人類在數學中最特別的地方是什麼?你認為人工智慧在一段時間內還無法破解的是什麼?是發明新理論嗎?是提出新猜想,還是證明這些猜想?是建立新的抽象概念?新的表述方式?或許人工智慧會在看到不同領域之間的新聯繫時,產生一個轉捩點?
陶哲軒
(01:48:17) 這是個好問題。我認為隨著時間的推移,數學家的工作本質已經發生了很大的變化。一千年前,數學家必須計算復活節的日期,他們進行了非常複雜的計算,但現在這些都已經自動化了,例如世紀的順序,我們不再需要這樣做了。他們過去常常用球面三角學來導航,以便了解如何從舊世界到達新世界,進行非常複雜的計算。同樣地,這些也已經自動化了。甚至在人工智慧出現之前,許多大學程度的數學,例如 Wolfram Alpha。它不是一個語言模型,但它可以解決許多大學程度的數學任務。因此,在計算方面,驗證例行事項,例如遇到一個問題,然後說:「這是一個偏微分方程式的問題,你可以用 20 種標準技術中的任何一種來解決它嗎?」然後它會說:「是的,我已經嘗試了所有 20 種技術,這是 100 種不同的排列組合和我的結果。」
(01:48:17) 這是個好問題。我認為隨著時間的推移,數學家的工作本質已經發生了很大的變化。一千年前,數學家必須計算復活節的日期,他們進行了非常複雜的計算,但現在這些都已經自動化了,例如世紀的順序,我們不再需要這樣做了。他們過去常常用球面三角學來導航,以便了解如何從舊世界到達新世界,進行非常複雜的計算。同樣地,這些也已經自動化了。甚至在人工智慧出現之前,許多大學程度的數學,例如 Wolfram Alpha。它不是一個語言模型,但它可以解決許多大學程度的數學任務。因此,在計算方面,驗證例行事項,例如遇到一個問題,然後說:「這是一個偏微分方程式的問題,你可以用 20 種標準技術中的任何一種來解決它嗎?」然後它會說:「是的,我已經嘗試了所有 20 種技術,這是 100 種不同的排列組合和我的結果。」
(01:49:12) 我認為這種類型的事情會運作得很好,一旦解決了一個問題,就可以擴展到讓人工智慧攻擊一百個相鄰的問題。人類仍然在做的事情...... 所以人工智慧現在真正掙扎的地方是,它不知道自己什麼時候走錯了方向。它可以說:「哦,我要解決這個問題。我要把這個問題分成這兩個情況。我要嘗試這個技術。」 有時,如果你幸運的話,這是一個簡單的問題,這是正確的技術,你就可以解決這個問題,但有時它會遇到一個問題,它會提出一個完全是胡說八道的方案,但看起來像是一個證明。
(01:49:53) 所以這就是 LLM 生成數學中一件令人惱火的事情。是的,我們已經有過人類生成的低品質數學內容,像是那些沒有受過正式訓練的投稿等等,但如果人類的證明很糟糕,你可以很快地判斷出來。它會犯非常基本的錯誤。但是 AI 生成的證明,它們表面上看起來可能完美無瑕。部分原因是強化學習實際上訓練它們去做的事情,是產生看起來正確的東西,這對於許多應用來說已經足夠好了。所以這些錯誤通常非常細微,然後當你發現它們時,它們卻又非常愚蠢。就像沒有人會真的犯那種錯誤。
Lex Fridman
(01:50:36) 是的,這在程式設計的環境中實際上非常令人沮喪,因為我編寫很多程式,而且,當人類編寫低品質的程式碼時,會有一種叫做「程式碼異味」的東西,對吧?你可以立即看出有一些跡象,但是使用 AI 生成的程式碼……
(01:50:36) 是的,這在程式設計的環境中實際上非常令人沮喪,因為我編寫很多程式,而且,當人類編寫低品質的程式碼時,會有一種叫做「程式碼異味」的東西,對吧?你可以立即看出有一些跡象,但是使用 AI 生成的程式碼……
陶哲軒
(01:50:53) [聽不清楚 01:50:53]。
(01:50:53) [聽不清楚 01:50:53]。
Lex Fridman
(01:50:52) 你說得對,最終你會發現一個明顯的愚蠢錯誤,但它看起來就像是好的程式碼。
(01:50:52) 你說得對,最終你會發現一個明顯的愚蠢錯誤,但它看起來就像是好的程式碼。
陶哲軒
(01:50:59) 沒錯。
Lex Fridman
(01:51:00) 這非常棘手,而且不知為何,必須這樣做令人感到沮喪。
(01:51:00) 這非常棘手,而且不知為何,必須這樣做令人感到沮喪。
陶哲軒
(01:51:05) 嗅覺是人類擁有的一種能力,而數學上存在一種隱喻性的嗅覺,目前尚不清楚如何讓人工智慧最終複製這種嗅覺。AlphaZero 等程式在圍棋和西洋棋等方面取得進展的方式,在某種程度上,它們已經發展出對圍棋和西洋棋局勢的嗅覺,判斷這個局勢對白方有利,對黑方有利。它們無法解釋原因,但僅僅擁有這種嗅覺就能讓它們制定策略。因此,如果人工智慧獲得這種能力,能夠判斷某些證明策略的可行性,例如,將問題分解成兩個較小的子任務,並且它們可以判斷:「喔,這看起來不錯。這兩個任務看起來比你的主要任務更簡單,而且它們仍然很有可能成立。所以這值得嘗試。」或者「不,你讓問題變得更糟了,因為這兩個子問題實際上比你原來的問題更難。」如果你隨機嘗試某件事,通常都會發生這種情況,因為將一個問題轉化為一個更難的問題非常容易。很少會將其轉化為一個更簡單的問題。因此,如果它們能夠培養出這種嗅覺,那麼它們或許就能開始與人類數學家競爭。
(01:51:05) 嗅覺是人類擁有的一種能力,而數學上存在一種隱喻性的嗅覺,目前尚不清楚如何讓人工智慧最終複製這種嗅覺。AlphaZero 等程式在圍棋和西洋棋等方面取得進展的方式,在某種程度上,它們已經發展出對圍棋和西洋棋局勢的嗅覺,判斷這個局勢對白方有利,對黑方有利。它們無法解釋原因,但僅僅擁有這種嗅覺就能讓它們制定策略。因此,如果人工智慧獲得這種能力,能夠判斷某些證明策略的可行性,例如,將問題分解成兩個較小的子任務,並且它們可以判斷:「喔,這看起來不錯。這兩個任務看起來比你的主要任務更簡單,而且它們仍然很有可能成立。所以這值得嘗試。」或者「不,你讓問題變得更糟了,因為這兩個子問題實際上比你原來的問題更難。」如果你隨機嘗試某件事,通常都會發生這種情況,因為將一個問題轉化為一個更難的問題非常容易。很少會將其轉化為一個更簡單的問題。因此,如果它們能夠培養出這種嗅覺,那麼它們或許就能開始與人類數學家競爭。
Lex Fridman
(01:52:24) 這是一個難題,但不是競爭,而是協作。好的,假設性的。如果我給你一個神諭,它可以完成你所做工作的某些方面,而且你可以與它協作,你希望這個神諭能夠做什麼?你希望它成為一個驗證者,像是檢查、執行程式碼?像是說「陶教授,沒錯,這是一個有希望且富有成果的方向」?或者你希望它產生可能的證明,然後你看看哪個是正確的?或者你希望它產生不同的表述方式,完全不同的看待問題的方式?
(01:52:24) 這是一個難題,但不是競爭,而是協作。好的,假設性的。如果我給你一個神諭,它可以完成你所做工作的某些方面,而且你可以與它協作,你希望這個神諭能夠做什麼?你希望它成為一個驗證者,像是檢查、執行程式碼?像是說「陶教授,沒錯,這是一個有希望且富有成果的方向」?或者你希望它產生可能的證明,然後你看看哪個是正確的?或者你希望它產生不同的表述方式,完全不同的看待問題的方式?
陶哲軒
(01:53:10) 是的,我認為以上皆是。很多時候是因為我們不知道如何使用這些工具,因為這是一種我們過去沒有的典範。這些系統有足夠的能力理解複雜的指令,可以大規模運作,但同時又不可靠。這是一個有趣的……在細微之處有點不可靠,同時又提供相當好的輸出。這是一個有趣的組合。我的意思是,你和研究生一起工作,他們有點像這樣,但沒有規模。而我們之前的軟體工具可以大規模運作,但非常狹隘,所以我們必須弄清楚如何使用。所以蒂姆·高爾斯實際上,你提到他在 2000 年就預見到了。他實際上是在想像未來二十五年數學會是什麼樣子。
(01:53:10) 是的,我認為以上皆是。很多時候是因為我們不知道如何使用這些工具,因為這是一種我們過去沒有的典範。這些系統有足夠的能力理解複雜的指令,可以大規模運作,但同時又不可靠。這是一個有趣的……在細微之處有點不可靠,同時又提供相當好的輸出。這是一個有趣的組合。我的意思是,你和研究生一起工作,他們有點像這樣,但沒有規模。而我們之前的軟體工具可以大規模運作,但非常狹隘,所以我們必須弄清楚如何使用。所以蒂姆·高爾斯實際上,你提到他在 2000 年就預見到了。他實際上是在想像未來二十五年數學會是什麼樣子。
Lex Fridman
(01:54:08) 真有趣。
(01:54:08) 真有趣。
陶哲軒
(01:54:09) 是的,他寫了一篇文章,描述了未來數學助理和他自己之間的一段假設性對話。他試圖解決一個問題,他們會進行對話。有時人類會提出一個想法,AI 會評估它,有時 AI 會提出一個想法,有時需要進行驗算,AI 就會直接說:「好的,我已經檢查了這裡需要的 100 個案例」,或者「首先你為所有 N 設定這個,我已經檢查了 N 到 100,目前看起來不錯」,或者「等等,N 等於 46 時出現問題」。所以這只是一個自由形式的對話,你事先不知道事情會如何發展,只是基於「我認為雙方都會提出想法」。雙方都可以提出計算。
(01:54:09) 是的,他寫了一篇文章,描述了未來數學助理和他自己之間的一段假設性對話。他試圖解決一個問題,他們會進行對話。有時人類會提出一個想法,AI 會評估它,有時 AI 會提出一個想法,有時需要進行驗算,AI 就會直接說:「好的,我已經檢查了這裡需要的 100 個案例」,或者「首先你為所有 N 設定這個,我已經檢查了 N 到 100,目前看起來不錯」,或者「等等,N 等於 46 時出現問題」。所以這只是一個自由形式的對話,你事先不知道事情會如何發展,只是基於「我認為雙方都會提出想法」。雙方都可以提出計算。
(01:54:53) 我曾經和 AI 進行過對話,我說:「好的,我們要合作解決這個數學問題」,這是一個我已經知道答案的問題,所以我試著引導它。「好的,這是問題。」我建議使用這個工具,然後它會找到這個。「好的,它可能會開始使用這個,然後它會回到它之前想做的工具。」你必須不斷地把它引導到你想要的路徑上,我最終可以強迫它給出我想要的證明,但這就像在趕貓一樣。我必須付出的個人努力不僅僅是引導它,還要檢查它的輸出,因為很多看起來可行的東西,我知道第 17 行有問題,而且基本上是在和它爭論。這比不借助任何幫助還要累,但這就是目前的技術水平。
Lex Fridman
(01:55:44) 我想知道是否會有一個階段性的轉變,讓情況不再像是在趕貓一樣難以控制。也許你會讓我們驚訝於這個轉變發生的速度。
(01:55:44) 我想知道是否會有一個階段性的轉變,讓情況不再像是在趕貓一樣難以控制。也許你會讓我們驚訝於這個轉變發生的速度。
陶哲軒
(01:55:54) 我相信是如此。在形式化方面,我之前提到過,形式化一個證明所需的時間比手寫證明長 10 倍。有了這些現代 AI 工具,以及更好的工具,Lean 的開發者們正努力增加更多功能,使其更便於使用,從九到八到七……好吧,這沒什麼大不了的,但有一天它會降到一位數。這就是一個階段性的轉變,因為突然間,當你撰寫論文時,先用 Lean 寫作,或者透過與 AI 的對話來完成,這就變得有意義了,而且對期刊來說,接受這種形式也變得自然。也許他們會提供加速審查。如果一篇論文已經在 Lean 中形式化,他們只會要求審稿人評論結果的重要性以及它與文獻的關聯,而不必太擔心正確性,因為這已經得到驗證。數學論文變得越來越長,而且越來越難以獲得真正重要的長篇論文的良好審查。這確實是一個問題,而形式化的出現正逢其時。
(01:55:54) 我相信是如此。在形式化方面,我之前提到過,形式化一個證明所需的時間比手寫證明長 10 倍。有了這些現代 AI 工具,以及更好的工具,Lean 的開發者們正努力增加更多功能,使其更便於使用,從九到八到七……好吧,這沒什麼大不了的,但有一天它會降到一位數。這就是一個階段性的轉變,因為突然間,當你撰寫論文時,先用 Lean 寫作,或者透過與 AI 的對話來完成,這就變得有意義了,而且對期刊來說,接受這種形式也變得自然。也許他們會提供加速審查。如果一篇論文已經在 Lean 中形式化,他們只會要求審稿人評論結果的重要性以及它與文獻的關聯,而不必太擔心正確性,因為這已經得到驗證。數學論文變得越來越長,而且越來越難以獲得真正重要的長篇論文的良好審查。這確實是一個問題,而形式化的出現正逢其時。
Lex Fridman
(01:57:04) 而且由於工具和所有其他因素,猜測變得越來越容易,那麼你會看到更多類似 math lib 的內容呈指數級增長,因為這是一個良性循環。
(01:57:04) 而且由於工具和所有其他因素,猜測變得越來越容易,那麼你會看到更多類似 math lib 的內容呈指數級增長,因為這是一個良性循環。
陶哲軒
(01:57:16) 我的意思是,過去發生過的一種階段性轉變是 LaTeX 的採用。LaTeX 是一種排版語言,現在所有的數學家都在使用。過去,人們使用各種文字處理器、打字機等等,但在某個時候,LaTeX 變得比所有其他競爭對手更容易使用,人們會在幾年內轉換。這只是一個戲劇性的基礎轉變。
(01:57:16) 我的意思是,過去發生過的一種階段性轉變是 LaTeX 的採用。LaTeX 是一種排版語言,現在所有的數學家都在使用。過去,人們使用各種文字處理器、打字機等等,但在某個時候,LaTeX 變得比所有其他競爭對手更容易使用,人們會在幾年內轉換。這只是一個戲劇性的基礎轉變。
AI 贏得費爾茲獎
Lex Fridman
(01:57:37) 這是一個很瘋狂、很超現實的問題,但我們距離一個 AI 系統成為證明過程的合作者,並贏得費爾茲獎還有多遠?大概要多久?我是指達到那個程度。
(01:57:37) 這是一個很瘋狂、很超現實的問題,但我們距離一個 AI 系統成為證明過程的合作者,並贏得費爾茲獎還有多遠?大概要多久?我是指達到那個程度。
陶哲軒
(01:57:55) 好吧,這取決於合作的程度,對吧?
(01:57:55) 好吧,這取決於合作的程度,對吧?
Lex Fridman
(01:57:58) 不,它值得獲得費爾茲獎。所以是對半分。
(01:57:58) 不,它值得獲得費爾茲獎。所以是對半分。
陶哲軒
(01:58:03) 已經是這樣了。我可以想像,如果一篇論文能獲得獎牌,那在撰寫過程中獲得一些 AI 協助,就像現在這樣,光是自動完成就已經加快了我的寫作速度。你可能有一個定理和一個證明,而這個證明有三種情況,我寫下第一種情況的證明,然後自動完成功能就建議說:「現在這裡是第二種情況的證明方法。」而且完全正確。這太棒了。幫我節省了五到十分鐘的打字時間。
(01:58:03) 已經是這樣了。我可以想像,如果一篇論文能獲得獎牌,那在撰寫過程中獲得一些 AI 協助,就像現在這樣,光是自動完成就已經加快了我的寫作速度。你可能有一個定理和一個證明,而這個證明有三種情況,我寫下第一種情況的證明,然後自動完成功能就建議說:「現在這裡是第二種情況的證明方法。」而且完全正確。這太棒了。幫我節省了五到十分鐘的打字時間。
Lex Fridman
(01:58:30) 但在這種情況下,AI 系統不會獲得費爾茲獎。我們是在談論 20 年、50 年、100 年嗎?你覺得呢?
(01:58:30) 但在這種情況下,AI 系統不會獲得費爾茲獎。我們是在談論 20 年、50 年、100 年嗎?你覺得呢?
陶哲軒
(01:58:42) 好的,我在書面報告中預測,到 2026 年,也就是明年,將會出現與人工智慧合作的數學研究,不是那種能贏得費爾茲獎的成果,而是實際的研究級論文。
(01:58:42) 好的,我在書面報告中預測,到 2026 年,也就是明年,將會出現與人工智慧合作的數學研究,不是那種能贏得費爾茲獎的成果,而是實際的研究級論文。
Lex Fridman
(01:58:54) 發表的想法部分是由人工智慧產生的。
(01:58:54) 發表的想法部分是由人工智慧產生的。
陶哲軒
(01:58:58) 也許不是想法本身,但至少是一些計算和驗證。
(01:58:58) 也許不是想法本身,但至少是一些計算和驗證。
Lex Fridman
(01:59:03) 已經發生了嗎?
(01:59:03) 已經發生了嗎?
陶哲軒
(01:59:04) 已經發生了。有些問題的解決方式是透過與人工智慧進行複雜的對話,由人工智慧提出建議,然後人類去嘗試,如果方法行不通,它可能會提出不同的想法。很難完全理清。但可以確定的是,有些數學成果的完成,是因為有人工的驗證和人工智慧的參與,但很難釐清功勞歸屬。我的意思是,這些工具並不能複製所有做數學所需的技能,但它們可以複製其中相當比例的技能,像是 30%、40%,因此它們可以填補缺口。程式碼就是一個很好的例子。用 Python 寫程式對我來說很麻煩。我不是原生使用者,我是一位專業的程式設計師,但有了人工智慧,這樣做的摩擦成本大大降低。所以它為我填補了這個缺口。人工智慧在文獻回顧方面也變得相當出色。
(01:59:04) 已經發生了。有些問題的解決方式是透過與人工智慧進行複雜的對話,由人工智慧提出建議,然後人類去嘗試,如果方法行不通,它可能會提出不同的想法。很難完全理清。但可以確定的是,有些數學成果的完成,是因為有人工的驗證和人工智慧的參與,但很難釐清功勞歸屬。我的意思是,這些工具並不能複製所有做數學所需的技能,但它們可以複製其中相當比例的技能,像是 30%、40%,因此它們可以填補缺口。程式碼就是一個很好的例子。用 Python 寫程式對我來說很麻煩。我不是原生使用者,我是一位專業的程式設計師,但有了人工智慧,這樣做的摩擦成本大大降低。所以它為我填補了這個缺口。人工智慧在文獻回顧方面也變得相當出色。
(02:00:15) 我的意思是,它仍然存在幻覺參考文獻的問題,這些文獻並不存在,但我認為這是一個可以解決的問題。如果你以正確的方式進行訓練,並使用網路進行驗證,在幾年內,你應該可以達到這樣的程度:當你需要一個引理時,你可以問:「以前有人證明過這個引理嗎?」它基本上會進行一個精密的網路搜尋,並說,是的,有這六篇論文提到過類似的事情。我的意思是,你現在就可以問它,它會給你六篇論文,其中可能有一篇是合法且相關的,一篇存在但不相關,四篇是幻覺的。它現在有一個非零的成功率,但垃圾太多了,訊噪比太差,所以當你已經大致了解這種關係時,它最有幫助,你只需要被提示想起一篇已經潛意識地存在你記憶中的論文。
Lex Fridman
(02:01:14) 而不是幫助你發現你甚至不知道,但卻是正確的引用。
(02:01:14) 而不是幫助你發現你甚至不知道,但卻是正確的引用。
陶哲軒
(02:01:20)對,它有時能做到,但當它做到時,它會被埋在一堆選項中,而其他的選項——
(02:01:20)對,它有時能做到,但當它做到時,它會被埋在一堆選項中,而其他的選項——
Lex Fridman
(02:01:26)都很糟糕。我的意思是,如果能夠自動生成一個正確的相關文獻章節,那真的是一件很棒的事。這可能會是另一個階段轉變,因為它能正確地分配功勞,讓你跳脫出思想的框架。
(02:01:26)都很糟糕。我的意思是,如果能夠自動生成一個正確的相關文獻章節,那真的是一件很棒的事。這可能會是另一個階段轉變,因為它能正確地分配功勞,讓你跳脫出思想的框架。
陶哲軒
(02:01:42)對,現在還有一個很大的障礙需要克服。我的意思是,就像自駕車一樣,安全邊際必須非常高才具有可行性。所以,很多 AI 應用都有個「摩洛悖論」(Moravec's paradox),他們可以開發出在 20%或 80%的時間內都能正常運作的工具,但這仍然不夠好。事實上,在某些方面,甚至比好還要更糟。
(02:01:42)對,現在還有一個很大的障礙需要克服。我的意思是,就像自駕車一樣,安全邊際必須非常高才具有可行性。所以,很多 AI 應用都有個「摩洛悖論」(Moravec's paradox),他們可以開發出在 20%或 80%的時間內都能正常運作的工具,但這仍然不夠好。事實上,在某些方面,甚至比好還要更糟。
Lex Fridman
(02:02:08)我的意思是,換個方式問菲爾茲獎的問題,你認為你會在哪一年醒來,然後真正感到驚訝?你讀到頭條新聞,或是發生了什麼 AI 做的事情,一個真正的突破。任何事情。像是菲爾茲獎,甚至是一個假設。它可能真的就像 AlphaZero 圍棋的那個時刻一樣。
(02:02:08)我的意思是,換個方式問菲爾茲獎的問題,你認為你會在哪一年醒來,然後真正感到驚訝?你讀到頭條新聞,或是發生了什麼 AI 做的事情,一個真正的突破。任何事情。像是菲爾茲獎,甚至是一個假設。它可能真的就像 AlphaZero 圍棋的那個時刻一樣。
陶哲軒
(02:02:33) 是的,這十年內我可以看到它在兩個人們認為不相關的事物之間做出推測。
(02:02:33) 是的,這十年內我可以看到它在兩個人們認為不相關的事物之間做出推測。
Lex Fridman
(02:02:42) 喔,有趣。產生一個猜想。這是一個美麗的猜想。
(02:02:42) 喔,有趣。產生一個猜想。這是一個美麗的猜想。
陶哲軒
(02:02:45) 是的。而且實際上很有可能是正確且有意義的。
(02:02:45) 是的。而且實際上很有可能是正確且有意義的。
Lex Fridman
(02:02:50) 因為這實際上是可行的,我想,但數據的本質是...
(02:02:50) 因為這實際上是可行的,我想,但數據的本質是...
陶哲軒
(02:02:56) 嗯。
Lex Fridman
(02:02:56) 不,那會非常驚人。
(02:02:56) 不,那會非常驚人。
陶哲軒
(02:02:59) 目前的模型還在掙扎。我的意思是,這個版本……物理學家有個夢想,希望人工智慧能發現新的物理定律。夢想是,你只要餵給它所有數據,這是一個我們以前沒見過的新專利,但實際上,即使是目前最先進的技術,也很難從數據中發現舊的物理定律。或者,如果它真的做到了,人們會非常擔心受到污染,它之所以能做到,只是因為在某個地方的訓練中,不知怎麼地出現了波以耳定律或任何你想重建的東西。
(02:02:59) 目前的模型還在掙扎。我的意思是,這個版本……物理學家有個夢想,希望人工智慧能發現新的物理定律。夢想是,你只要餵給它所有數據,這是一個我們以前沒見過的新專利,但實際上,即使是目前最先進的技術,也很難從數據中發現舊的物理定律。或者,如果它真的做到了,人們會非常擔心受到污染,它之所以能做到,只是因為在某個地方的訓練中,不知怎麼地出現了波以耳定律或任何你想重建的東西。
(02:03:35) 部分原因是我們沒有正確的訓練數據。對於物理定律來說,我們沒有一百萬個具有一百萬種不同自然法則的宇宙。而我們在數學中缺少的很多東西實際上是負空間……所以我們發表了人們能夠證明的東西,以及最終被驗證的猜想,或者產生的反例,但我們沒有關於被提出來的東西的數據,這些東西是值得嘗試的好東西,但人們很快意識到這是錯誤的猜想,然後他們說:「喔,但我們實際上應該改變我們的聲明,以這種方式修改它,使其更合理。」
(02:04:16) 其中有個試錯過程,那是人類數學發現中不可或缺的一部分,但我們不會記錄下來,因為那很丟臉。我們會犯錯,而且我們只喜歡發表我們的成功。而人工智慧沒有這些數據可以訓練。我偶爾會開玩笑說,基本上人工智慧必須經歷研究所,實際上參加課程,做作業,去問答時間,犯錯,獲得如何糾正錯誤的建議,並從中學習。
格里戈里·佩雷爾曼
Lex Fridman
(02:04:47) 如果可以的話,我想問你關於格里戈里·佩雷爾曼的問題,你提到你試圖在工作中小心謹慎,不要讓一個問題完全吞噬你,不要讓你真的愛上這個問題,以至於在解決它之前都無法休息。但你也趕緊補充說,有時這種方法實際上可能非常成功,你給的一個例子是格里戈里·佩雷爾曼,他證明了龐加萊猜想,並且是通過獨自工作七年,基本上與外界沒有什麼接觸來完成的。你能解釋一下這個已經被解決的千禧年大獎難題,龐加萊猜想,並談談格里戈里·佩雷爾曼的旅程嗎?
(02:04:47) 如果可以的話,我想問你關於格里戈里·佩雷爾曼的問題,你提到你試圖在工作中小心謹慎,不要讓一個問題完全吞噬你,不要讓你真的愛上這個問題,以至於在解決它之前都無法休息。但你也趕緊補充說,有時這種方法實際上可能非常成功,你給的一個例子是格里戈里·佩雷爾曼,他證明了龐加萊猜想,並且是通過獨自工作七年,基本上與外界沒有什麼接觸來完成的。你能解釋一下這個已經被解決的千禧年大獎難題,龐加萊猜想,並談談格里戈里·佩雷爾曼的旅程嗎?
陶哲軒
(02:05:31) 好的,所以這是一個關於彎曲空間的問題。地球就是一個很好的例子。所以把地球想像成一個二維表面。環繞著你的物體可能是一個帶孔的環面,或者可以有很多孔,而且先驗地,一個表面可以有很多不同的拓樸結構,即使你假設它是有限的且平滑的等等。所以我們已經弄清楚如何將表面分類為第一步的近似。一切都由一個叫做虧格的東西決定,它有多少個孔。所以一個球體的虧格為零,或者一個甜甜圈的虧格為一,等等。你可以區分表面的其中一種方式是,球體是所謂的單連通的。如果你在球體上畫任何閉合的環,比如一個大的閉合繩圈,你可以在保持在表面上的同時將其收縮到一個點。球體具有這種特性,但環面沒有。如果你在一個環面上,你拿一根繩子繞著環面的外徑走一圈,就沒有辦法... 它無法穿過孔。沒有辦法將它收縮到一個點。
(02:05:31) 好的,所以這是一個關於彎曲空間的問題。地球就是一個很好的例子。所以把地球想像成一個二維表面。環繞著你的物體可能是一個帶孔的環面,或者可以有很多孔,而且先驗地,一個表面可以有很多不同的拓樸結構,即使你假設它是有限的且平滑的等等。所以我們已經弄清楚如何將表面分類為第一步的近似。一切都由一個叫做虧格的東西決定,它有多少個孔。所以一個球體的虧格為零,或者一個甜甜圈的虧格為一,等等。你可以區分表面的其中一種方式是,球體是所謂的單連通的。如果你在球體上畫任何閉合的環,比如一個大的閉合繩圈,你可以在保持在表面上的同時將其收縮到一個點。球體具有這種特性,但環面沒有。如果你在一個環面上,你拿一根繩子繞著環面的外徑走一圈,就沒有辦法... 它無法穿過孔。沒有辦法將它收縮到一個點。
(02:06:25) 所以結果發現,在球體的連續形變下,球體是唯一具有這種可收縮性質的表面。也就是說,在拓撲上與球體等價的東西。龐加萊提出了同樣的問題,但延伸到更高的維度,這變得難以視覺化,因為你可以想像表面嵌入在三維空間中,但對於彎曲的三維空間,我們沒有對四維空間的良好直覺來理解它。而且還有一些三維空間甚至無法放入四維空間,你需要五維、六維或更高的維度。但無論如何,在數學上你仍然可以提出這個問題,如果你現在有一個有界的三維空間,它也具有這種單連通的性質,即每個迴路都可以收縮,你能把它變成三維版本的球體嗎?這就是龐加萊猜想。
(02:07:09) 奇怪的是,在更高的維度,四維和五維實際上更容易。所以它首先在更高的維度被解決,在某種程度上,有更多的空間可以進行形變。將物體移動到你的球體更容易。但三維真的很难。所以人們嘗試了很多方法。有一些組合方法,你把表面切成小三角形或四面體,然後試圖根據面是如何相互作用來論證。還有代數方法,有各種代數對象,比如你可以附加到這些同調和上同調上的基本群,以及所有這些非常精巧的工具。它們也都不太奏效,但理查德·哈密頓提出了一種偏微分方程的方法。
(02:07:52) 問題是……所以你有這個物體,它實際上是一個球體,但它以一種奇怪的方式呈現給你。所以我想到一個被揉皺和扭曲的球,而且它並不明顯是個球。但如果你有某種表面,它是一個變形的球體,你可以例如,把它想像成一個氣球的表面,你可以試著給它充氣,你把它吹起來,自然地,當你用空氣填充它時,皺紋會逐漸平滑,它會變成一個漂亮的圓球,當然,除非它是個環面或其他什麼,在這種情況下,它會在某個點卡住。
(02:08:32) 如果你給一個環面(torus)充氣,中間會有一個點,內環會縮小到零,你會得到一個奇異點,你無法再繼續膨脹,也無法再繼續流動。所以他創造了一種流動,現在被稱為里奇流(Ricci Flow),這是一種將任意表面或空間平滑化,使其越來越圓,使其看起來像一個球體的方法。他想證明,這個過程要么會給你一個球體,要么會產生一個奇異點,實際上非常像偏微分方程(PDEs),它們要么具有整體規律性,要么在有限時間內爆發。基本上,這幾乎是完全一樣的事情。它們都是相關的。他證明了對於二維,二維表面,如果你開始簡單地連接它,永遠不會形成奇異點,你永遠不會遇到麻煩,你可以流動,它會給你一個球體。所以他得到了一個二維結果的新證明。
Lex Fridman
(02:09:20) 順帶一提,這是一個對里奇流及其在此情境中的應用所做的精彩解釋。對於二維情況,這裡的數學有多困難?是嗎?
(02:09:20) 順帶一提,這是一個對里奇流及其在此情境中的應用所做的精彩解釋。對於二維情況,這裡的數學有多困難?是嗎?
陶哲軒
(02:09:27) 是的,這些都是非常複雜的方程式,與愛因斯坦方程式相當。稍微簡單一些,但它們被認為是難以求解的非線性方程式,而且在二維中有許多特殊的技巧可以提供幫助。但在三維中,問題是這個方程式實際上是超臨界的。與[聽不清楚 02:09:48]相同的問題。當你爆炸時,也許曲率會集中在越來越小的區域中,而且它看起來越來越非線性,事情看起來越來越糟。而且可能會出現各種奇點。有些奇點,這些被稱為頸部收縮的東西,表面表現得像一個槓鈴,並在一個點上收縮。有些奇點非常簡單,你可以很容易地看到下一步該怎麼做。你只要剪一下,然後你可以把一個表面變成兩個,然後分別進行 e-bolt 連接。但有可能會出現一些非常糟糕的打結奇點,你無法看到如何以任何方式解決,你無法對其進行任何手術。所以你需要對所有奇點進行分類,例如事情可能出錯的所有可能方式是什麼?所以佩雷爾曼所做的是,首先,他使問題從一個超臨界問題變成了一個臨界問題。我之前說過能量、哈密頓量的發明如何真正闡明了牛頓力學。所以他引入了一些現在被稱為佩雷爾曼約化體積和佩雷爾曼熵的東西。他引入了新的量,有點像能量,在每個尺度上看起來都一樣,並將問題變成了一個臨界問題,其中非線性實際上突然看起來比以前不那麼可怕了。然後他必須解決... 他仍然必須分析這個臨界問題的奇點。而這本身就是一個類似於我所研究的波映射的東西。所以在難度層面上與它相當。
(02:09:27) 是的,這些都是非常複雜的方程式,與愛因斯坦方程式相當。稍微簡單一些,但它們被認為是難以求解的非線性方程式,而且在二維中有許多特殊的技巧可以提供幫助。但在三維中,問題是這個方程式實際上是超臨界的。與[聽不清楚 02:09:48]相同的問題。當你爆炸時,也許曲率會集中在越來越小的區域中,而且它看起來越來越非線性,事情看起來越來越糟。而且可能會出現各種奇點。有些奇點,這些被稱為頸部收縮的東西,表面表現得像一個槓鈴,並在一個點上收縮。有些奇點非常簡單,你可以很容易地看到下一步該怎麼做。你只要剪一下,然後你可以把一個表面變成兩個,然後分別進行 e-bolt 連接。但有可能會出現一些非常糟糕的打結奇點,你無法看到如何以任何方式解決,你無法對其進行任何手術。所以你需要對所有奇點進行分類,例如事情可能出錯的所有可能方式是什麼?所以佩雷爾曼所做的是,首先,他使問題從一個超臨界問題變成了一個臨界問題。我之前說過能量、哈密頓量的發明如何真正闡明了牛頓力學。所以他引入了一些現在被稱為佩雷爾曼約化體積和佩雷爾曼熵的東西。他引入了新的量,有點像能量,在每個尺度上看起來都一樣,並將問題變成了一個臨界問題,其中非線性實際上突然看起來比以前不那麼可怕了。然後他必須解決... 他仍然必須分析這個臨界問題的奇點。而這本身就是一個類似於我所研究的波映射的東西。所以在難度層面上與它相當。
(02:11:18) 所以他成功地將這個問題的所有奇點進行分類,並展示如何對每個奇點進行手術。並透過這樣的方式解決了龐加萊猜想。所以這是相當多雄心勃勃的步驟,而現在的大型語言模型,舉例來說,無法做到... 充其量,我可以想像一個模型提出這個想法,作為數百種不同的嘗試之一,但其他 99 種會是完全的死路。但你只能在幾個月的工作後才會發現,他一定有某種感覺,認為這是應該追求的正確方向。從 A 到 B 需要花費數年時間。
Lex Fridman
(02:11:54) 所以你做過,就像你說的,實際上,你甚至從嚴格的數學角度來看,但更廣泛地說,就過程而言,你做過類似的...
(02:11:54) 所以你做過,就像你說的,實際上,你甚至從嚴格的數學角度來看,但更廣泛地說,就過程而言,你做過類似的...
Lex Fridman
(02:12:01) 就過程而言,你做過類似困難的事情。從他獨自進行的過程中,你能推斷出什麼?當你開始時,類似這樣的過程有哪些低潮?你提到過困難,但人工智慧不知道自己何時失敗。當你坐在辦公室裡,意識到過去幾天甚至幾週所做的事情都失敗時,你會發生什麼事?
(02:12:01) 就過程而言,你做過類似困難的事情。從他獨自進行的過程中,你能推斷出什麼?當你開始時,類似這樣的過程有哪些低潮?你提到過困難,但人工智慧不知道自己何時失敗。當你坐在辦公室裡,意識到過去幾天甚至幾週所做的事情都失敗時,你會發生什麼事?
陶哲軒
(02:12:27) 對我來說,我會轉換到不同的問題。所以我是一隻狐狸,我不是一隻刺蝟。
(02:12:27) 對我來說,我會轉換到不同的問題。所以我是一隻狐狸,我不是一隻刺蝟。
Lex Fridman
(02:12:33) 但通常來說,你可以暫停一下,看看不同的問題嗎?
(02:12:33) 但通常來說,你可以暫停一下,看看不同的問題嗎?
陶哲軒
(02:12:37) 是啊,是啊。你也可以修改問題。我的意思是,你可以問問作弊者,如果有一些特定的事情阻礙了你,或者某些糟糕的情況一直出現,導致你的工具無法運作。你可以直接假設這種糟糕的情況不會發生。所以你進行一些神奇的思考,但在策略上是可行的,目的是看看剩下的論證是否能成立。如果你的方法存在多個問題,那也許你就放棄了。但如果這是唯一的問題,而其他一切都沒問題,那麼仍然值得一試。所以,是的,有時候你必須進行一些前瞻性的偵察。
(02:12:37) 是啊,是啊。你也可以修改問題。我的意思是,你可以問問作弊者,如果有一些特定的事情阻礙了你,或者某些糟糕的情況一直出現,導致你的工具無法運作。你可以直接假設這種糟糕的情況不會發生。所以你進行一些神奇的思考,但在策略上是可行的,目的是看看剩下的論證是否能成立。如果你的方法存在多個問題,那也許你就放棄了。但如果這是唯一的問題,而其他一切都沒問題,那麼仍然值得一試。所以,是的,有時候你必須進行一些前瞻性的偵察。
Lex Fridman
(02:13:18) 有時候假設「好,我們最終會解決的」反而會更有成效,是嗎?
(02:13:18) 有時候假設「好,我們最終會解決的」反而會更有成效,是嗎?
陶哲軒
(02:13:21) 哦,對,沒錯。有時候,犯錯實際上也是有幫助的。有一次,我們和另外四個人一起做了一個專案,並因此獲得了一些獎項。我們研究了一個偏微分方程的問題。同樣地,這也是一個爆破奇異性的規律性問題,被認為非常困難。Jean Bourgiugnon 是另一位菲爾茲獎得主,他研究了這個問題的一個特例,但他無法解決一般情況。我們在這個問題上努力了兩個月,並且認為我們解決了它。我們有一個很棒的論證,如果一切都符合,我們很興奮,我們計劃慶祝,大家聚在一起喝香檳之類的,然後我們開始把它寫下來。我們其中一個人,實際上不是我,而是另一位共同作者說:“哦,在這個引理中,我們必須估計這個展開式中出現的這 13 項。
(02:13:21) 哦,對,沒錯。有時候,犯錯實際上也是有幫助的。有一次,我們和另外四個人一起做了一個專案,並因此獲得了一些獎項。我們研究了一個偏微分方程的問題。同樣地,這也是一個爆破奇異性的規律性問題,被認為非常困難。Jean Bourgiugnon 是另一位菲爾茲獎得主,他研究了這個問題的一個特例,但他無法解決一般情況。我們在這個問題上努力了兩個月,並且認為我們解決了它。我們有一個很棒的論證,如果一切都符合,我們很興奮,我們計劃慶祝,大家聚在一起喝香檳之類的,然後我們開始把它寫下來。我們其中一個人,實際上不是我,而是另一位共同作者說:“哦,在這個引理中,我們必須估計這個展開式中出現的這 13 項。
(02:14:13) 我們估計了其中 12 項,但在筆記中,我找不到第 13 項的估計。有人能提供嗎?” 我說:“當然,我會看看。” 是的,我們沒有涵蓋到,我們完全忽略了這個項,而這個項結果比其他 12 項加起來還要糟糕。事實上,我們無法估計這個項。我們又嘗試了幾個月,嘗試了所有不同的排列組合,但總是有這麼一項是我們無法控制的。這非常令人沮喪。但因為我們已經投入了數月的心力在這上面,所以我們堅持了下去,嘗試了越來越孤注一擲和瘋狂的事情。兩年後,我們找到了一種有點不同,但與我們最初的策略有很大不同的方法,它實際上沒有產生這些有問題的項,並且實際解決了問題。
(02:14:58) 所以我們花了兩年解決了這個問題,但如果我們沒有一開始那幾乎解決問題的虛假曙光,我們可能在第二個月就放棄了,轉而研究一個更簡單的問題。如果我們知道要花兩年時間,不確定我們是否會啟動這個項目。有時候,擁有不正確的資訊實際上是有幫助的,就像哥倫布在新世界掙扎一樣,他們對地球的大小有不正確的測量。他認為他將找到一條通往印度的新貿易路線,或者至少那是他在招股說明書中宣傳的方式。我的意思是,可能他實際上暗地裡知道真相,但...
Lex Fridman
(02:15:31) 僅從心理層面來看,在那樣的時刻,你是否會感到情緒上的或自我懷疑的感覺淹沒你?因為這些東西,感覺數學是如此引人入勝,以至於當你投入如此多的精力在這個問題上,然後結果卻是錯誤的時候,它會讓你崩潰。你可能會開始...就像西洋棋讓某些人崩潰的方式一樣。
(02:15:31) 僅從心理層面來看,在那樣的時刻,你是否會感到情緒上的或自我懷疑的感覺淹沒你?因為這些東西,感覺數學是如此引人入勝,以至於當你投入如此多的精力在這個問題上,然後結果卻是錯誤的時候,它會讓你崩潰。你可能會開始...就像西洋棋讓某些人崩潰的方式一樣。
陶哲軒
(02:15:59) 是的,我認為不同的數學家對他們所做的事情有不同程度的情感投入。我的意思是,我認為對某些人來說,這就像一份工作,你遇到一個問題,如果沒有解決,你就繼續下一個問題。所以你可以隨時轉向另一個問題,這減少了情感上的連結。我的意思是,有些情況是,有些問題被稱為數學疾病,他們只專注於那一個問題,並花費多年的時間只思考那一個問題。也許他們的職業生涯因此受到影響等等,但他們會說:「好吧,我會獲得這個巨大的勝利。一旦我完成這個問題,它將彌補所有失去機會的歲月。」我的意思是,偶爾會成功,但我真的不建議沒有足夠毅力的人這麼做。
(02:15:59) 是的,我認為不同的數學家對他們所做的事情有不同程度的情感投入。我的意思是,我認為對某些人來說,這就像一份工作,你遇到一個問題,如果沒有解決,你就繼續下一個問題。所以你可以隨時轉向另一個問題,這減少了情感上的連結。我的意思是,有些情況是,有些問題被稱為數學疾病,他們只專注於那一個問題,並花費多年的時間只思考那一個問題。也許他們的職業生涯因此受到影響等等,但他們會說:「好吧,我會獲得這個巨大的勝利。一旦我完成這個問題,它將彌補所有失去機會的歲月。」我的意思是,偶爾會成功,但我真的不建議沒有足夠毅力的人這麼做。
(02:16:54) 所以我從來沒有對任何一個問題投入特別多的心力。一個有幫助的事情是,我們不需要事先預告我們要解決哪些問題。好吧,當我們寫研究計畫時,我們會說我們將研究這組問題,但即使如此,我們也不會承諾,一定在五年內我會提供所有這些問題的證明。你承諾會取得一些進展或發現一些有趣的現象。也許你沒有解決這個問題,但你找到了一些相關的問題,你可以對此發表一些新的見解,這是一個更可行的任務。
孿生素數猜想
Lex Fridman
(02:17:27) 但我相信對你來說,也有類似的問題。你已經在數學史上最困難的問題上取得了很大的進展。有沒有一個問題總是困擾著你?它潛藏在黑暗的角落,像是孿生質數猜想、黎曼猜想、哥德巴赫猜想?
(02:17:27) 但我相信對你來說,也有類似的問題。你已經在數學史上最困難的問題上取得了很大的進展。有沒有一個問題總是困擾著你?它潛藏在黑暗的角落,像是孿生質數猜想、黎曼猜想、哥德巴赫猜想?
陶哲軒
(02:17:48) 孿生質數,聽起來…你看,我再說一次,像是黎曼猜想這樣的問題,實在是遙不可及。
(02:17:48) 孿生質數,聽起來…你看,我再說一次,像是黎曼猜想這樣的問題,實在是遙不可及。
Lex Fridman
(02:17:54) 你這麼認為嗎?
(02:17:54) 你這麼認為嗎?
陶哲軒
(02:17:55) 是的,甚至沒有可行的延伸。即使我啟動了這本書中我知道的所有秘技,仍然沒有辦法從 A 到 B。我認為它需要數學另一個領域的突破,並且需要有人意識到將其轉移到這個問題中會是有用的。
(02:17:55) 是的,甚至沒有可行的延伸。即使我啟動了這本書中我知道的所有秘技,仍然沒有辦法從 A 到 B。我認為它需要數學另一個領域的突破,並且需要有人意識到將其轉移到這個問題中會是有用的。
Lex Fridman
(02:18:18) 所以我們也許應該稍微退後一步,先談談質數。
(02:18:18) 所以我們也許應該稍微退後一步,先談談質數。
陶哲軒
(02:18:22) 好的。
Lex Fridman
(02:18:23) 所以它們經常被稱為數學的原子。您能否談談這些原子所提供的結構?
(02:18:23) 所以它們經常被稱為數學的原子。您能否談談這些原子所提供的結構?
陶哲軒
(02:18:31) 自然數有兩個基本運算:加法和乘法。如果你想產生自然數,你可以做兩件事。你可以從 1 開始,然後不斷地將 1 加到自身。這樣就能產生自然數,所以從加法的角度來看,它們很容易產生,一、二、三、四、五。或者,如果你想用乘法來產生,你可以取所有的質數,二、三、五、七,然後把它們全部乘在一起。加總起來,這會給你所有的自然數,可能除了 1 以外。所以,從加法的角度和乘法的角度來看,有這兩種不同的思考自然數的方式。單獨來看,它們還不算太糟。所以,任何關於自然數的問題,如果只涉及加法,相對來說都比較容易解決。
(02:18:31) 自然數有兩個基本運算:加法和乘法。如果你想產生自然數,你可以做兩件事。你可以從 1 開始,然後不斷地將 1 加到自身。這樣就能產生自然數,所以從加法的角度來看,它們很容易產生,一、二、三、四、五。或者,如果你想用乘法來產生,你可以取所有的質數,二、三、五、七,然後把它們全部乘在一起。加總起來,這會給你所有的自然數,可能除了 1 以外。所以,從加法的角度和乘法的角度來看,有這兩種不同的思考自然數的方式。單獨來看,它們還不算太糟。所以,任何關於自然數的問題,如果只涉及加法,相對來說都比較容易解決。
And any question that only was multiplication is relatively easy to solve. But what has been frustrating is that you combine the two together and suddenly you get the extremely rich… I mean, we know that there are statements in number theory that are actually as undecidable. There are certain polynomials in some number of variables. Is there a solution in the natural numbers? And the answer depends on an undecidable statement whether the axioms of mathematics are consistent or not. But even the simplest problems that combine something more applicative such as the primes with something additives such as shifting by two, separately we understand both of them well, but if you ask when you shift the prime by two, can you get up? How often can you get another prime? It’s been amazingly hard to relate the two.
(02:19:11) 任何只涉及乘法的問題都相對容易解決。但令人沮喪的是,當你把兩者結合起來,就會突然變得非常豐富……我的意思是,我們知道數論中有些陳述實際上是不可判定的。有一些變數的多項式,在自然數中是否有解?答案取決於一個不可判定的陳述,即數學公理是否一致。但即使是最簡單的問題,如果將一些更具應用性的東西(如質數)與一些加法性的東西(如移動兩位)結合起來,雖然我們分別對它們都很了解,但如果你問,當你將質數移動兩位時,能否得到?你能多常得到另一個質數?要將兩者聯繫起來非常困難。
(02:19:11) 任何只涉及乘法的問題都相對容易解決。但令人沮喪的是,當你把兩者結合起來,就會突然變得非常豐富……我的意思是,我們知道數論中有些陳述實際上是不可判定的。有一些變數的多項式,在自然數中是否有解?答案取決於一個不可判定的陳述,即數學公理是否一致。但即使是最簡單的問題,如果將一些更具應用性的東西(如質數)與一些加法性的東西(如移動兩位)結合起來,雖然我們分別對它們都很了解,但如果你問,當你將質數移動兩位時,能否得到?你能多常得到另一個質數?要將兩者聯繫起來非常困難。
Lex Fridman
And we should say that the twin prime conjecture is just that, it pauses that there are infinitely many pairs of prime numbers that differ by two. Now the interesting thing is that you have been very successful at pushing forward the field in answering these complicated questions of this variety. Like you mentioned the Green-Tao Theorem. It proves that prime numbers contain arithmetic progressions of any length.
(02:19:59) 我們應該說,孿生質數猜想就是這樣,它假設存在無限多對相差為 2 的質數。有趣的是,您在推動該領域,回答這類複雜問題方面非常成功。就像您提到的格林-陶定理,它證明了質數包含任意長度的等差數列。
(02:19:59) 我們應該說,孿生質數猜想就是這樣,它假設存在無限多對相差為 2 的質數。有趣的是,您在推動該領域,回答這類複雜問題方面非常成功。就像您提到的格林-陶定理,它證明了質數包含任意長度的等差數列。
Terence Tao 陶哲軒
Right. (02:20:25) 對。
Lex Fridman
It’s just mind-boggling that you could prove something like that.
(02:20:25) 你竟然能證明那樣的東西,真是令人難以置信。
(02:20:25) 你竟然能證明那樣的東西,真是令人難以置信。
Terence Tao 陶哲軒
Right. Yeah. So what we’ve realized because of this type of research is that different patterns have different levels of indestructibility. What makes the twin prime problem hard is that if you take all the primes in the world, three, five, seven, 11, and so forth, there are some twins in there, 11 and 13 is a twin prime, pair of twin primes and so forth. But you could easily, if you wanted to redact the primes to get rid of these twins. The twins, they’d show up and they’re infinitely many of them, but they’re actually reasonably sparse. There’s not, I mean, initially there’s quite a few, but once you got to the millions, the trillions, they become rarer and rarer. And you could actually just, if someone was given access to the database of primes, you just edit out a few primes here and there.
(02:20:27) 沒錯。是的。所以我們透過這類研究發現,不同的模式有著不同程度的牢不可破性。孿生質數猜想之所以困難,是因為如果你把世界上所有的質數,3、5、7、11 等等都拿出來,其中有一些是孿生質數,像是 11 和 13 就是一對孿生質數。但如果你想刪改這些質數來擺脫孿生質數,其實很容易做到。孿生質數會出現,而且有無窮多個,但實際上它們相當稀疏。我的意思是,一開始有很多,但一旦你到了數百萬、數兆的範圍,它們就變得越來越稀有。如果你能存取質數的資料庫,你其實可以隨意編輯,刪除一些質數。
(02:20:27) 沒錯。是的。所以我們透過這類研究發現,不同的模式有著不同程度的牢不可破性。孿生質數猜想之所以困難,是因為如果你把世界上所有的質數,3、5、7、11 等等都拿出來,其中有一些是孿生質數,像是 11 和 13 就是一對孿生質數。但如果你想刪改這些質數來擺脫孿生質數,其實很容易做到。孿生質數會出現,而且有無窮多個,但實際上它們相當稀疏。我的意思是,一開始有很多,但一旦你到了數百萬、數兆的範圍,它們就變得越來越稀有。如果你能存取質數的資料庫,你其實可以隨意編輯,刪除一些質數。
They could make the twin prime conjecture false by just removing 0.01% of the primes or something, just well-chosen to do this. And so you could present a censored database of the primes, which passes all of these statistical tests of the primes. It obeys things like the polynomial theorem and other effects of the primes, but doesn’t contain any twin primes anymore. And this is a real obstacle to the twin-prime conjecture. It means that any proof strategy to actually find twin primes in the actual primes must fail when applied to these slightly edited primes. And so it must be some very subtle, delicate feature of the primes that you can’t just get from aggregate statistical analysis.
(02:21:15) 他們可以透過移除 0.01%的質數,或是其他類似比例,只要經過精挑細選,就能讓孿生質數猜想變成錯誤的。所以你可以呈現一個經過審查的質數資料庫,它通過了所有質數的統計測試,符合多項式定理和其他質數的效應,但不再包含任何孿生質數。這對孿生質數猜想來說是一個真正的障礙。這表示任何在實際質數中尋找孿生質數的證明策略,在應用於這些稍微經過編輯的質數時,一定會失敗。所以這一定是質數非常微妙、精細的特性,是你無法僅從總體統計分析中獲得的。
(02:21:15) 他們可以透過移除 0.01%的質數,或是其他類似比例,只要經過精挑細選,就能讓孿生質數猜想變成錯誤的。所以你可以呈現一個經過審查的質數資料庫,它通過了所有質數的統計測試,符合多項式定理和其他質數的效應,但不再包含任何孿生質數。這對孿生質數猜想來說是一個真正的障礙。這表示任何在實際質數中尋找孿生質數的證明策略,在應用於這些稍微經過編輯的質數時,一定會失敗。所以這一定是質數非常微妙、精細的特性,是你無法僅從總體統計分析中獲得的。
Lex Fridman
(02:22:01) 好,所以那個出局了。
(02:22:01) 好,所以那個出局了。
陶哲軒
(02:22:02) 嗯。另一方面,等差數列已經證明更具韌性。你可以取質數,然後實際上可以消去 99%的質數,你可以取任何你想要的 90%。結果證明,我們證明的另一件事是,你仍然會得到等差數列。等差數列非常,它們就像蟑螂一樣。
(02:22:02) 嗯。另一方面,等差數列已經證明更具韌性。你可以取質數,然後實際上可以消去 99%的質數,你可以取任何你想要的 90%。結果證明,我們證明的另一件事是,你仍然會得到等差數列。等差數列非常,它們就像蟑螂一樣。
Lex Fridman
(02:22:21) 但長度是任意的。
(02:22:21) 但長度是任意的。
陶哲軒
(02:22:23) 是的。是的。
(02:22:23) 是的。是的。
Lex Fridman
(02:22:24) 這太瘋狂了。
(02:22:24) 這太瘋狂了。
陶哲軒
Yeah. (02:22:25) 對。
Lex Fridman
So for people who don’t know, arithmetic progressions is a sequence of numbers that differ by some fixed amount.
(02:22:25) 簡單來說,算術數列就是一串數字,彼此之間的差值固定。
(02:22:25) 簡單來說,算術數列就是一串數字,彼此之間的差值固定。
Terence Tao 陶哲軒
Yeah. But it’s again like, it’s an infinite monkey type phenomenon. For any fixed length of your set, you don’t get arbitrary length progressions. You only get quite short progressions.
(02:22:32) 沒錯。但這又有點像「無限猴子」的現象。對於任何固定長度的集合,你無法得到任意長度的等差數列。你只能得到相當短的等差數列。
(02:22:32) 沒錯。但這又有點像「無限猴子」的現象。對於任何固定長度的集合,你無法得到任意長度的等差數列。你只能得到相當短的等差數列。
Lex Fridman
(02:22:40) 但你說孿生質數並不是無限猴子現象。我的意思是,這是一隻非常狡猾的猴子。它仍然是一種無限猴子現象。
(02:22:40) 但你說孿生質數並不是無限猴子現象。我的意思是,這是一隻非常狡猾的猴子。它仍然是一種無限猴子現象。
陶哲軒
(02:22:48) 對。沒錯。如果質數真的是隨機的,如果質數是由猴子產生的,那麼是的,事實上,無限猴子定理就會——
(02:22:48) 對。沒錯。如果質數真的是隨機的,如果質數是由猴子產生的,那麼是的,事實上,無限猴子定理就會——
Lex Fridman
(02:22:56) 哦,但你是說孿生質數,你不能使用相同的工具。它幾乎不像是隨機的。
(02:22:56) 哦,但你是說孿生質數,你不能使用相同的工具。它幾乎不像是隨機的。
Terence Tao 陶哲軒
Well, we don’t know. We believe the primes behave like a random set. And so the reason why we care about the twin prime conjecture is a test case for whether we can genuinely confidently say with 0% chance of error that the primes behave like a random set. Random versions of the primes we know contain twins at least with 100% probably, or probably tending to 100% as you go out further and further. So the primes, we believe that they’re random. The reason why arithmetic progressions are indestructible is that regardless of whether it looks random or looks structured like periodic, in both cases the arithmetic progressions appear, but for different reasons. And this is basically all the ways in which the thing was… There are many proofs of this sort of arithmetic progression-type theorems.
(02:23:05) 嗯,我們不知道。我們相信質數的行為就像一個隨機集合。所以我們關心孿生質數猜想的原因是,它是一個測試案例,看看我們是否能真正自信地以 0% 的錯誤機率說質數的行為就像一個隨機集合。我們知道的質數的隨機版本至少包含孿生質數,機率為 100%,或者隨著你走得越來越遠,機率可能趨於 100%。所以我們相信質數是隨機的。等差數列之所以堅不可摧,是因為無論它看起來是隨機的還是像週期性那樣有結構,在兩種情況下都會出現等差數列,但原因不同。這基本上是這件事的所有方式……有很多關於這類等差數列型定理的證明。
(02:23:05) 嗯,我們不知道。我們相信質數的行為就像一個隨機集合。所以我們關心孿生質數猜想的原因是,它是一個測試案例,看看我們是否能真正自信地以 0% 的錯誤機率說質數的行為就像一個隨機集合。我們知道的質數的隨機版本至少包含孿生質數,機率為 100%,或者隨著你走得越來越遠,機率可能趨於 100%。所以我們相信質數是隨機的。等差數列之所以堅不可摧,是因為無論它看起來是隨機的還是像週期性那樣有結構,在兩種情況下都會出現等差數列,但原因不同。這基本上是這件事的所有方式……有很多關於這類等差數列型定理的證明。
And they’re all proven by some sort of dichotomy where your set is either structured or random and in both cases you can say something and then you put the two together. But in twin primes, if the primes are random, then you are happy, you win. If the primes are structured, they could be structured in a specific way that eliminates the twins. And we can’t rule out that one conspiracy.
(02:23:54) 它們都是通過某種二分法證明的,你的集合要么是有結構的,要么是隨機的,在這兩種情況下你都可以說些什麼,然後你把這兩者放在一起。但在孿生質數中,如果質數是隨機的,那麼你很高興,你贏了。如果質數是有結構的,它們可能以一種消除孿生質數的特定方式來構建。我們無法排除那種陰謀。
(02:23:54) 它們都是通過某種二分法證明的,你的集合要么是有結構的,要么是隨機的,在這兩種情況下你都可以說些什麼,然後你把這兩者放在一起。但在孿生質數中,如果質數是隨機的,那麼你很高興,你贏了。如果質數是有結構的,它們可能以一種消除孿生質數的特定方式來構建。我們無法排除那種陰謀。
Lex Fridman
And yet you were able to make, as I understand, progress on the K-tuple version
(02:24:16) 然而,據我所知,你能夠在 K 元組版本上取得進展
(02:24:16) 然而,據我所知,你能夠在 K 元組版本上取得進展
陶哲軒
(02:24:21) 沒錯。對。所以關於陰謀論,有趣的一點是,要反駁任何一個陰謀論都非常困難。如果你相信世界是由蜥蜴人控制的,然後你提出一些證據證明並非如此 [聽不清楚 02:24:32],那就只是在談論蜥蜴而已。你可能遇過這種現象。
(02:24:21) 沒錯。對。所以關於陰謀論,有趣的一點是,要反駁任何一個陰謀論都非常困難。如果你相信世界是由蜥蜴人控制的,然後你提出一些證據證明並非如此 [聽不清楚 02:24:32],那就只是在談論蜥蜴而已。你可能遇過這種現象。
Lex Fridman
(02:24:38) 是的。
陶哲軒
(02:24:41) 幾乎沒有辦法完全排除陰謀論的可能性。數學也是如此。一個專門致力於消除孿生質數的陰謀,你還必須滲透到數學的其他領域,但至少就我們所知,它可以保持一致。但有一個奇怪的現象,你可以用一個陰謀來排除其他陰謀。所以如果世界是由蜥蜴人統治的,那就不可能是外星人統治的,對吧?
(02:24:41) 幾乎沒有辦法完全排除陰謀論的可能性。數學也是如此。一個專門致力於消除孿生質數的陰謀,你還必須滲透到數學的其他領域,但至少就我們所知,它可以保持一致。但有一個奇怪的現象,你可以用一個陰謀來排除其他陰謀。所以如果世界是由蜥蜴人統治的,那就不可能是外星人統治的,對吧?
Lex Fridman
(02:25:09) 沒錯。
陶哲軒
(02:25:09) 所以一個不合理的事情很難反駁,但多於一個,就有工具可以用了。所以,是的,舉例來說,我們知道有無限多的質數,沒有兩個...所以有無數對質數,它們之間的差最多是 246,實際上這是密碼。
(02:25:09) 所以一個不合理的事情很難反駁,但多於一個,就有工具可以用了。所以,是的,舉例來說,我們知道有無限多的質數,沒有兩個...所以有無數對質數,它們之間的差最多是 246,實際上這是密碼。
Lex Fridman
喔,所以有一個關於...的界限
喔,所以有一個關於...的界限
陶哲軒
對。所以有孿生質數,有一種叫做表兄弟質數,它們相差 4。還有一種叫做性感質數,它們相差 6。
對。所以有孿生質數,有一種叫做表兄弟質數,它們相差 4。還有一種叫做性感質數,它們相差 6。
Lex Fridman
什麼是性感質數?
什麼是性感質數?
陶哲軒
(02:25:38) 相差為六的質數。這個名稱遠不如… 它引起的迴響遠不如名稱本身所暗示的那樣。
(02:25:38) 相差為六的質數。這個名稱遠不如… 它引起的迴響遠不如名稱本身所暗示的那樣。
Lex Fridman
知道了。
知道了。
陶哲軒
所以你可以用陰謀論排除其中一個,但當你有 50 個的時候,你會發現你無法一次排除所有。在陰謀空間中,這需要太多的能量。
所以你可以用陰謀論排除其中一個,但當你有 50 個的時候,你會發現你無法一次排除所有。在陰謀空間中,這需要太多的能量。
Lex Fridman
你如何處理約束部分?你如何為微分團隊存款建立約束?
你如何處理約束部分?你如何為微分團隊存款建立約束?
陶哲軒
(02:26:01) 好的。
Lex Fridman
(02:26:01) ……有無窮多個?
(02:26:01) ……有無窮多個?
陶哲軒
(02:26:03) 所以這最終是基於所謂的鴿籠原理。鴿籠原理是指,如果你有一些鴿子,牠們都必須進入鴿籠,而且你的鴿子比鴿籠多,那麼其中一個鴿籠裡必須至少有兩隻鴿子。所以一定有兩隻鴿子靠得很近。例如,如果你有 100 個數字,它們的範圍都在 1 到 1,000 之間,那麼其中兩個數字的差距最多為 10,因為你可以將 1 到 100 之間的數字分成 100 個鴿籠。假設你有 101 個數字。101 個數字,那麼其中兩個數字的距離必須小於 10,因為其中兩個數字必須屬於同一個鴿籠。所以這是數學中的一個基本特徵,一個基本原理。
(02:26:03) 所以這最終是基於所謂的鴿籠原理。鴿籠原理是指,如果你有一些鴿子,牠們都必須進入鴿籠,而且你的鴿子比鴿籠多,那麼其中一個鴿籠裡必須至少有兩隻鴿子。所以一定有兩隻鴿子靠得很近。例如,如果你有 100 個數字,它們的範圍都在 1 到 1,000 之間,那麼其中兩個數字的差距最多為 10,因為你可以將 1 到 100 之間的數字分成 100 個鴿籠。假設你有 101 個數字。101 個數字,那麼其中兩個數字的距離必須小於 10,因為其中兩個數字必須屬於同一個鴿籠。所以這是數學中的一個基本特徵,一個基本原理。
(02:26:45) 所以它不太適用於質數,因為質數會隨著數字變大而越來越稀疏,質數的數量越來越少。但事實證明,有一種方法可以為數字分配權重。所以有些數字有點像質數,但除了它們自己和 1 之外,它們根本沒有其他因數。但它們的因數非常少。事實證明,我們對近質數的了解比質數多得多。例如,長期以來人們就知道有孿生近質數。這已經被研究出來了。所以近質數是我們可以理解的東西。所以你實際上可以將注意力限制在一組合適的近質數上。相較之下,質數總體上非常稀疏,但近質數實際上稀疏程度要小得多。
(02:27:33) 你可以設定一組幾乎是質數的數,其中質數的密度比如說是 1%。這樣你就有機會透過應用某種鴿籠原理來證明,存在相差僅 100 的質數對。但為了證明孿生質數猜想,你需要將質數的密度提高,這個密度必須達到 50% 的門檻。一旦達到 50%,你就會得到孿生質數。但不幸的是,存在一些障礙。我們知道,無論你選擇哪種好的幾乎是質數的集合,質數的密度永遠無法超過 50%。這就是宇稱障礙,我很想克服它。所以我長期的夢想之一是找到一種方法來突破這個障礙,因為它不僅會打開孿生質數猜想,還會打開哥德巴赫猜想。
(02:28:12) 並且數論中的許多其他問題目前都受阻,因為我們目前的技術需要超越這個理論上的宇稱障礙。這就像以光速行進一樣。
Lex Fridman
(02:28:24) 是的。所以我們應該說孿生質數猜想,是數學史上最大的難題之一。哥德巴赫猜想也是。它們感覺就像隔壁鄰居。有沒有哪些日子你覺得自己看到了方向?
(02:28:24) 是的。所以我們應該說孿生質數猜想,是數學史上最大的難題之一。哥德巴赫猜想也是。它們感覺就像隔壁鄰居。有沒有哪些日子你覺得自己看到了方向?
陶哲軒
(02:28:37) 喔,有啊。是的。有時候你嘗試一些東西,而且效果非常好。你再次獲得了我們之前談到的數學嗅覺。你會從經驗中得知什麼時候事情進展得太順利了,因為你必須遇到某些困難。我想一位同事可能會這樣說,如果你在紐約的街道上,你被蒙上眼睛,然後被放進一輛車裡,幾個小時後,眼罩被摘掉,然後你在北京。我的意思是,這太容易了。沒有跨越海洋。即使你不知道具體做了什麼,你也會懷疑有些事情不對勁。
(02:28:37) 喔,有啊。是的。有時候你嘗試一些東西,而且效果非常好。你再次獲得了我們之前談到的數學嗅覺。你會從經驗中得知什麼時候事情進展得太順利了,因為你必須遇到某些困難。我想一位同事可能會這樣說,如果你在紐約的街道上,你被蒙上眼睛,然後被放進一輛車裡,幾個小時後,眼罩被摘掉,然後你在北京。我的意思是,這太容易了。沒有跨越海洋。即使你不知道具體做了什麼,你也會懷疑有些事情不對勁。
Lex Fridman
(02:29:21) 但這些問題還是會縈繞在你的腦海中嗎?你會偶爾回頭看看質數問題嗎?
(02:29:21) 但這些問題還是會縈繞在你的腦海中嗎?你會偶爾回頭看看質數問題嗎?
陶哲軒
(02:29:29) 是的,當我沒什麼更好的事情做的時候,但這種時候越來越少了。我現在忙於很多事情。但當我有空閒時間,而且我不想,我太沮喪而無法進行我真正的研究項目,而且我也不想做我的行政工作,或者我不想為我的家人跑腿時。我可以玩玩這些東西來找樂子。通常你什麼都得不到。你必須告訴自己:「好吧,沒關係。再一次,什麼都沒有發生。我會繼續前進。」偶爾,其中一個問題會被真正解決。嗯,有時候就像你說的,你認為你解決了它,然後你前進了大概 15 分鐘,然後你會想:「我應該檢查一下這個。這太容易了,好得令人難以置信。」而且通常確實如此。
(02:29:29) 是的,當我沒什麼更好的事情做的時候,但這種時候越來越少了。我現在忙於很多事情。但當我有空閒時間,而且我不想,我太沮喪而無法進行我真正的研究項目,而且我也不想做我的行政工作,或者我不想為我的家人跑腿時。我可以玩玩這些東西來找樂子。通常你什麼都得不到。你必須告訴自己:「好吧,沒關係。再一次,什麼都沒有發生。我會繼續前進。」偶爾,其中一個問題會被真正解決。嗯,有時候就像你說的,你認為你解決了它,然後你前進了大概 15 分鐘,然後你會想:「我應該檢查一下這個。這太容易了,好得令人難以置信。」而且通常確實如此。
Lex Fridman
(02:30:11) 你直覺認為這些問題,像是孿生質數猜想和哥德巴赫猜想,何時會被解決?
(02:30:11) 你直覺認為這些問題,像是孿生質數猜想和哥德巴赫猜想,何時會被解決?
陶哲軒
(02:30:16) 關於孿生質數猜想,我認為我們將會——
(02:30:16) 關於孿生質數猜想,我認為我們將會——
Lex Fridman
(02:30:18) 10 年?
(02:30:18) 10 年?
陶哲軒
(02:30:19) …持續獲得更多局部成果。它至少需要一個… 這個奇偶性障礙是目前最大的阻礙。對於猜想的更簡單版本,我們已經非常接近了。所以我認為 10 年後,我們將會有更多更接近的成果,但可能無法完全解決。所以孿生質數問題相當接近了。黎曼猜想我就毫無頭緒了。我認為它可能會意外發生。
(02:30:19) …持續獲得更多局部成果。它至少需要一個… 這個奇偶性障礙是目前最大的阻礙。對於猜想的更簡單版本,我們已經非常接近了。所以我認為 10 年後,我們將會有更多更接近的成果,但可能無法完全解決。所以孿生質數問題相當接近了。黎曼猜想我就毫無頭緒了。我認為它可能會意外發生。
Lex Fridman
(02:30:47) 所以黎曼猜想是一種更廣義的關於質數分佈的猜想,對吧?
(02:30:47) 所以黎曼猜想是一種更廣義的關於質數分佈的猜想,對吧?
陶哲軒
(02:30:53) 對。是的。它聲稱,如果從乘法的角度來看,對於僅涉及乘法而不涉及加法的問題。質數的行為確實像你所希望的那樣隨機。所以在機率學中有一種稱為平方根抵銷的現象,如果你想針對某個議題在美國進行民意調查,而你只詢問了一兩個選民,你可能會得到一個糟糕的樣本,然後你就會對整體平均值得到一個非常不精確的測量。但是如果你抽樣越來越多的人,準確度會越來越好。而且準確度的提升與你抽樣的人數的平方根成正比。所以如果你抽樣 1000 人,你可以得到 2%或 3%的誤差範圍。所以在同樣的意義上,如果你以某種乘法的意義來測量質數,有一種你可以測量的特定類型的統計數據,它被稱為黎曼 zeta 函數,它會上下波動。
(02:30:53) 對。是的。它聲稱,如果從乘法的角度來看,對於僅涉及乘法而不涉及加法的問題。質數的行為確實像你所希望的那樣隨機。所以在機率學中有一種稱為平方根抵銷的現象,如果你想針對某個議題在美國進行民意調查,而你只詢問了一兩個選民,你可能會得到一個糟糕的樣本,然後你就會對整體平均值得到一個非常不精確的測量。但是如果你抽樣越來越多的人,準確度會越來越好。而且準確度的提升與你抽樣的人數的平方根成正比。所以如果你抽樣 1000 人,你可以得到 2%或 3%的誤差範圍。所以在同樣的意義上,如果你以某種乘法的意義來測量質數,有一種你可以測量的特定類型的統計數據,它被稱為黎曼 zeta 函數,它會上下波動。
(02:31:42) 但在某種意義上,隨著你不斷地平均,如果你採樣得越多,波動應該會下降,就像它們是隨機的一樣。而且有一種非常精確的方法可以量化它。而黎曼猜想就是一個非常優雅的方式來捕捉這個。但與數學中的許多其他方式一樣,我們幾乎沒有工具可以證明某件事物真正表現得非常隨機。這實際上不僅僅是有一點隨機,而是要求它的行為就像一個真正隨機的集合一樣,這個平方根抵消。而且我們知道,由於與奇偶性問題相關的事情,我們大多數常用的技術都無法解決這個問題。這個證明必須出人意料。但那是什麼,沒有人有任何嚴肅的提議。而且有各種各樣的解決方法。正如我所說,你可以稍微修改質數,你就可以摧毀黎曼猜想。
(02:32:37) 所以它必須非常精緻。你不能應用有巨大誤差範圍的東西。它必須剛剛好能起作用。而且有所有這些陷阱,你必須非常巧妙地躲避。
Lex Fridman
(02:32:50) 質數真是太迷人了。
(02:32:50) 質數真是太迷人了。
陶哲軒
(02:32:52) 是啊。是啊,是啊。
(02:32:52) 是啊。是啊,是啊。
Lex Fridman
(02:32:53) 對你來說,質數最神秘的地方是什麼?
(02:32:53) 對你來說,質數最神秘的地方是什麼?
陶哲軒
(02:33:00) 這是個好問題。根據推測,我們對質數有個不錯的模型。我的意思是,就像我說的,它們有某些模式,例如,質數通常是奇數。但撇開一些顯而易見的模式不談,它們的行為非常隨機,就像假設它們的行為一樣。所以有個稱為克拉默質數隨機模型,在某個點之後,質數的行為就像一個隨機集合。並且這個模型有各種輕微的修改。但這一直是個非常好的模型。它符合數值結果。它告訴我們該預測什麼。我可以非常肯定地告訴你,孿生質數猜想是真的。隨機模型給出了壓倒性的證據表明它是真的,但我就是無法證明它。我們的大部分數學都是為了解決有模式的東西而優化的。
(02:33:00) 這是個好問題。根據推測,我們對質數有個不錯的模型。我的意思是,就像我說的,它們有某些模式,例如,質數通常是奇數。但撇開一些顯而易見的模式不談,它們的行為非常隨機,就像假設它們的行為一樣。所以有個稱為克拉默質數隨機模型,在某個點之後,質數的行為就像一個隨機集合。並且這個模型有各種輕微的修改。但這一直是個非常好的模型。它符合數值結果。它告訴我們該預測什麼。我可以非常肯定地告訴你,孿生質數猜想是真的。隨機模型給出了壓倒性的證據表明它是真的,但我就是無法證明它。我們的大部分數學都是為了解決有模式的東西而優化的。
(02:33:39) 質數有這種反模式,就像幾乎所有事物一樣,但我們無法證明這一點。我猜質數是隨機的並不神秘,因為沒有理由讓它們有任何秘密模式。但神秘的是,究竟是什麼機制真正迫使隨機性發生?這個機制完全不存在。
考拉茲猜想
Lex Fridman
(02:34:04) 另一個極度出乎意料地困難的問題是考拉茲猜想。
(02:34:04) 另一個極度出乎意料地困難的問題是考拉茲猜想。
陶哲軒
(02:34:09) 喔,對。
(02:34:09) 喔,對。
Lex Fridman
(02:34:10) 簡單易懂,簡單且美觀,但卻極其難以解決。但你已經能夠取得進展。保羅·艾狄胥(Paul Erdos)曾說,數學可能還沒準備好解決考拉茲猜想(Collatz conjecture)這樣的問題。其他人也表示,這是一個極其困難的問題,完全遙不可及,這是 2010 年的說法,以現今的數學水平來說是遙不可及的,但你已經取得了一些進展。為什麼這麼難取得進展?你甚至可以解釋它到底是什麼嗎?這是關鍵嗎?
(02:34:10) 簡單易懂,簡單且美觀,但卻極其難以解決。但你已經能夠取得進展。保羅·艾狄胥(Paul Erdos)曾說,數學可能還沒準備好解決考拉茲猜想(Collatz conjecture)這樣的問題。其他人也表示,這是一個極其困難的問題,完全遙不可及,這是 2010 年的說法,以現今的數學水平來說是遙不可及的,但你已經取得了一些進展。為什麼這麼難取得進展?你甚至可以解釋它到底是什麼嗎?這是關鍵嗎?
陶哲軒
(02:34:41) 哦,是的。這是一個你可以解釋的問題。這需要一些視覺輔助。是的,所以你取任何一個自然數,例如 13,然後對它應用以下程序。如果它是偶數,你將它除以二,如果它是奇數,你將它乘以三再加一。所以偶數會變小,奇數會變大。所以 13 會變成 40,因為 13 乘以 3 是 39,加一得到 40。這是一個簡單的過程。對於奇數和偶數,它們都是非常容易的操作。然後你把它們放在一起,它仍然相當簡單。但是,當你問迭代它會發生什麼時?你把你剛剛得到的輸出再放回去。所以 13 變成 40,40 現在是偶數,除以二是 20。20 仍然是偶數,除以二是 10,然後是 5,然後 5 乘以 3 加 1 是 16,然後是 8、4、2、1。然後從 1 開始,它會變成 1、4、2、1、4、2、1。它會永遠循環。所以我剛才描述的序列,13、40、20、10,這些被稱為冰雹序列,因為有一個過於簡化的冰雹形成模型,實際上不太正確,但仍然以某種方式作為第一近似值教給高中生,就是一小塊冰晶在雲中形成。由於風的關係,它會上下移動。有時當它很冷的時候,它會獲得更多的質量,也許它會融化一點。這種上下移動的過程產生了這種部分融化的冰,最終導致冰雹,最終它會落到地球上。所以這個猜想是,無論你從多高的地方開始,你取一個數,數百萬或數十億,這個上升的過程,如果你是奇數,下降的過程,它最終都會回到地球上。
(02:34:41) 哦,是的。這是一個你可以解釋的問題。這需要一些視覺輔助。是的,所以你取任何一個自然數,例如 13,然後對它應用以下程序。如果它是偶數,你將它除以二,如果它是奇數,你將它乘以三再加一。所以偶數會變小,奇數會變大。所以 13 會變成 40,因為 13 乘以 3 是 39,加一得到 40。這是一個簡單的過程。對於奇數和偶數,它們都是非常容易的操作。然後你把它們放在一起,它仍然相當簡單。但是,當你問迭代它會發生什麼時?你把你剛剛得到的輸出再放回去。所以 13 變成 40,40 現在是偶數,除以二是 20。20 仍然是偶數,除以二是 10,然後是 5,然後 5 乘以 3 加 1 是 16,然後是 8、4、2、1。然後從 1 開始,它會變成 1、4、2、1、4、2、1。它會永遠循環。所以我剛才描述的序列,13、40、20、10,這些被稱為冰雹序列,因為有一個過於簡化的冰雹形成模型,實際上不太正確,但仍然以某種方式作為第一近似值教給高中生,就是一小塊冰晶在雲中形成。由於風的關係,它會上下移動。有時當它很冷的時候,它會獲得更多的質量,也許它會融化一點。這種上下移動的過程產生了這種部分融化的冰,最終導致冰雹,最終它會落到地球上。所以這個猜想是,無論你從多高的地方開始,你取一個數,數百萬或數十億,這個上升的過程,如果你是奇數,下降的過程,它最終都會回到地球上。
Lex Fridman
(02:36:23) 不管你從多麼簡單的演算法開始,最終都會回到 1。而且你可能會向上爬一段時間——
(02:36:23) 不管你從多麼簡單的演算法開始,最終都會回到 1。而且你可能會向上爬一段時間——
陶哲軒
(02:36:29) 對。
Lex Fridman
(02:36:29) ……然後下來。
(02:36:29) ……然後下來。
陶哲軒
(02:36:29) 是的。所以,如果你把這些序列畫出來,它們看起來就像布朗運動。它們看起來像股票市場。它們只是以看似隨機的模式上下波動。事實上,通常情況就是這樣,如果你輸入一個隨機數,你實際上可以證明,至少最初,它看起來會像一個隨機遊走。而這實際上是一個帶有向下漂移的隨機遊走。就像你總是在賭場玩輪盤賭,賠率略微對你不利一樣。所以有時你贏,有時你輸。但從長遠來看,你輸的比贏的多一點。所以通常如果一直玩下去,你的錢包會歸零。
(02:36:29) 是的。所以,如果你把這些序列畫出來,它們看起來就像布朗運動。它們看起來像股票市場。它們只是以看似隨機的模式上下波動。事實上,通常情況就是這樣,如果你輸入一個隨機數,你實際上可以證明,至少最初,它看起來會像一個隨機遊走。而這實際上是一個帶有向下漂移的隨機遊走。就像你總是在賭場玩輪盤賭,賠率略微對你不利一樣。所以有時你贏,有時你輸。但從長遠來看,你輸的比贏的多一點。所以通常如果一直玩下去,你的錢包會歸零。
Lex Fridman
(02:37:07) 所以統計上來說,我們往這裡走是有道理的嗎?
(02:37:07) 所以統計上來說,我們往這裡走是有道理的嗎?
陶哲軒
(02:37:11) 是的。所以我證明的結果大略是說,統計上來說,大約 99%的輸入會下降到,也許不是完全到 1,但會比你開始時小很多很多。就像如果我告訴你,如果你去賭場,大多數時候,如果你玩得夠久,你最終錢包裡的錢會比你開始時少。這有點像我證明的結果。
(02:37:11) 是的。所以我證明的結果大略是說,統計上來說,大約 99%的輸入會下降到,也許不是完全到 1,但會比你開始時小很多很多。就像如果我告訴你,如果你去賭場,大多數時候,如果你玩得夠久,你最終錢包裡的錢會比你開始時少。這有點像我證明的結果。
Lex Fridman
(02:37:35) 那為什麼那個結果… 你能沿著那條思路繼續證明完整的猜想嗎?
(02:37:35) 那為什麼那個結果… 你能沿著那條思路繼續證明完整的猜想嗎?
陶哲軒
(02:37:42) 嗯,問題是我使用了機率論的論證,而且總是有這種例外事件。所以在機率中,我們有這個大數法則,它告訴你,如果你在賭場玩一個隨著時間推移期望值會輸的遊戲,你幾乎肯定會輸錢,機率幾乎接近你希望的 100%。但總是有這個例外的離群值。即使在遊戲中賠率不利的情況下,在數學上也是有可能你一直贏的次數比輸的次數稍微多一點。非常像 Navier-Stokes 方程式,大多數時候你的波可以消散,但可能會有一個離群值的初始條件選擇會導致你崩潰。而且可能會有一個離群值的特殊數字,他們把它放進去,它會射向無窮大,而所有其他數字都會墜落到地球,墜落到 1。
(02:37:42) 嗯,問題是我使用了機率論的論證,而且總是有這種例外事件。所以在機率中,我們有這個大數法則,它告訴你,如果你在賭場玩一個隨著時間推移期望值會輸的遊戲,你幾乎肯定會輸錢,機率幾乎接近你希望的 100%。但總是有這個例外的離群值。即使在遊戲中賠率不利的情況下,在數學上也是有可能你一直贏的次數比輸的次數稍微多一點。非常像 Navier-Stokes 方程式,大多數時候你的波可以消散,但可能會有一個離群值的初始條件選擇會導致你崩潰。而且可能會有一個離群值的特殊數字,他們把它放進去,它會射向無窮大,而所有其他數字都會墜落到地球,墜落到 1。
(02:38:40) 事實上,有些數學家,例如 Alex Kontorovich,他們提出實際上這些崩潰迭代就像這些類似的自動機。實際上,如果你看看它們在二進制中發生了什麼,它們確實看起來有點像這些生命遊戲類型的模式。並且類似於生命遊戲如何創造這些大規模的自我複製對象等等,或許你可以創造某種比空氣重的飛行機器。一個實際上正在編碼這台機器的數字,而這台機器的工作就是編碼,就是創造一個更大的版本。
Lex Fridman
(02:39:17) 比空氣重的機器被編碼成一個數字——
(02:39:17) 比空氣重的機器被編碼成一個數字——
陶哲軒
(02:39:20) 是的。
Lex Fridman
(02:39:20) ……可以永遠飛行。
(02:39:20) ……可以永遠飛行。
陶哲軒
(02:39:22) 所以康威實際上也研究過這個問題。
(02:39:22) 所以康威實際上也研究過這個問題。
Lex Fridman
(02:39:25) 哇,太驚人了。
(02:39:25) 哇,太驚人了。
陶哲軒
(02:39:26) Conway 的研究非常相似,事實上,這對 Navier-Stokes 計畫更有啟發性。 Conway 研究了摺疊問題的推廣,其中不是乘以三加一或除以二,而是有更複雜的分支列表。但不是只有兩種情況,可能有 17 種情況,然後你上升和下降。他證明一旦你的迭代變得足夠複雜,你實際上可以編碼圖靈機,並且你可以使這些問題無法判定,並做類似的事情。事實上,他為這些分數線性變換發明了一種程式語言。他稱之為 frac-trat,取自 full-trat 的諧音。他證明你可以編程,它是圖靈完備的,你可以製作一個程式,如果你的輸入數字被編碼為質數,它會降到零。
(02:39:26) Conway 的研究非常相似,事實上,這對 Navier-Stokes 計畫更有啟發性。 Conway 研究了摺疊問題的推廣,其中不是乘以三加一或除以二,而是有更複雜的分支列表。但不是只有兩種情況,可能有 17 種情況,然後你上升和下降。他證明一旦你的迭代變得足夠複雜,你實際上可以編碼圖靈機,並且你可以使這些問題無法判定,並做類似的事情。事實上,他為這些分數線性變換發明了一種程式語言。他稱之為 frac-trat,取自 full-trat 的諧音。他證明你可以編程,它是圖靈完備的,你可以製作一個程式,如果你的輸入數字被編碼為質數,它會降到零。
(02:40:13) 它會下降,否則它會上升,諸如此類。所以這類問題實際上與所有數學一樣複雜。
Lex Fridman
(02:40:23) 我們討論過的細胞自動機的一些神秘之處,需要一個數學框架才能對細胞自動機有所了解,或許也需要同樣的框架。是的,哥德巴赫猜想。
(02:40:23) 我們討論過的細胞自動機的一些神秘之處,需要一個數學框架才能對細胞自動機有所了解,或許也需要同樣的框架。是的,哥德巴赫猜想。
陶哲軒
(02:40:35) 對。如果你想做到,不是統計上的,而是真正想要所有地球的輸入都 100%正確。是的。所以,可能可行的是,統計上 99%的輸入都導向一個結果,但要保證所有輸入都正確,這看起來很難。
(02:40:35) 對。如果你想做到,不是統計上的,而是真正想要所有地球的輸入都 100%正確。是的。所以,可能可行的是,統計上 99%的輸入都導向一個結果,但要保證所有輸入都正確,這看起來很難。
P = NP 問題
Lex Fridman
(02:40:50) 在這些觸手可及的著名問題中,你認為今天我們面臨的最難問題是什麼?是黎曼猜想嗎?
(02:40:50) 在這些觸手可及的著名問題中,你認為今天我們面臨的最難問題是什麼?是黎曼猜想嗎?
陶哲軒
(02:40:59) 嗯,它就在那裡。P=NP 是一個很好的問題,因為它是一個元問題。如果你以積極的意義解決它,也就是你可以找到一個 P=NP 演算法,那麼這有可能解決許多其他的問題。
(02:40:59) 嗯,它就在那裡。P=NP 是一個很好的問題,因為它是一個元問題。如果你以積極的意義解決它,也就是你可以找到一個 P=NP 演算法,那麼這有可能解決許多其他的問題。
Lex Fridman
(02:41:14) 我們應該提及我們一直在談論的一些猜想。現在很多東西都建立在它們之上。會產生連鎖反應。P=NP 的連鎖反應比基本上任何其他問題都多。
(02:41:14) 我們應該提及我們一直在談論的一些猜想。現在很多東西都建立在它們之上。會產生連鎖反應。P=NP 的連鎖反應比基本上任何其他問題都多。
陶哲軒
(02:41:24) 沒錯。如果黎曼猜想被推翻,那將對數論學家造成很大的精神衝擊。但它會對密碼學產生後續影響,因為很多密碼學都使用數論,使用涉及質數等的數論結構。它非常依賴於數論學家多年來建立的直覺,即涉及質數的哪些運算表現出隨機性,哪些則不然?特別是,加密方法旨在將文字書寫的資訊轉換成文字,使其與隨機噪音無法區分。因此,我們認為幾乎不可能破解,至少在數學上是如此。但如果有些事情讓我們對黎曼猜想的正確性產生懷疑,那就意味著質數中存在我們沒有意識到的實際模式。
(02:41:24) 沒錯。如果黎曼猜想被推翻,那將對數論學家造成很大的精神衝擊。但它會對密碼學產生後續影響,因為很多密碼學都使用數論,使用涉及質數等的數論結構。它非常依賴於數論學家多年來建立的直覺,即涉及質數的哪些運算表現出隨機性,哪些則不然?特別是,加密方法旨在將文字書寫的資訊轉換成文字,使其與隨機噪音無法區分。因此,我們認為幾乎不可能破解,至少在數學上是如此。但如果有些事情讓我們對黎曼猜想的正確性產生懷疑,那就意味著質數中存在我們沒有意識到的實際模式。
(02:42:21) 如果有一個,可能還會有更多。突然間,我們很多的加密系統都受到了質疑。
Lex Fridman
(02:42:27)對。但你如何談論質數呢?
(02:42:27)對。但你如何談論質數呢?
陶哲軒
(02:42:33)對。
Lex Fridman
(02:42:34)...因為考拉茲猜想,你又將如何談論那些你正在研究的質數呢?因為,你希望它是隨機的,對吧?
(02:42:34)...因為考拉茲猜想,你又將如何談論那些你正在研究的質數呢?因為,你希望它是隨機的,對吧?
陶哲軒
(02:42:41)是的。
Lex Fridman
(02:42:41) 你希望它是隨機的嗎?
(02:42:41) 你希望它是隨機的嗎?
陶哲軒
(02:42:43) 是的。更廣泛地說,我只是在尋找更多工具,更多方法來證明事情是隨機的。你如何證明陰謀論不存在?
(02:42:43) 是的。更廣泛地說,我只是在尋找更多工具,更多方法來證明事情是隨機的。你如何證明陰謀論不存在?
Lex Fridman
(02:42:49) 對。在你來看,P 等於 NP 有任何可能性嗎?你能想像一個可能的宇宙嗎?
(02:42:49) 對。在你來看,P 等於 NP 有任何可能性嗎?你能想像一個可能的宇宙嗎?
陶哲軒
(02:42:57) 這是有可能的。我的意思是,存在各種情況。我的意思是,有一種情況在技術上是可能的,但實際上永遠無法實現。證據有點傾向於否定,可能 P 不等於 NP。
(02:42:57) 這是有可能的。我的意思是,存在各種情況。我的意思是,有一種情況在技術上是可能的,但實際上永遠無法實現。證據有點傾向於否定,可能 P 不等於 NP。
Lex Fridman
(02:43:11) 我是說,這似乎跟黎曼猜想有點類似。我認為證據相當程度地傾向於否定。
(02:43:11) 我是說,這似乎跟黎曼猜想有點類似。我認為證據相當程度地傾向於否定。
陶哲軒
(02:43:20) 肯定是否定的成分居多。P 等於 NP 這個問題有趣的地方在於,相較於幾乎所有其他問題,我們有更多的阻礙。雖然有證據,但我們也有很多結果排除了解決這個問題的許多、許多類型的方法。這是電腦科學實際上非常擅長的一件事。它實際上是在說某些方法行不通。否決定理。這也可能是不可判定的,是的,我們不知道。
(02:43:20) 肯定是否定的成分居多。P 等於 NP 這個問題有趣的地方在於,相較於幾乎所有其他問題,我們有更多的阻礙。雖然有證據,但我們也有很多結果排除了解決這個問題的許多、許多類型的方法。這是電腦科學實際上非常擅長的一件事。它實際上是在說某些方法行不通。否決定理。這也可能是不可判定的,是的,我們不知道。
費爾茲獎
Lex Fridman
(02:43:43) 我讀過一個有趣的故事,說你贏得費爾茲獎後,網路上有人寫信問你,贏得這個聲望卓著的獎項後,你打算做什麼?然後你很快、非常謙虛地回答說,一塊閃亮的金屬並不能解決我目前正在研究的任何問題,所以我會繼續研究它們。首先,在這個背景下你會回覆電子郵件,這讓我覺得很有趣,其次,這也顯示了你的謙遜。無論如何,也許你可以談談費爾茲獎,但這也是我另一個問你關於格里戈里·佩雷爾曼的方式。你怎麼看待他拒絕接受費爾茲獎和千禧年大獎,以及隨之而來的 100 萬美元獎金。他聲稱:「我對金錢或名譽不感興趣。這個獎對我來說完全無關緊要。如果證明是正確的,那麼就不需要其他認可。」
(02:43:43) 我讀過一個有趣的故事,說你贏得費爾茲獎後,網路上有人寫信問你,贏得這個聲望卓著的獎項後,你打算做什麼?然後你很快、非常謙虛地回答說,一塊閃亮的金屬並不能解決我目前正在研究的任何問題,所以我會繼續研究它們。首先,在這個背景下你會回覆電子郵件,這讓我覺得很有趣,其次,這也顯示了你的謙遜。無論如何,也許你可以談談費爾茲獎,但這也是我另一個問你關於格里戈里·佩雷爾曼的方式。你怎麼看待他拒絕接受費爾茲獎和千禧年大獎,以及隨之而來的 100 萬美元獎金。他聲稱:「我對金錢或名譽不感興趣。這個獎對我來說完全無關緊要。如果證明是正確的,那麼就不需要其他認可。」
陶哲軒
(02:44:40) 沒錯,他有點像是個異類,即使是在那些往往抱持理想主義觀點的數學家之中。我從未見過他。我想有一天我會對見他感興趣,但我從未有機會。我認識一些見過他的人。他對某些事情總是抱持強烈的看法。我的意思是,並不是說他完全與數學界隔絕。我的意思是,他會演講、寫論文等等,但在某個時候,他只是決定不做了。
(02:44:40) 沒錯,他有點像是個異類,即使是在那些往往抱持理想主義觀點的數學家之中。我從未見過他。我想有一天我會對見他感興趣,但我從未有機會。我認識一些見過他的人。他對某些事情總是抱持強烈的看法。我的意思是,並不是說他完全與數學界隔絕。我的意思是,他會演講、寫論文等等,但在某個時候,他只是決定不做了。
陶哲軒
(02:45:00) ... 他會演講、寫論文等等,但在某個時候,他只是決定不與社群的其他成員互動。他感到幻滅或什麼的,我不知道。然後他決定離開,去聖彼得堡採蘑菇或什麼的。這也沒關係,你可以這麼做。那是另一種反面。我們解決的許多問題,有些確實有實際應用,這很棒。但如果你停止思考一個問題,所以他自那以後就沒有在這個領域發表過任何東西,但這也沒關係。還有很多很多人也這麼做了。
(02:45:00) ... 他會演講、寫論文等等,但在某個時候,他只是決定不與社群的其他成員互動。他感到幻滅或什麼的,我不知道。然後他決定離開,去聖彼得堡採蘑菇或什麼的。這也沒關係,你可以這麼做。那是另一種反面。我們解決的許多問題,有些確實有實際應用,這很棒。但如果你停止思考一個問題,所以他自那以後就沒有在這個領域發表過任何東西,但這也沒關係。還有很多很多人也這麼做了。
(02:45:39) 是的。所以我猜測我最初沒有意識到的一件事是,菲爾茲獎會讓你成為體制的一部分。所以大多數數學家,只是以數學為職業的數學家,你只要專注於發表下一篇論文,或許升一級,然後開始一些項目,可能帶了一些學生或什麼的。但突然間人們想要你對事情的看法,你必須稍微思考一下你可能會愚蠢地說出的話,因為你知道沒人會聽你的,但現在這更重要了。
Lex Fridman
(02:46:11) 這對你有限制嗎?你還能玩得開心,當個叛逆者,嘗試瘋狂的事情,玩弄想法嗎?
(02:46:11) 這對你有限制嗎?你還能玩得開心,當個叛逆者,嘗試瘋狂的事情,玩弄想法嗎?
陶哲軒
(02:46:19) 我現在的空閒時間比以前少很多,這主要是我自己選擇的。我總是可以選擇拒絕,所以我拒絕了很多事情。我可以拒絕更多,或者我可以讓自己變得非常不可靠,以至於人們都不再問我了。
(02:46:19) 我現在的空閒時間比以前少很多,這主要是我自己選擇的。我總是可以選擇拒絕,所以我拒絕了很多事情。我可以拒絕更多,或者我可以讓自己變得非常不可靠,以至於人們都不再問我了。
Lex Fridman
(02:46:38) 我很喜歡這裡不同的演算法。這太棒了。
(02:46:38) 我很喜歡這裡不同的演算法。這太棒了。
陶哲軒
(02:46:41) 這永遠是一個選項,但有些事情我花的時間不像當博士後時那麼多,那時我一次只專注於一個問題,或是隨意摸索。我現在還是會做一點,但沒那麼多了。不過,隨著你的職業生涯不斷發展,你會需要更多軟技能,數學似乎把所有的技術技能都前置到你職業生涯的早期階段。所以當博士後時,你要嘛發表文章,要嘛就被淘汰。你會被激勵去專注於證明非常技術性的定理,證明你自己,也證明演算法。但當你資歷更深時,你必須開始指導他人、接受採訪,並試圖塑造領域的方向,無論是研究方面還是有時你必須做各種行政事務。這是一種正確的社會契約,因為你需要在第一線工作,才能了解什麼能幫助數學家。
(02:46:41) 這永遠是一個選項,但有些事情我花的時間不像當博士後時那麼多,那時我一次只專注於一個問題,或是隨意摸索。我現在還是會做一點,但沒那麼多了。不過,隨著你的職業生涯不斷發展,你會需要更多軟技能,數學似乎把所有的技術技能都前置到你職業生涯的早期階段。所以當博士後時,你要嘛發表文章,要嘛就被淘汰。你會被激勵去專注於證明非常技術性的定理,證明你自己,也證明演算法。但當你資歷更深時,你必須開始指導他人、接受採訪,並試圖塑造領域的方向,無論是研究方面還是有時你必須做各種行政事務。這是一種正確的社會契約,因為你需要在第一線工作,才能了解什麼能幫助數學家。
Lex Fridman
(02:47:40) 另一方面,從機構的角度來看,真正積極的一點是,你可以成為一盞明燈,激勵許多年輕的數學家,或只是對數學感興趣的年輕人。就像是——
(02:47:40) 另一方面,從機構的角度來看,真正積極的一點是,你可以成為一盞明燈,激勵許多年輕的數學家,或只是對數學感興趣的年輕人。就像是——
陶哲軒
(02:47:52) 對,沒錯。
(02:47:52) 對,沒錯。
Lex Fridman
(02:47:52) ……這就是人類思維的運作方式。我認為費爾茲獎確實能激勵許多人,這就是人類大腦的運作方式。同時,我也想對像格里戈里·佩雷爾曼這樣批評獎項的人表示敬意。在他看來,那些是他的原則,任何人為了自己的原則能做到大多數人做不到的事,都是很美的。
(02:47:52) ……這就是人類思維的運作方式。我認為費爾茲獎確實能激勵許多人,這就是人類大腦的運作方式。同時,我也想對像格里戈里·佩雷爾曼這樣批評獎項的人表示敬意。在他看來,那些是他的原則,任何人為了自己的原則能做到大多數人做不到的事,都是很美的。
陶哲軒
(02:48:25) 一些認可還是必要且重要的,但重要的是不要讓這些事情佔據你的生活,只關心獲得下一個大獎之類的。所以你會看到有些人只想解決非常大的數學問題,而不去做那些不那麼吸引人,但實際上仍然有趣且具有指導意義的事情。正如你所說,人類思維的運作方式是,當事物與人聯繫在一起,或者與少數人聯繫在一起時,我們才能更好地理解它們。我們的大腦結構讓我們能夠理解 10 到 20 人之間的關係。但一旦超過 100 人,就會有一個極限,我想這有一個名稱,超過這個極限,其他人就成了「他者」。
(02:48:25) 一些認可還是必要且重要的,但重要的是不要讓這些事情佔據你的生活,只關心獲得下一個大獎之類的。所以你會看到有些人只想解決非常大的數學問題,而不去做那些不那麼吸引人,但實際上仍然有趣且具有指導意義的事情。正如你所說,人類思維的運作方式是,當事物與人聯繫在一起,或者與少數人聯繫在一起時,我們才能更好地理解它們。我們的大腦結構讓我們能夠理解 10 到 20 人之間的關係。但一旦超過 100 人,就會有一個極限,我想這有一個名稱,超過這個極限,其他人就成了「他者」。
(02:49:18) 因此,你必須簡化(聽不清 02:49:21)99.9%的人類都成了「他者」。通常這些模型是不正確的,這會導致各種問題。所以,要使一個主題人性化,如果你確定少數人並說這些人是該主題的代表人物,例如榜樣,這有一定的作用,但過猶不及,因為我會第一個說我自己的職業道路並不是一個典型的數學家。非常快的教育進程,我跳了很多級。我認為我一直有非常幸運的指導機會,而且我認為我在正確的時間出現在了正確的地點。僅僅因為某人沒有像我這樣的軌跡,並不意味著他們不能成為優秀的數學家。他們可以成為優秀的數學家,但風格會非常不同,而且我們需要不同風格的人。
(02:50:16) 而且有時候,人們太過於關注完成數學或其他領域專案的最後一步的人,但這個專案實際上已經歷了數個世紀或數十年,建立在大量先前研究的基礎之上。但如果你不是專家,就很難講述這樣的故事。直接說某個人完成了某件事更容易,這樣能簡化歷史。
Lex Fridman
(02:50:40) 我認為整體而言,這是一件非常正面的事情。談到史蒂夫·賈伯斯作為蘋果的代表,我個人認識,當然大家也都知道那些令人難以置信的設計,令人難以置信的工程團隊,以及那些團隊中的每一個個體。他們不是一個團隊,他們是團隊中的個體,那裡有很多才華,但這只是一個簡潔的說法,就像π,史蒂夫·賈伯斯,π。
(02:50:40) 我認為整體而言,這是一件非常正面的事情。談到史蒂夫·賈伯斯作為蘋果的代表,我個人認識,當然大家也都知道那些令人難以置信的設計,令人難以置信的工程團隊,以及那些團隊中的每一個個體。他們不是一個團隊,他們是團隊中的個體,那裡有很多才華,但這只是一個簡潔的說法,就像π,史蒂夫·賈伯斯,π。
陶哲軒
(02:51:08) 是的,作為一個起點,作為一個初步的近似,你就是這樣做的。
(02:51:08) 是的,作為一個起點,作為一個初步的近似,你就是這樣做的。
Lex Fridman
(02:51:13) 然後讀一些傳記,然後更深入地研究一下這個初步的近似。
(02:51:13) 然後讀一些傳記,然後更深入地研究一下這個初步的近似。
安德魯·懷爾斯與費馬最後定理
陶哲軒
沒錯。
Lex Fridman
(02:51:17)沒錯。你提到你也在普林斯頓。當時安德魯·懷爾斯也在那裡——
(02:51:17)沒錯。你提到你也在普林斯頓。當時安德魯·懷爾斯也在那裡——
陶哲軒
(02:51:22)喔,對。
(02:51:22)喔,對。
Lex Fridman
(02:51:22)……他是那裡的教授。歷史的相互關聯性真是個有趣的時刻,當時他宣布他證明了費馬最後定理。回顧數學史上的那個時刻,你當時的想法是什麼?
(02:51:22)……他是那裡的教授。歷史的相互關聯性真是個有趣的時刻,當時他宣布他證明了費馬最後定理。回顧數學史上的那個時刻,你當時的想法是什麼?
陶哲軒
(02:51:37)是的,當時我還是個研究生。我隱約記得當時有媒體關注,我們都在同一個郵件室裡有信箱,所以我們都收到郵件,突然安德魯·懷爾斯的信箱就被塞爆了。
(02:51:37)是的,當時我還是個研究生。我隱約記得當時有媒體關注,我們都在同一個郵件室裡有信箱,所以我們都收到郵件,突然安德魯·懷爾斯的信箱就被塞爆了。
Lex Fridman
(02:51:53) 這是一個很好的衡量標準。
(02:51:53) 這是一個很好的衡量標準。
陶哲軒
(02:51:54) 是啊。我們都在茶餘飯後談論過它。我們並不理解。我們大多數人都不太理解這個證明。我們理解高層次的細節。事實上,有一個正在進行的項目要用 Lean 將其形式化。Kevin Buzzard 實際上是——
(02:51:54) 是啊。我們都在茶餘飯後談論過它。我們並不理解。我們大多數人都不太理解這個證明。我們理解高層次的細節。事實上,有一個正在進行的項目要用 Lean 將其形式化。Kevin Buzzard 實際上是——
Lex Fridman
(02:52:09) 好。我們可以稍微岔開話題嗎?這有多困難?因為據我所知,費馬最後定理的證明有非常複雜的物件?
(02:52:09) 好。我們可以稍微岔開話題嗎?這有多困難?因為據我所知,費馬最後定理的證明有非常複雜的物件?
陶哲軒
(02:52:20) 是啊。
Lex Fridman
(02:52:21) 現在要把它形式化真的很困難。
(02:52:21) 現在要把它形式化真的很困難。
陶哲軒
(02:52:22) 嗯,我想也是。對,你說得對。他們使用的那些物件,你可以定義它們。它們已經在 Lean 中被定義了,所以光是定義它們是什麼就可以做到。這其實並非易事,但已經完成了。但是關於這些物件,有很多非常基本的性質,數學界花了幾十年,在各種不同的論文中才證明出來。所以很多這些性質也必須被形式化。Kevin Buzzard 的目標,實際上他有一個為期五年的計畫,要把費馬最後定理形式化,他的目標是他認為他無法一路追溯到最基本的公理,但他希望將它形式化到一個程度,即他唯一需要依賴的黑盒子,是 1980 年代當時一些數論學家已知的東西,然後需要其他人或其他研究才能從那裡繼續往下走。
(02:52:22) 嗯,我想也是。對,你說得對。他們使用的那些物件,你可以定義它們。它們已經在 Lean 中被定義了,所以光是定義它們是什麼就可以做到。這其實並非易事,但已經完成了。但是關於這些物件,有很多非常基本的性質,數學界花了幾十年,在各種不同的論文中才證明出來。所以很多這些性質也必須被形式化。Kevin Buzzard 的目標,實際上他有一個為期五年的計畫,要把費馬最後定理形式化,他的目標是他認為他無法一路追溯到最基本的公理,但他希望將它形式化到一個程度,即他唯一需要依賴的黑盒子,是 1980 年代當時一些數論學家已知的東西,然後需要其他人或其他研究才能從那裡繼續往下走。
(02:53:13) 所以這和我習慣的數學領域不太一樣。在分析學中,也就是我的專業領域,我們研究的對象其實更貼近基礎。我研究像是質數、函數,以及其他在高中數學教育範圍內至少可以定義的東西。但是,在數論中,有一個非常高等的代數面向,人們已經在那裡建立起一層又一層的結構很長一段時間了,而且這是一個非常堅固的結構。至少在基礎部分,它已經發展得非常完善,有教科書等等。但問題是,如果你沒有花費這些年的時間學習,而你想問關於這個高塔第六層正在發生的事情,你必須花相當多的時間,他們才能讓你看到一些你認得的東西。
Lex Fridman
(02:54:07) 在他的旅程中,有什麼啟發了你?就像我們之前談到的,他花了七年多的時間幾乎都在秘密研究。
(02:54:07) 在他的旅程中,有什麼啟發了你?就像我們之前談到的,他花了七年多的時間幾乎都在秘密研究。
陶哲軒
(02:54:15) 是的,這有點符合人們對數學家的浪漫想像,他們認為數學家都是些古怪的巫師之類的。所以這肯定更加強了這種觀點。這是一個偉大的成就。他解決問題的方式與我自己的非常不同,這很好。我們需要這樣的人。
(02:54:15) 是的,這有點符合人們對數學家的浪漫想像,他們認為數學家都是些古怪的巫師之類的。所以這肯定更加強了這種觀點。這是一個偉大的成就。他解決問題的方式與我自己的非常不同,這很好。我們需要這樣的人。
Lex Fridman
(02:54:46) 你能談談這方面嗎?例如,你喜歡合作?
(02:54:46) 你能談談這方面嗎?例如,你喜歡合作?
陶哲軒
(02:54:49) 如果一個問題太難,我喜歡先放下它。
(02:54:49) 如果一個問題太難,我喜歡先放下它。
Lex Fridman
明白了。
明白了。
陶哲軒
但你需要那些有韌性和無畏精神的人。我和這樣的人合作過,當我們嘗試的第一種方法行不通,第二種方法也行不通時,我其實想放棄。但他們深信不疑,並且有第三、第四和第五種方法,最終成功了。然後我就得承認自己錯了,「好吧。我原本不認為這會成功,但你是對的。」
但你需要那些有韌性和無畏精神的人。我和這樣的人合作過,當我們嘗試的第一種方法行不通,第二種方法也行不通時,我其實想放棄。但他們深信不疑,並且有第三、第四和第五種方法,最終成功了。然後我就得承認自己錯了,「好吧。我原本不認為這會成功,但你是對的。」
生產力
Lex Fridman
對於那些不了解的人,我們應該說,你不僅以你作品的卓越聞名,還以驚人的生產力聞名,論文的數量非常多,而且質量都非常高。所以,能夠從一個主題跳到另一個主題,這本身就值得稱道。
對於那些不了解的人,我們應該說,你不僅以你作品的卓越聞名,還以驚人的生產力聞名,論文的數量非常多,而且質量都非常高。所以,能夠從一個主題跳到另一個主題,這本身就值得稱道。
陶哲軒
(02:55:31) 對我來說這方法有效。但也有很多人效率很高,而且他們非常專注。我想每個人都必須找到自己的工作方式。數學界令人遺憾的一點是,數學教學方法往往一體適用,所以我們會有一定的課程等等。也許如果你參加數學競賽之類的活動,你會得到稍微不同的體驗。但我認為很多人直到很晚,或通常太晚才找到他們天生的數學語言。所以他們停止做數學,並且因為老師試圖用他們不喜歡的方式教數學,而有不好的經驗。
(02:55:31) 對我來說這方法有效。但也有很多人效率很高,而且他們非常專注。我想每個人都必須找到自己的工作方式。數學界令人遺憾的一點是,數學教學方法往往一體適用,所以我們會有一定的課程等等。也許如果你參加數學競賽之類的活動,你會得到稍微不同的體驗。但我認為很多人直到很晚,或通常太晚才找到他們天生的數學語言。所以他們停止做數學,並且因為老師試圖用他們不喜歡的方式教數學,而有不好的經驗。
(02:56:12) 我的理論是,人類並非天生就具備數學能力,演化並未直接賦予我們大腦中的數學中心。我們擁有視覺中心、語言中心和其他一些中心,這些都是演化所磨練出來的,但我們沒有天生的數學直覺。然而,我們其他的中心已經足夠成熟,可以將大腦的其他區域重新用於數學。因此,有些人已經弄清楚如何利用視覺中心來進行數學運算,所以在做數學時,他們會以非常視覺化的方式思考。有些人則重新利用他們的語言中心,並以非常符號化的方式思考。還有些人,如果他們非常有競爭力且熱衷於遊戲,他們大腦中有一部分非常擅長解決謎題和遊戲,而這部分也可以被重新利用。
(02:57:02) 但當我與數學家們交談時,他們並不完全這麼認為,我能感覺到他們在使用一些不同的思考方式,並非完全不相交,但他們可能更偏好視覺化的方式。我個人其實不太喜歡視覺化的方式。我需要大量的視覺輔助。數學提供了一種共通的語言,所以即使我們用不同的方式思考,我們仍然可以互相溝通。
Lex Fridman
(02:57:26) 但你能感覺到在思考過程中,使用了不同的子系統?
(02:57:26) 但你能感覺到在思考過程中,使用了不同的子系統?
陶哲軒
(02:57:32) 是的,他們採取不同的路徑。他們對於我感到困難的事情非常擅長,反之亦然,但他們最終仍然能達到相同的目標。
(02:57:32) 是的,他們採取不同的路徑。他們對於我感到困難的事情非常擅長,反之亦然,但他們最終仍然能達到相同的目標。
Lex Fridman
(02:57:39) 太美妙了。
(02:57:39) 太美妙了。
陶哲軒
(02:57:41) 但我們的教育方式,除非你有專屬的家教之類的,不然教育,某種程度上,數學技能必須大量生產,你必須教 30 個孩子。如果他們有 30 種不同的風格,你不可能用 30 種不同的方式來教。
(02:57:41) 但我們的教育方式,除非你有專屬的家教之類的,不然教育,某種程度上,數學技能必須大量生產,你必須教 30 個孩子。如果他們有 30 種不同的風格,你不可能用 30 種不同的方式來教。
給年輕人的建議
Lex Fridman
(02:57:55) 關於這個話題,你會給正在努力學習數學,但對數學感興趣並想學好的年輕學生什麼建議? 在這個複雜的教育背景下,有沒有什麼建議?
(02:57:55) 關於這個話題,你會給正在努力學習數學,但對數學感興趣並想學好的年輕學生什麼建議? 在這個複雜的教育背景下,有沒有什麼建議?
陶哲軒
(02:58:10) 是的,這是個棘手的問題。一件好事是,現在課堂外有很多數學充實的資源。在我那個年代,有數學競賽,圖書館裡也有流行的數學書籍。但現在你有 YouTube。有專門用於解決數學難題的論壇。而且數學也出現在其他地方。例如,有些業餘愛好者為了好玩而玩撲克,他們出於非常特定的原因,對非常具體的機率問題感興趣。實際上,在撲克、西洋棋、棒球界,都有一個業餘機率學家的社群。數學無處不在,我希望實際上透過 Lean 等新工具,我們可以將更廣泛的公眾納入數學研究項目。目前這種情況幾乎沒有發生。
(02:58:10) 是的,這是個棘手的問題。一件好事是,現在課堂外有很多數學充實的資源。在我那個年代,有數學競賽,圖書館裡也有流行的數學書籍。但現在你有 YouTube。有專門用於解決數學難題的論壇。而且數學也出現在其他地方。例如,有些業餘愛好者為了好玩而玩撲克,他們出於非常特定的原因,對非常具體的機率問題感興趣。實際上,在撲克、西洋棋、棒球界,都有一個業餘機率學家的社群。數學無處不在,我希望實際上透過 Lean 等新工具,我們可以將更廣泛的公眾納入數學研究項目。目前這種情況幾乎沒有發生。
(02:59:13) 所以在科學領域,公民科學有發揮的空間,像是天文學家。有些業餘人士會發現彗星,還有生物學家,人們可以辨識蝴蝶等等。在數學方面,業餘數學家可以發現新的質數等等,這類活動的數量很少。但過去,因為我們必須驗證每一項貢獻,所以大多數的數學研究計畫,如果加入大眾的意見,其實沒有幫助。事實上,這只會浪費時間,因為光是檢查錯誤等等就很耗時。但這些形式化計畫的一個好處是,它們吸引了更多人參與。所以我相信已經有高中生對這些形式化計畫做出貢獻,他們對 mathlib 做出了貢獻。你不需要有博士學位,也能夠研究某個原子性的事物。
Lex Fridman
(03:00:03) 這裡的形式化,作為一個非常初步的步驟,也為程式設計社群敞開了大門。那些已經熟悉程式的人。程式設計似乎在某種程度上,也許只是一種感覺,但它感覺比數學更容易入門。數學被視為一種極端,特別是現代數學,被視為一個極難進入的領域,而程式設計則不然。所以這可能只是一個切入點。
(03:00:03) 這裡的形式化,作為一個非常初步的步驟,也為程式設計社群敞開了大門。那些已經熟悉程式的人。程式設計似乎在某種程度上,也許只是一種感覺,但它感覺比數學更容易入門。數學被視為一種極端,特別是現代數學,被視為一個極難進入的領域,而程式設計則不然。所以這可能只是一個切入點。
陶哲軒
(03:00:31) 你可以執行程式碼並獲得結果。你可以很快地列印出整個世界。如果程式設計被當作幾乎完全是理論性的科目來教授,只教你電腦科學、函數和常式的理論等等,而且除了某些非常專業的作業之外,你實際上沒有在編寫程式,比如在週末為了好玩而編寫程式,那麼它就會被認為和數學一樣困難。所以就像我說的,有一些非數學家的社群,他們為了某些非常具體的目的而運用數學,比如優化他們的撲克遊戲,那麼對他們來說,數學就變得有趣了。
(03:00:31) 你可以執行程式碼並獲得結果。你可以很快地列印出整個世界。如果程式設計被當作幾乎完全是理論性的科目來教授,只教你電腦科學、函數和常式的理論等等,而且除了某些非常專業的作業之外,你實際上沒有在編寫程式,比如在週末為了好玩而編寫程式,那麼它就會被認為和數學一樣困難。所以就像我說的,有一些非數學家的社群,他們為了某些非常具體的目的而運用數學,比如優化他們的撲克遊戲,那麼對他們來說,數學就變得有趣了。
Lex Fridman
(03:01:13) 您通常會給年輕人什麼建議,關於如何選擇職業、如何找到自我,以及他們可能擅長什麼?
(03:01:13) 您通常會給年輕人什麼建議,關於如何選擇職業、如何找到自我,以及他們可能擅長什麼?
陶哲軒
(03:01:25) 這是一個非常、非常、非常難的問題。是的,現在世界充滿了很多不確定性。在二戰後有一段時期,至少在西方,如果你來自一個良好的社會階層,要走向一份好的職業有一條非常穩定的道路。你去上大學、接受教育、選擇一個職業並堅持下去。這種情況正變得越來越過時。所以我認為你必須具有適應性和靈活性。我認為人們必須獲得可以轉移的技能,例如學習一種特定的程式語言或一種特定的數學科目之類的。單單這樣本身並不是一種超級可以轉移的技能,而是要知道如何運用抽象概念進行推理,或者如何在事情出錯時解決問題。無論如何,我認為即使我們的工具變得更好,並且你將與人工智慧輔助工具等一起工作,我們仍然會需要這些技能。
(03:01:25) 這是一個非常、非常、非常難的問題。是的,現在世界充滿了很多不確定性。在二戰後有一段時期,至少在西方,如果你來自一個良好的社會階層,要走向一份好的職業有一條非常穩定的道路。你去上大學、接受教育、選擇一個職業並堅持下去。這種情況正變得越來越過時。所以我認為你必須具有適應性和靈活性。我認為人們必須獲得可以轉移的技能,例如學習一種特定的程式語言或一種特定的數學科目之類的。單單這樣本身並不是一種超級可以轉移的技能,而是要知道如何運用抽象概念進行推理,或者如何在事情出錯時解決問題。無論如何,我認為即使我們的工具變得更好,並且你將與人工智慧輔助工具等一起工作,我們仍然會需要這些技能。
Lex Fridman
(03:02:13) 但實際上你是一個很有趣的案例研究。你是當今偉大的數學家之一,然後你有一套做事方法,然後突然之間你開始學習。首先,你不斷學習新的領域,但你學了 Lean。這不是一件容易的事情。對很多人來說,這是一個非常不舒服的跳躍,對吧?
(03:02:13) 但實際上你是一個很有趣的案例研究。你是當今偉大的數學家之一,然後你有一套做事方法,然後突然之間你開始學習。首先,你不斷學習新的領域,但你學了 Lean。這不是一件容易的事情。對很多人來說,這是一個非常不舒服的跳躍,對吧?
陶哲軒
(03:02:40) 是的。
Lex Fridman
(03:02:41) 很多數學家都是如此。
(03:02:41) 很多數學家都是如此。
陶哲軒
(03:02:42) 首先,我一直對新的數學研究方法很感興趣。我認為我們現在做事情的方式效率不高。我的許多同事花費大量時間進行非常例行的計算,或者做其他數學家立刻就知道怎麼做,但我們卻不知道該如何處理的事情,像是我們如何搜尋並快速獲得回應等等。這就是為什麼我一直對探索新的工作流程感興趣。
(03:02:42) 首先,我一直對新的數學研究方法很感興趣。我認為我們現在做事情的方式效率不高。我的許多同事花費大量時間進行非常例行的計算,或者做其他數學家立刻就知道怎麼做,但我們卻不知道該如何處理的事情,像是我們如何搜尋並快速獲得回應等等。這就是為什麼我一直對探索新的工作流程感興趣。
(03:03:09) 大約四、五年前,我參加一個委員會,當時我們必須徵集一些有趣的研討會點子,在一個數學研究所舉辦。那時,Peter Scholze 剛把他的一個新定理正式化,並且在電腦輔助證明方面也有一些相當有趣的發展。我說:「喔,我們應該舉辦一個關於這個的研討會。這會是個好主意。」然後我對這個想法有點太過熱情,所以就被「自願」去執行了。所以我跟其他一些人,像是 Kevin Buzzard 和 Jordan Ellenberg 等等,一起做了,而且還算成功。我們聚集了一群數學家、電腦科學家和其他人,我們趕上了最新的進度,而且有很多非常有趣的發展,是大多數數學家都不知道的,有很多很棒的概念驗證,只是暗示著未來會發生的事情。這就在 ChatGPT 出現之前,但即使在那時,也有一個關於語言模型的演講,以及這些模型在未來的潛在能力。
(03:04:11) 這讓我對這個主題感到興奮。所以我開始發表演講,說這是我們更多人應該開始關注的事情,既然我已經安排、舉辦了這次會議。然後 ChatGPT 出現了,突然間人工智慧無處不在。所以我接受了很多關於這個主題的採訪,特別是關於人工智慧和[聽不清楚 03:04:33]之間的互動。我說:「是的,它們應該結合起來。這裡將會產生完美的協同效應。」在某個時候,我意識到我必須不僅僅是紙上談兵,而是要身體力行。我不從事機器學習,也不從事證明形式化,而且我能僅僅依靠權威來說「我是一位數學家。相信我,我說這將會改變數學」的程度是有限的,而且我自己什麼也沒做。所以我感覺我必須真正地證明它。
(03:05:03) 很多時候,我投入的事情,其實我事先並不知道自己會花多少時間在上面,通常都是在我已經投入相當程度之後,才意識到這一點,但到了那時候,我就已經下定決心要完成了。
Lex Fridman
(03:05:15) 嗯,你願意投身其中,以某種程度來說當個初學者,或者面對初學者會遇到的挑戰,這非常令人欽佩,對吧?
(03:05:15) 嗯,你願意投身其中,以某種程度來說當個初學者,或者面對初學者會遇到的挑戰,這非常令人欽佩,對吧?
陶哲軒
(03:05:27) 是的。
Lex Fridman
(03:05:27) 新概念、新思維方式,還有在某件事情上表現得很差,而其他人... 我想在那場演講中,你可能是一位菲爾茲獎得主數學家,但一位大學生可能比你更懂。
(03:05:27) 新概念、新思維方式,還有在某件事情上表現得很差,而其他人... 我想在那場演講中,你可能是一位菲爾茲獎得主數學家,但一位大學生可能比你更懂。
陶哲軒
(03:05:42) 是的,我認為數學本質上,現在的數學非常龐大,沒有人了解所有現代數學。而且我們難免會犯錯,你不能用虛張聲勢來掩蓋你的錯誤,因為人們會要求你拿出證明,如果你沒有證明,那就是沒有證明。
(03:05:42) 是的,我認為數學本質上,現在的數學非常龐大,沒有人了解所有現代數學。而且我們難免會犯錯,你不能用虛張聲勢來掩蓋你的錯誤,因為人們會要求你拿出證明,如果你沒有證明,那就是沒有證明。
Lex Fridman
(03:06:03) 我熱愛數學。
(03:06:03) 我熱愛數學。
陶哲軒
(03:06:04) 是啊,它確實能讓我們保持誠實。雖然不是萬靈丹,但我認為我們的確更具有承認錯誤的文化,因為我們一直被迫這樣做。
(03:06:04) 是啊,它確實能讓我們保持誠實。雖然不是萬靈丹,但我認為我們的確更具有承認錯誤的文化,因為我們一直被迫這樣做。
史上最偉大的數學家
Lex Fridman
(03:06:17) 一個很荒謬的問題。再次為此道歉。誰是史上最偉大的數學家,也許是已經不在世的人?有哪些候選人?尤拉、高斯、牛頓、拉馬努金、希爾伯特?
(03:06:17) 一個很荒謬的問題。再次為此道歉。誰是史上最偉大的數學家,也許是已經不在世的人?有哪些候選人?尤拉、高斯、牛頓、拉馬努金、希爾伯特?
陶哲軒
(03:06:32) 首先,如前所述,這裡存在一些時間相依性。
(03:06:32) 首先,如前所述,這裡存在一些時間相依性。
Lex Fridman
(03:06:37) 在那一天。
(03:06:37) 在那一天。
陶哲軒
(03:06:38) 對。例如,如果你把時間累積起來畫成圖,像是歐幾里得就是領先的競爭者之一,然後可能是一些無名的匿名數學家在他之前,像是任何發明數字概念的人。
(03:06:38) 對。例如,如果你把時間累積起來畫成圖,像是歐幾里得就是領先的競爭者之一,然後可能是一些無名的匿名數學家在他之前,像是任何發明數字概念的人。
Lex Fridman
(03:06:53) 今天的數學家們,仍然能感受到希爾伯特(Hilbert)的影響嗎?就——
(03:06:53) 今天的數學家們,仍然能感受到希爾伯特(Hilbert)的影響嗎?就——
陶哲軒
喔,對啊。
喔,對啊。
Lex Fridman
(03:06:58) 直接影響到什麼? 20 世紀以來發生的所有事情嗎?
(03:06:58) 直接影響到什麼? 20 世紀以來發生的所有事情嗎?
陶哲軒
(03:07:00) 是的,希爾伯特空間,我們有很多東西都是以他的名字命名的。光是數學的安排,以及某些概念的引入,他的 23 個問題就極具影響力。
(03:07:00) 是的,希爾伯特空間,我們有很多東西都是以他的名字命名的。光是數學的安排,以及某些概念的引入,他的 23 個問題就極具影響力。
Lex Fridman
(03:07:12) 宣告哪些問題難以解決,以及公開問題的陳述,本身就帶有一種奇異的力量。
(03:07:12) 宣告哪些問題難以解決,以及公開問題的陳述,本身就帶有一種奇異的力量。
陶哲軒
(03:07:19) 沒錯,這就是隨處可見的旁觀者效應。如果沒有人說你應該做 X,每個人就會閒晃,等著別人做些什麼,然後什麼事都沒完成。而你實際上必須教導大學數學生的就是,你應該總是嘗試做些什麼。你會看到很多大學生在嘗試解決數學問題時會陷入癱瘓。如果他們發現某種技術可以應用,他們就會嘗試。但有些問題是他們看到後,沒有任何標準技術顯然適用,而常見的反應就是癱瘓,我不知道該怎麼辦。我想《辛普森家庭》裡有一句台詞:「我什麼都沒試過,而且我已經黔驢技窮了。」所以下一步就是嘗試任何事情,無論它有多愚蠢,事實上幾乎越愚蠢越好,這在技術上幾乎肯定會失敗,但它失敗的方式將會是有啟發性的。它之所以失敗,是因為你根本沒有考慮到這個假設。哦,這個假設一定是有用的。這是一個線索。
(03:07:19) 沒錯,這就是隨處可見的旁觀者效應。如果沒有人說你應該做 X,每個人就會閒晃,等著別人做些什麼,然後什麼事都沒完成。而你實際上必須教導大學數學生的就是,你應該總是嘗試做些什麼。你會看到很多大學生在嘗試解決數學問題時會陷入癱瘓。如果他們發現某種技術可以應用,他們就會嘗試。但有些問題是他們看到後,沒有任何標準技術顯然適用,而常見的反應就是癱瘓,我不知道該怎麼辦。我想《辛普森家庭》裡有一句台詞:「我什麼都沒試過,而且我已經黔驢技窮了。」所以下一步就是嘗試任何事情,無論它有多愚蠢,事實上幾乎越愚蠢越好,這在技術上幾乎肯定會失敗,但它失敗的方式將會是有啟發性的。它之所以失敗,是因為你根本沒有考慮到這個假設。哦,這個假設一定是有用的。這是一個線索。
Lex Fridman
(03:08:26) 我覺得你也在某處提過一個很棒的方法,我一直記著,而且他們用起來效果很好,我想你說這叫做結構式拖延法。
(03:08:26) 我覺得你也在某處提過一個很棒的方法,我一直記著,而且他們用起來效果很好,我想你說這叫做結構式拖延法。
陶哲軒
(03:08:36) 不,對。
(03:08:36) 不,對。
Lex Fridman
(03:08:37) 當你真的不想做某件事時,你會想像一件你更不想做、比那件事更糟糕的事,然後透過不做那件更糟糕的事來拖延。這是一個不錯的妙招,而且真的有效。
(03:08:37) 當你真的不想做某件事時,你會想像一件你更不想做、比那件事更糟糕的事,然後透過不做那件更糟糕的事來拖延。這是一個不錯的妙招,而且真的有效。
陶哲軒
(03:08:51) 是啊,是啊。任何事情都一樣,心理層面非常重要。你和馬拉松跑者等運動員談話時,他們會說什麼是最重要的,是訓練計畫還是飲食等等?很多時候是心理因素,只是欺騙自己,讓自己認為問題是可行的,這樣你才有動力去做。
(03:08:51) 是啊,是啊。任何事情都一樣,心理層面非常重要。你和馬拉松跑者等運動員談話時,他們會說什麼是最重要的,是訓練計畫還是飲食等等?很多時候是心理因素,只是欺騙自己,讓自己認為問題是可行的,這樣你才有動力去做。
Lex Fridman
(03:09:15) 有沒有什麼是我們人類的思維永遠無法理解的?
(03:09:15) 有沒有什麼是我們人類的思維永遠無法理解的?
陶哲軒
(03:09:21) 嗯,作為一個數學家,[聽不清楚 03:09:23]。一定存在某個你無法理解的巨大數字。這是我首先想到的。
(03:09:21) 嗯,作為一個數學家,[聽不清楚 03:09:23]。一定存在某個你無法理解的巨大數字。這是我首先想到的。
Lex Fridman
(03:09:31) 那麼,更廣泛地說,即使在數學的幫助下,我們的思維是否也會受到限制?
(03:09:31) 那麼,更廣泛地說,即使在數學的幫助下,我們的思維是否也會受到限制?
陶哲軒
(03:09:41) 好吧,你能接受多少增強?例如,如果我連筆和紙都沒有,如果我沒有任何科技,也就是說我不允許使用黑板、筆和紙——
(03:09:41) 好吧,你能接受多少增強?例如,如果我連筆和紙都沒有,如果我沒有任何科技,也就是說我不允許使用黑板、筆和紙——
Lex Fridman
(03:09:52) 你已經比你本來可以做到的,受限更多了。
(03:09:52) 你已經比你本來可以做到的,受限更多了。
陶哲軒
(03:09:55) …非常有限。即使是語言,像是英文,也是一種科技。它已經被高度內化了。
(03:09:55) …非常有限。即使是語言,像是英文,也是一種科技。它已經被高度內化了。
Lex Fridman
(03:10:03) 所以你說的對,問題的表述不正確,因為現在已經沒有單獨的人類了,而是以極其複雜的方式被增強,對吧?
(03:10:03) 所以你說的對,問題的表述不正確,因為現在已經沒有單獨的人類了,而是以極其複雜的方式被增強,對吧?
陶哲軒
(03:10:17) 沒錯。
(03:10:17) 沒錯。
Lex Fridman
(03:10:18) 所以像是集體智慧?
(03:10:18) 所以像是集體智慧?
陶哲軒
(03:10:20) 是的。對,我想,從原則上來說,集體的人類在狀態好的時候,比個別人類加起來還要聰明得多。當然也可能比較差,但沒錯,所以數學界這個複數的整體,是一個非常超級智慧的實體,沒有任何單一的數學家可以接近複製它。你可以在這些問題分析網站上看到一些。像是 Math Overflow,它是 Stack Overflow 的數學版,有時你會看到社群對非常困難的問題做出非常快速的回應,身為專家,看著其實是一種樂趣。
(03:10:20) 是的。對,我想,從原則上來說,集體的人類在狀態好的時候,比個別人類加起來還要聰明得多。當然也可能比較差,但沒錯,所以數學界這個複數的整體,是一個非常超級智慧的實體,沒有任何單一的數學家可以接近複製它。你可以在這些問題分析網站上看到一些。像是 Math Overflow,它是 Stack Overflow 的數學版,有時你會看到社群對非常困難的問題做出非常快速的回應,身為專家,看著其實是一種樂趣。
Lex Fridman
(03:11:01) 我很喜歡那個網站,就像個粉絲一樣看著不同的人展現他們的才華,以及他們所擁有的深度和知識。他們願意投入嚴謹且細膩的提問,這一切都非常酷,光看著就覺得有趣。對於我們人類文明的發展,什麼讓你感到希望?
(03:11:01) 我很喜歡那個網站,就像個粉絲一樣看著不同的人展現他們的才華,以及他們所擁有的深度和知識。他們願意投入嚴謹且細膩的提問,這一切都非常酷,光看著就覺得有趣。對於我們人類文明的發展,什麼讓你感到希望?
陶哲軒
(03:11:25) 我認為年輕一代總是充滿創造力、熱情和發明力。和年輕學生一起工作是件很愉快的事。科學的進步告訴我們,過去非常困難的問題,現在可能變得很容易解決。像是導航,僅僅知道你在地球上的位置,過去就是個非常可怕的問題。人們因為無法導航而喪命或損失財富。而現在我們口袋裡的裝置可以自動完成這件事,這已經是個完全被解決的問題。所以現在對我們來說看似不可能的事情,或許將來只是個回家作業。
(03:11:25) 我認為年輕一代總是充滿創造力、熱情和發明力。和年輕學生一起工作是件很愉快的事。科學的進步告訴我們,過去非常困難的問題,現在可能變得很容易解決。像是導航,僅僅知道你在地球上的位置,過去就是個非常可怕的問題。人們因為無法導航而喪命或損失財富。而現在我們口袋裡的裝置可以自動完成這件事,這已經是個完全被解決的問題。所以現在對我們來說看似不可能的事情,或許將來只是個回家作業。
Lex Fridman
(03:12:13) 是啊。我對生命有限感到非常難過的一點是,我無法親眼見證我們作為一個文明所創造的所有酷東西,因為在未來的 100 年、200 年,想像一下出現在 200 年後。
(03:12:13) 是啊。我對生命有限感到非常難過的一點是,我無法親眼見證我們作為一個文明所創造的所有酷東西,因為在未來的 100 年、200 年,想像一下出現在 200 年後。
陶哲軒
(03:12:27) 是啊,其實已經發生了很多事情。如果你可以回到過去和你的青少年時期的自己說話,網際網路和現在的人工智慧,它們正在內化,而且,當然,人工智慧可以理解我們的聲音,並對任何問題給出合理的、稍微不正確的答案。但即使在兩年前,這仍然是令人難以置信的。
(03:12:27) 是啊,其實已經發生了很多事情。如果你可以回到過去和你的青少年時期的自己說話,網際網路和現在的人工智慧,它們正在內化,而且,當然,人工智慧可以理解我們的聲音,並對任何問題給出合理的、稍微不正確的答案。但即使在兩年前,這仍然是令人難以置信的。
Lex Fridman
(03:12:50) 當下,在網路上觀看這些戲劇性事件是很有趣的,人們很快就認為一切理所當然,然後我們人類似乎以戲劇來娛樂自己。在所有創造出來的事物中,總會有人採取一種觀點,另一個人需要採取相反的觀點,並為此爭論不休。但是,當你縱觀事物發展的軌跡,即使僅僅是機器人技術的進步,退一步想想,「哇,這真是太美好了,我們人類竟然能夠創造出這個。」
(03:12:50) 當下,在網路上觀看這些戲劇性事件是很有趣的,人們很快就認為一切理所當然,然後我們人類似乎以戲劇來娛樂自己。在所有創造出來的事物中,總會有人採取一種觀點,另一個人需要採取相反的觀點,並為此爭論不休。但是,當你縱觀事物發展的軌跡,即使僅僅是機器人技術的進步,退一步想想,「哇,這真是太美好了,我們人類竟然能夠創造出這個。」
陶哲軒
(03:13:19) 當基礎建設和文化健全時,人類社群就能比其中的個體更加聰明、成熟和理性。
(03:13:19) 當基礎建設和文化健全時,人類社群就能比其中的個體更加聰明、成熟和理性。
Lex Fridman
(03:13:31) 說到理性,我總能指望你部落格的留言區,我是你的忠實讀者。那裡有很多非常聰明的人。當然,也感謝你將這些想法發表在部落格上。我實在感到非常榮幸,你今天願意撥出時間給我。我期待這一天很久了。陶哲軒,我是你的超級粉絲。你啟發了我,也啟發了數百萬人。非常感謝你撥冗前來。
(03:13:31) 說到理性,我總能指望你部落格的留言區,我是你的忠實讀者。那裡有很多非常聰明的人。當然,也感謝你將這些想法發表在部落格上。我實在感到非常榮幸,你今天願意撥出時間給我。我期待這一天很久了。陶哲軒,我是你的超級粉絲。你啟發了我,也啟發了數百萬人。非常感謝你撥冗前來。
陶哲軒
(03:13:58) 謝謝你。我也很榮幸。
(03:13:58) 謝謝你。我也很榮幸。
Lex Fridman
(03:14:00) 感謝各位收聽這次與陶哲軒的對話。為了支持這個 podcast 節目,請查看說明欄或瀏覽 lexfridman.com/sponsors,看看我們的贊助商。現在,讓我用伽利略·伽利萊的一段話來作結:「數學是上帝書寫宇宙的語言。」
(03:14:00) 感謝各位收聽這次與陶哲軒的對話。為了支持這個 podcast 節目,請查看說明欄或瀏覽 lexfridman.com/sponsors,看看我們的贊助商。現在,讓我用伽利略·伽利萊的一段話來作結:「數學是上帝書寫宇宙的語言。」
(03:14:21) 感謝您的收聽,希望下次再見。