這回川習峰會,白宮宣布的大亮點之一,是美方同意放寬輝達高階晶片對中出售限制,這本該是雙方緊繃關係中難得的解凍訊號,然而,北京收緊了企業採購相關晶片的審批管道,理由據稱涉及國家安全與自主可控的產業政策,這分弔詭,像極外交場合的面子工程,也像一把鑰匙,可以打開理解當前中美AI競爭真實本質的那扇門。
要讀懂這個矛盾,必先理解中方在這場競賽裡的根本焦慮,北京的問題從來不只有買不買得到晶片,還有若有一天完全買不到,還能不能繼續跑,正是這種對技術斷供的深層恐懼,催生了中國AI產業,對美方前沿模型進行大規模「蒸餾」這條極具爭議,卻也有效的捷徑。
蒸餾本身不是非法技術,大型AI公司日常都以此把巨大教師模型,壓縮為較輕量的學生模型,以降低推理成本。根據Anthropic今年二月揭露的調查報告,將這個技術術語賦予了截然不同的政治重量,DeepSeek、Moonshot AI與MiniMax三家中國實驗室,透過約二萬四千個詐騙帳號,與Claude模型產生超過一千六百萬次交流,有系統性的提取其推理能力、工具調用邏輯與對齊架構,目的用以訓練本身的模型,這非學術意義上的知識傳承,基本算是一場工業規模的智識竊取。
DeepSeek在2025年一月發布的R1模型,就是理解這場競賽地緣政治意涵的核心事件,這個以據稱僅六百萬美元訓練成本打造的推理模型,在多項基準測試裡逼近OpenAI o1水準,震撼了矽谷,也讓美股AI相關板塊在數日內蒸發數千億美元市值。DeepSeek在論文中坦承使用了蒸餾技術,到了今年四月發布的V4,更直接採用了一種名為「On-Policy Distillation」的進化方法,同時參考10個教師模型的輸出進行自我修正與學習。
面對如此規模的系統性提取,美國OpenAI、Anthropic與Google三大前沿AI企業,放下彼此的激烈競爭,正式啟動情報共享機制,當某家公司偵測到新的蒸餾攻擊模式,即時通報其他成員,構成一道聯合防線,這是三家長期在算力、人才與市場份額上針鋒相對的公司,為了保護各自的智慧財產,選擇站在同一陣線,這個事實,已充分說明威脅的嚴重程度。
美國政府隨即跟進,白宮科技政策辦公室(OSTP)發布了NSTM-4備忘錄,正式把對抗性蒸餾定性為國家安全威脅,承諾向業界共享威脅情報及探索問責機制。美國國務院也指示駐外使館向盟友發出警告,並向北京發出正式外交照會,點名三家中國AI實驗室。美國國會也同步推進《阻止竊取美國AI模型法》(DAAMTA),授權對相關實體實施制裁。
不過,這道防線存在一個根本性的經濟矛盾,前沿模型的訓練成本以數十億美元計,建立一個新的代理帳號網絡幾乎分文不花,三家企業共享的偵測技術再精密,也難以從根本上改變攻防雙方的成本不對稱,封鎖一個代理網絡,無法阻止下一個出現,這便引出了這場競賽最核心的戰略問題,若蒸餾管道被真正封堵,中方的AI能力還能以同等速度前進嗎?
中國在AI基礎研究、工程人才與本土數據上的積累確為實力,在製造、物流、城市管理等應用場景的實踐密度,也構成難以複製的競爭縱深。然而,前沿能力的突破仍高度依賴算力規模,DeepSeek-V4據報須借助走私的輝達 Blackwell晶片才能完成訓練,已將北京自主可控敘事的裂縫暴露無遺,華為 Ascend與輝達之間的差距,是量級而非倍數的問題,最根本的關鍵,在於一旦三強聯手真正封閉蒸餾窗口,中方將失去以極低成本校準自身與世界前沿距離的參照系,這對任何試圖彎道超車的技術追趕者,都是難以估量的代價。
回到川習晶片交易的弔詭之處,美方賣晶片,希望以經貿利益換取戰略約束,中方阻止購買,是因為讓企業直接採購美方晶片,等同於承認自主路線的不成熟,更可能讓北京在下一輪制裁來臨時,再度陷入技術依賴的脆弱處境,北京寧願讓企業走艱難的自主路線,也不願在制度層面重建對華盛頓的依賴,這是深謀之後的戰略理性,即使短期要付出效率代價。
對於嚴格管控後中方AI能否持續迅猛進步這個問題,誠實的答案是,進步將繼續,但速度曲線很可能發生結構性轉折。在應用層、數據效率與特定垂直領域,中方幾乎不會受阻,在需要最大算力規模與前沿模型參照的基礎能力突破上,若蒸餾管道被三強聯合封堵、晶片供應持續受壓,中方將面臨更陡峭的自主爬坡。DeepSeek式的效率奇蹟,在晶片充裕且蒸餾窗口開放時可以重現,在雙重管控下,其可複製性將大幅降低。
這場競賽的最終走向,不會在某一場峰會的公報裡揭曉,也不會在某一項立法通過後塵埃落定,它會以更安靜、更持久的方式繼續,因為,技術的地緣政治,從來就不是一條直線,那是一場所有人都可聲稱贏麻了,卻沒有人敢真正停下來的長跑。(作者為富瑜文教基金會執行長)
※以上言論不代表旺中媒體集團立場※




