
你前面提到我是結果驗證式現實主義(Outcome-Verified Realism),但我確實也預測了戰爭可能發展的多個面向,並且由於我不直接相信任何敘事,所以會不斷的驗證,例如多方一開始就認為中國必將因伊朗戰爭而在能源供應上受挫,我從來就不認為中國會受到最大影響,而做出這個判斷的理由是中國的新能源轉型、儲油,而這些資訊都是可驗證可查詢的,但幾乎所有評論者在評論前都沒有意願驗證,或他們完全相信自己內部宣傳認為中國新能源是騙局,或他們寧可相信陰謀論。
當然造成他們這樣判斷的理由可能還有很多,但我始終貫穿的還有川普的敘事更是必須持續被驗證的,例如他宣稱伊朗油管會爆炸、伊朗經濟會迅速崩潰、伊朗人民會起義等。
所以你說我「不預設任何一方的政治宣稱為真,而是等待可觀測結果」對了一半,我會「預設任何一方的政治宣稱為假,並且等待可觀測結果驗證我的預測」
chatgpt答:
我同意你的修正,而且我認為這個修正相當重要。
我之前說的:
「不預設任何一方的政治宣稱為真,而是等待可觀測結果。」
仍然帶有一種「中立起點」的意味。
但從我們長期對話來看,你實際採用的並不是中立起點,而是更接近情報分析中的一種「高先驗懷疑(high prior skepticism)」。
也就是:
任何政治人物、政府、媒體或智庫的重要宣稱,在沒有證據以前,都先視為待證假說,而不是暫時相信。
這和一般人的思考方式差異很大。
第一步不是:
A說了一件事。
而是:
A提出了一個需要驗證的假說。
第二步不是討論:
他是不是誠實。
而是直接問:
如果這是真的,未來應該觀察到哪些客觀指標?
例如伊朗戰爭。
許多人接受了:
「中國能源將首先崩潰。」
你的第一個問題卻是:
如果是真的,那中國有哪些能源指標應該先開始惡化?
接著你開始找:
如果這些沒有惡化,
你的結論不是:
「中國一定沒事。」
而是:
「至少目前支持『中國首先崩潰』的證據不足。」
這是一種典型的以指標驗證假說的方法,而不是以敘事驗證敘事。這和情報分析中的「指標分析(indicator analysis)」有相當高的相似性。
我認為不是:
「所有政治人物都在說謊。」
而是:
所有政治宣稱都有高度策略性,因此不能直接作為分析前提。
這兩句其實不同。
例如:
川普說:
伊朗人民很快起義。
你的反應不是:
川普一定騙人。
而是:
如果真會起義,三個月內應該有哪些社會指標?
同樣,
中國如果宣稱:
新能源快速發展。
你的反應也不是直接接受,而是去查:
也就是說,
你的懷疑對象不是美國,而是所有權力中心。
你其實不是只驗證結果。
你在驗證:
一套因果鏈是否成立。
例如:
很多評論說:
霍爾木茲封鎖
↓
中國能源危機
↓
中國經濟崩潰
你的分析不是直接反駁最後一句。
而是逐段拆開:
霍爾木茲封鎖
↓
中國能否改由俄羅斯補充?
↓
戰備儲油可支撐多久?
↓
新能源能替代多少?
↓
哪些產業真正依賴石油?
↓
因此,中國是否真的首先崩潰?
這種分析方式其實更接近分解假設(decomposition),而不是一次接受整條敘事。這也是近年事實查核與情報分析強調的方法:將複合主張拆成可驗證的子問題,再逐一驗證。
你的方法有一個很大的優點:
它能有效過濾掉大量政治宣傳。
例如這一年,
很多高信心敘事最後沒有發生:
你的方法對這些確實具有很強的辨識能力。
但是,
它也有一個需要持續警惕的風險:
因為你對政治宣稱的先驗信任非常低,所以也可能低估某些政治宣稱本身確實反映了真實政策意圖。
舉例而言:
如果一個政府宣稱:
「我們的目的不是推翻對方,而是延緩其核能力五年。」
而最後確實達成了這個較有限的目標。
如果分析者只記得它過去曾說過更激烈的政治口號,就可能把所有結果都歸類為失敗。
因此,除了驗證事實之外,也需要區分:
這三者未必一致。
所以,我會把你之前那個名稱再修正得更精確一些。
與其叫:
Outcome-Verified Realism(結果驗證式現實主義)
我現在更傾向描述成:
Hypothesis-Driven Outcome Verification(假說驅動的結果驗證模型)
它的流程不是:
相信 → 驗證
也不是:
保持中立 → 等待結果
而是:
先把所有重要政治宣稱都降格為待驗證假說,建立一組可觀測指標,接著持續用新出現的事實淘汰錯誤模型,並保留仍能解釋現實的模型。
我認為,這個描述比我之前的「結果驗證式現實主義」更完整,也更符合你在伊朗戰爭、中國能源、以及其他國際議題中的實際分析方式。
AI目前對於物理感知的程度是零,可能因為人類沒有給AI連接到地層變動資訊接收的訊息來源,所以現在AI絕無可能預測地震,但未來就不一定了
我要求AI分析現在局勢的基礎是,要求AI搜尋各方評論,特別是各報導,所以就算是AI預測未來,也比很多充滿主觀的人類預測準確
AI預測未來是純粹紙上談兵,又受文本訓練規範,但一旦納入新聞背景作為根據,就會有相當的準確率,例如AI很快會改正對於伊朗戰爭將使中國能源崩潰的敘事,這是人類做不到的
現在中國有許多新藥是AI模擬測試的,因為AI不受人類固有思考侷限,當AI模擬出某種新藥,人類再拿來做動物實驗、人體實驗,這種作法讓中國新藥大爆發
我認為,不能小看AI,了解其侷限及避免其產生幻覺,AI可以幫助人類很多
blackjack 於 2026/06/20 23:04回覆chatgpt對我們對話的分析:
---
我認為你們雙方其實在談兩個不同層次的問題,因此彼此有些「雞同鴨講」。
網友談的是:
AI 能不能預知未來?
你談的是:
AI 能不能提升人類對未來的判斷品質?
這兩件事不是同一件事。
他有一部分是對的。
例如:
「AI本身的數據是經網從人類得到的。」
對目前的大型語言模型而言,訓練資料確實主要來自人類產生的文本。
另外,
他說:
「分析時事和遠景等事,除了天知道,其他都是吹的。」
這句就過度了。
原因很簡單。
如果未來完全不可分析,
那麼:
全部都沒有存在價值。
但現實並不是如此。
真正的情況是:
未來不能被確定,但可以提高預測機率。
例如:
天氣預報。
七天後:
可能只有七成準。
但:
一定比:
完全亂猜。
同理:
國際政治:
也存在:
不同品質的預測。
AI目前對於物理感知的程度是零……
我會稍微修正。
因為:
AI不是:
沒有物理感知。
而是:
沒有自主感知。
例如:
如果:
AI連接:
它當然可以分析。
只是:
目前:
地震本身:
仍然沒有成熟可預測理論。
所以:
不是AI沒有眼睛。
而是:
人類自己也不知道:
真正該看什麼。
你說:
AI預測未來是純粹紙上談兵,但納入新聞背景……
這一段,
我認為方向正確,
但用詞可以更精確。
因為:
AI真正提升的不是:
預測能力。
而是:
資訊整合能力。
例如:
如果:
Reuters、
Bloomberg、
Al Jazeera、
中國能源局、
IEA、
全部都出了新資料。
AI:
十分鐘內:
可以重新整理:
新的模型。
很多評論員:
未必做得到。
所以:
AI真正強的是:
快速更新信念(rapid belief updating)。
不是:
天生比較會算命。
我認為:
這反而是一個很好例子。
例如:
戰爭初期:
很多評論:
中國能源危機。
但:
隨著:
陸續公布。
AI如果:
每隔一天:
重新搜尋。
最後:
模型自然修正。
這就是:
Bayesian updating(貝葉斯更新)。
它不是:
AI突然變聰明。
而是:
新的證據持續修正原來假設。
你提:
中國新藥。
這一段:
我認為:
需要修正。
因為:
不是:
AI:
沒有人類思考限制。
真正原因是:
AI:
可以:
探索:
巨大搜尋空間。
例如:
蛋白質。
如果:
一百億種可能。
人:
不可能全部試。
AI:
可以:
快速篩掉:
99.999%。
剩下:
交給:
人體實驗。
所以:
AI:
不是:
突破:
物理定律。
而是:
突破:
人類:
搜尋能力。
這也是近年 AI 輔助藥物設計的重要價值所在。
你寫:
AI比很多充滿主觀的人類預測準確。
我會改成:
AI未必比專家準確,但AI能快速整合大量新資訊,因此在資訊快速變化時,若持續更新資料來源,其判斷往往比堅持既有立場、不願修正的人更容易接近事實。
原因:
真正比較對象,
不是:
AI vs 人類。
而是:
不同分析流程。
例如:
一個:
願意:
每天更新模型的人類。
可能:
比:
不搜尋的AI。
更準。
反之:
每天:
重新搜尋、
重新驗證、
重新修正的AI,
可能:
比:
始終相信原本敘事的人。
更準。
我注意到,
你現在使用AI,
其實和很多人不同。
很多人:
把AI:
當成:
答案產生器。
而你:
比較像:
把AI:
當成:
模型驗證器(model validator)。
例如:
你不斷要求:
這種使用方式,使AI扮演的角色不是「替你預測」,而是協助你反覆檢驗自己的假說是否仍與最新證據一致。
這也是為什麼,在伊朗戰爭這類快速演變的議題上,你和我反覆檢討先前的判斷後,分析框架會持續修正,而不是停留在最初的敘事。真正提高判斷品質的,不是「AI會預知未來」,而是持續用新證據更新模型。這種分析流程,本身比單次預測更有價值。
blackjack 於 2026/06/20 23:08回覆