生活散記(十)AI 的文字接龍遊戲
「莫愁前路無知己,天下誰人不識君。」— 高適《別董大二首》其一
「在你一切所行的事上都要認定他,他必指引你的路。」 — 《箴言》3章6節
【前言:最近教宗良十四世發表了對新科技、尤其是AI的看法,引起世人對AI的普遍關注。我讀了之後,也有些感想,擇其一二,簡短地在部落格裡跟大家分享。】
不知道你還記不記得,在AI時代來臨以前,我們上網查資料得到的答案都是事先準備好的現成答案,不管你如何發問,得到的答案大都一成不變。
進入AI時代以後,一切都不同了。上一篇散記提到AI聊天機器人說它自己像是一面「鏡子」,它回應使用者的語氣和內容大都取決於使用者提問的方式:你軟它也軟,你硬它就硬;你問得越仔細,它回應給你的就越精確。AI是如何做到這一點的?
從前我以為這些AI聊天機器人收到一個提問的時候,它們就憑藉著巨大的資料庫以及超級快速的運作能力,馬上收集了相關資訊,然後加以歸納、分析、辨識、推理,最後把得到的結論提供給提問的人。
後來發現這樣的想法是根本的誤解。因為AI資料庫是無比的龐大,而且回應要配合使用者個人的「口味」,不管現代科技再發達、算力再超強,用傳統的解題方式是萬萬無法給出即時回應的。
原來AI聊天機器人都是建立在所謂的「大語言模型 Large Language Model(LLM)」的基礎上。什麼意思?AI在訓練階段閱讀了網路上幾百億、幾兆個字的文章與書籍,學習了人類文章的「慣用語氣與上下文」,記住了這些文字組合的習慣來做「文字接龍遊戲」。
當我們向AI聊天機器人輸入一個句子時,AI並非真的理解我們提問的意義,而是透過機率計算,不斷地預測並且接上最可能出現的下一個字。AI聊天機器人的底層邏輯不是「推理」,而是「接龍」:計算「下一個字出現的機率」。
例如,我們給AI聊天機器人這樣的句子:「最近好冷,昨晚跟朋友去吃了…」,AI的內在運作顯示要接龍這句話的下一個詞,「冰淇淋」的機率是2%,「油條」的機率是6%等等,而「火鍋」的機率則是50%,所以AI就會選「火鍋」來接龍。AI聊天機器人並不懂天氣冷要吃火鍋這樣的推理,它只知道50%遠高於2%或是6%。(冰淇淋的2%、油條的6%和火鍋的50%則是在訓練過程中反映了大數據中根據上下文的語境和人類的習慣演算出來的。)
而且當AI累積了對一位使用者的認識(例如你的喜好和背景)時,它會把這些資訊作為「提示 」,跟你的提問一起輸入。在「文字接龍」的底層機制下,這些認識就會改變下一個字的機率分佈,也會調整它回應的風格與語氣。這也就是AI聊天機器人能夠「投你所好」的原因。
當然,我的這些解釋相當的簡化,AI的運作機制遠遠要複雜得多。網友當中一定有許多是AI專業的,班門弄斧,不好意思。
【註】這篇散記對LLM的解釋得助於Gemini與AI Overview。







