Contents ...
udn網路城邦
人工智慧
2010/08/10 05:32
瀏覽3,534
迴響0
推薦7
引用1
人工智慧
artificial intelligence (AI)


指數位電腦或電腦控制的機器人完成通常由智慧生物所從事的工作的能力。推理能力、發掘意義、歸納,或是從過去的經驗中學習等,都是人類特有的智慧活動,在研發具有這些人類智慧特徵的系統計畫中,常常用到「人工智慧」這個詞。自從1940年代數位電腦發展以來,已經證明:透過程式設計,電腦可以非常有效而熟練地完成十分複雜的工作,譬如說,發現數學定理的證明或是下西洋棋。不過,儘管電腦處理的速度不斷加快,記憶體容量也不斷擴大,但目前仍然沒有電腦程式可以達到人類那種處理廣泛領域事務的機動性,或是完成那些需要大量日常生活常識的工作。另一方面,有些程式在一些特定任務的執行上已經可以做到人類專家所表現的水準或有專業的表現,所以如果把人工智慧限定在這個意義下,那麼它在各方面已有廣泛的應用,如醫療診斷、電腦搜尋引擎,以及聲紋或筆跡的辨識等。


何謂智慧?
  除了那些最簡單的反應外,幾乎所有人類行為都被視為智慧的表現,但是最複雜的昆蟲行為卻從未被視為有智慧。其中差異何在?我們來看看泥蜂(Sphex ichneumoneus)的行為,當雌性泥蜂帶著食物回到巢穴時,牠會先把食物放在門前,然後查看自己的巢穴裡是否有入侵者,在沒有入侵者的情況下,牠才會把食物拿進去。但當牠進巢穴時,如果門口的食物被移動了數吋,泥蜂再次出現時就會不厭其繁地重複整個程序,這便揭示了泥蜂本能行為的自然本質。智慧必須能夠適應新的狀況,泥蜂在此案例中顯然缺乏智慧。
  心理學家通常不會以單一特性來描述人類智慧,而是以多項能力的組合。人工智慧的研究迄今主要集中在下列幾個智慧要素:學習、推理、問題解決、感知,以及使用語言。

學習
  運用於人工智慧的學習有好幾種形式,最簡單的是「嘗試與錯誤」(trial and error),譬如一個棋子配對的問題,一個簡單的電腦程式只要隨機地一一配對直到找對為止,然後程式可以儲存解答,記錄它的位置,下回電腦碰到同樣的位置,就會「回想」解答。這種記住個別的項目和程序的簡單記憶,被稱做機械學習,對一部電腦而言是相對容易的。比較困難的是那些需要歸納能力才能解決的問題。歸納的過程需要把過去的經驗應用在可以類比的新狀況上,舉例來說,一個以死記硬背方式學習英文動詞過去式的程式,不能自動生成"jump"的過去式,除非它之前已學過"jumped"。反之,如果一個程式有歸納的能力,它可以學習「加"ed"」的法則,就能夠基於類似動詞的經驗而自動產生"jump"的過去式。

推理
  推理就是對某個情況做適當的推論。推論分為演繹和歸納。前者的例子有:「弗雷德不在博物館就在咖啡廳;他不在咖啡廳,因此他在博物館中。」而後者的例子則有:「之前多次這種事故都是機械故障所致,所以此次事故也是由機械故障引起。」這兩種形式的推論之間最大的差異在於:演繹法中前提的真保證了結論的真;而歸納法中前提的真雖然支持結論為真,卻不能提供絕對的保證。歸納推論常見於科學上──資料收集,建立試驗性的模型以描述與預測未來,直到異常的數據出現,再迫使模型修正。演繹推論則常見於數學和邏輯學中,由一小組基本公理和規則推導建立起公認定理的精密結構。
  設計程式讓電腦進行推論,尤其是演繹推論,已經相當成功。然而,真正的推理涉及的不只是推論而已,它還涉及對特定任務或情境的解決。這是人工智慧面臨的最艱難問題之一。

問題解決
  問題解決,特別在人工智慧中,可以描述為有系統地搜尋一系列可能行動,以達到某種預定的目標或解決。問題解決的方法依特定目的和一般目的分為兩種。特定目的的方法是專門為某個特定問題而量身訂做的,經常用於一個出現問題的非常特定的情景。相對之下,一個通用目的的方法則適用於各種問題。用於人工智慧的一個通用的技術是「手段-目的分析」(means-end analysis)──在目前狀態和最後目標之間,一步一步地縮減兩者的差距。程式會在一個工具列上選擇行動,以簡單的機器人為例,它的工具列上的行動選項可能包括:撿起、放下、往前、往後、向左,以及向右,直到達到目標為止。
  許許多多各樣的問題已由人工智慧程式得到解決。一些例子是在棋盤遊戲中找出獲勝棋步(或者一系列棋步)、導出數學證明,以及在電腦產生的世界中操縱「虛擬物件」。

感知
  在感知的過程中,各種感覺器官(真實的或人工的)掃描環境,隨後場景被分解為不同空間關係下的各個物件。現實的情況使得這種分析更形複雜,因為同一個物件由不同的角度觀察可能會呈現不同的外表,甚至現場光線的方向和強度,以及它與周遭物件的差異程度,都會造成影響。
  目前,人工感知透過先進的光學感覺器,已經能夠成功辨識個人,讓自動化車輛在公路上以中等速度行駛,以及讓機器人漫步穿梭於建築物之間,撿拾空的汽水罐。其中一個最早整合感知和行動的系統要算FREDDY,它是個固定式機器人,但有可活動的電視眼和鉗子手,在米奇(Donald Michie)的指導下於1966~1973年在蘇格蘭愛丁堡大學建造而成。FREDDY能夠辨識許多物件,並在指引下能夠從隨機堆放的組件裝配出簡單的人工製品,如一輛玩具汽車。

語言
  語言是一個符號系統,這些符號經由約定俗成而有了意義。在這種意義下,語言不必限制在言說之辭。例如,交通號誌即形成一種微型語言(minilanguage),"hazard"信號就表示「前方有危險」的意思,這在一些國家已經約定俗成。語言的特殊在於:語言單位因約定俗成而具有意義,而且語言學的意義與所謂的「自然意義」之間又有很大的差異,下列陳述足以演示說明──「那些雲表示要下雨」和「壓力的下降表示氣閥故障」。
  相較於鳥叫聲與交通號誌,成熟的人類語言有一個重要的特質,那就是它的生產力。一種有生產力的語言能夠產出無限多各式各樣的句子。
  在嚴格限制條件的情況下,要寫一個看似在人類語言中能夠對答如流的電腦程式,是相對地容易的。雖然這些程式實際上沒有理解語言,但是在原則上,它們對這些語言的使用卻可能與人類使用時沒什麼兩樣,已經到難以區別的地步。如果一部電腦在沒有理解語言的情況下,仍然能夠像人類般使用語言,那麼,真正的理解涉及什麼呢?對於這個困難的問題,目前沒有一致公認的答案。但根據其中一個理論,一個人是否理解並不單單取決於他的行為,還取決於他的歷史:要說一個人理解一種語言,他必須學會那個語言,並且已鍛鍊到能夠在那個語言社群中,用該種語言與其他的語言使用者溝通互動。


人工智慧的方法與目標
符號進路vs.連結進路
  人工智慧的研究分為兩種截然不同的方法,從而延伸展開某種程度上的競爭,它們分別是符號(或稱「從上而下」)進路與連結(或稱「從下而上」)進路。從上而下進路用符號處理(因此稱之為「符號進路」)來分析認知,企圖在獨立於腦的生物結構的情況下複製智慧。另一方面,從下而上進路則創造人工神經網路來模擬腦的結構(因此稱之為「連結進路」)。
  為了說明這些進路之間的差別,設想建構一個系統的工作,它裝備有光學掃描器用以辨識字母。典型的從下而上進路訓練人工神經網路時,會一個字母一個字母地呈現給它,以漸漸「調整」網路的方式來改進它的表現(調節不同神經路徑對不同刺激的回應)。對照之下,典型的從上而下進路則是寫一個電腦程式,以幾何學的描述來比較每一個字母。簡言之,神經活動是從下而上進路的基礎,而符號描述則是從上而下進路的基礎。
  在《學習的基礎》(1932)一書中,美國紐約市哥倫比亞大學的心理學家桑戴克(Edward Thorndike),首先提出人類學習涉及腦中的神經元之間某種不清楚的連結性質。在《行為的組織》(1949)一書中,加拿大蒙特婁麥吉爾大學(McGill University)的心理學家赫伯(Donald Hebb)認為學習尤其涉及增強特定神經元活動的形式,增強的方式是透過增加相關連結的神經元活化機率(權重)。權重的概念將在後面「連結論」一節中加以描述。
  1957年兩位精力充沛的人工智慧符號進路擁護者──美國加利福尼亞州聖大芒尼加市蘭德公司(RAND Corporation)的研究人員紐維爾(Allen Newell)與賓夕法尼亞州匹玆堡卡內基-梅隆大學(Carnegie Mellon University)的心理學家和電腦科學家西蒙(Herbert Simon),把從上而下進路總結為他們所稱的「物理符號系統假說」(physical symbol system hypothesis)。這個假說宣稱,在原則上,處理符號的結構就足以在數位電腦上產出人工智慧,而人類智慧也正是這種符號操作的結果。
  1950年代~1960年代期間,從上而下和從下而上進路可謂旗鼓相當,兩者都取得了有限卻值得注意的成果。不過,在1970年代,從下而上進路的人工智慧被忽略,後來直到1980年代這個進路才再次有了卓越的表現。目前這兩個進路都有其擁護者,卻也都公認有困難仍待克服。符號技術在簡化的領域中行得通,在碰到現實世界時卻往往一敗塗地;另一方面,從下而上進路的研究者也未能複製神經系統,即使是最簡單生物的神經系統也複製不來。儘管科學家已經對線蟲(Caenorhabditis elegans)做了很多研究,甚至對其300個神經元連結的形式已瞭若指掌,但連結論者的模型依然沒有辦法成功模擬。很顯然,連結論者的神經元理論過度簡化了真實事物。

強人工智慧、應用人工智慧,以及認知模擬
  使用上面所描述的方法,人工智慧的研究者想要達成下列3項目標之一:「強人工智慧」(Strong AI)、應用人工智慧,或是認知模擬(cognitive simulation)。強人工智慧的目標是建造能思維的機器(強人工智慧是1980年代由美國加州大學柏克萊分校的哲學家塞爾〔John Searle〕引進這個研究領域的)。強人工智慧的終極目標,是製造一部機器,它擁有一切智能智慧,完全與人類無異。如同在「人工智慧的早期里程碑」一節所說的,這個目標在1950年代和1960年代引起了研究人員的極大興趣,但是因為碰上極端困難而使得樂觀主義有所消退,至今仍沒有什麼進展。一些批評家質疑,強人工智慧是否能在可預見的將來製造出一個哪怕只是擁有螞蟻的全部智能的系統。的確,有些選擇走另外兩條路的人工智慧的研究者認為強人工智慧是不值得追求的。
  應用人工智慧(Applied AI)也稱為「高階資訊處理」,其目標是產出有商業價值的「聰明」系統。例如,「專家」醫療診斷系統和股票交易系統。如同「專家系統」一所節描述那樣,應用人工智慧已經取得相當大的成就。
  在認知模擬方面,電腦被用來測試關於人類心智如何運作的理論。例如,關於人們如何辨識臉孔或是如何回想記憶的理論。在神經科學和認知心理學中,認知模擬已成為強而有力的研究工具。


圖靈與人工智慧的起點
理論工作
  人工智慧的理論工作,最早的實質成果由英國邏輯學家和電腦先驅圖靈(Alan Mathison Turing)在20世紀中葉所完成。1935年圖靈描述了一部抽象的電腦,它有一個無限的記憶體和一個讀寫頭,這個讀寫頭可以在記憶體上往前或往後移動,一個一個地閱讀它找到的符號,並寫下更多的符號。讀寫頭的行動由一組指令組成的程式所指揮,而這個程式也是以符號的形式儲存在記憶體中。這就是圖靈「內儲程式」( stored-program)的概念,其中還隱含機器要如何運作,甚至修改或改進自身程式的各種可能性。圖靈的這個概念現在叫作「通用圖靈機」,所有的現代電腦本質上其實就是一部通用圖靈機。
  在第二次世界大戰期間,圖靈是英國白金漢郡布萊奇利公園(Bletchley Park)「政府代碼及加密學校」情報機構裡主要的密碼學家。直到1945年歐洲的戰事結束後,圖靈才轉向建造內儲程式電子計算機的計畫。然而,在戰爭期間他已經對機器智慧的問題投入相當多的心力。根據米奇後來的回憶(他是圖靈在布萊奇利公園的同事之一,後來在愛丁堡大學創立了機器智慧和感知學系),圖靈經常論及電腦如何透過指導原則的使用來從過往經驗中學習並且解決新問題,這一過程現在被稱作「啟發式問題解決」(heuristic problem solving, 或「誘導式問題解決」)。
  1947年圖靈在倫敦的公開演說(很可能是最早提及電腦智慧的一次),他說:「我們想要的是一部能夠從經驗中學習的機器,……讓機器修改它自己指令的可能性提供了此一機制。」1948年他在一篇名為「智慧機器」(Intelligent Machinery)的報告中,提出了很多人工智慧的核心概念。不過,圖靈並沒有出版這篇文章,他的許多點子後來都是由其他人再度發現。例如,其中一個圖靈的原創點子是要訓練人工的神經網路來完成某些特定的工作,這個方法在「連結論」一節中將有所說明。

西洋棋
  圖靈在布萊奇利公園以西洋棋來闡明他對機器智慧的想法,西洋棋是個有用的工具,那些針對明確定義的問題而提出的問題解決方案,就可以用它來檢驗是否可行。原則上,一部下西洋棋遊戲的電腦能透過搜尋所有可能的行動而窮盡所有的一切棋步。但是,實際上這是不可能的,因為如果這麼做,所涉及需搜尋的棋步將多達天文數字。啟發式問題解決的搜尋範圍必需更狹窄、更明確。雖然圖靈也有設計西洋棋程式的試驗,但是當時根本沒有電腦讓他跑程式,他只能用理論完成自己的試驗。第一個真正的人工智慧程式,必須等到內儲程式電子數位電腦面世才有。
  圖靈在1945年預測,總有一天電腦會有很好的下棋能力,才過了50年,由國際商業機器公司(IBM)建造的一部西洋棋電腦──深藍(Deep Blue),在1997年的一場六局對決的棋賽中擊敗了當時的世界冠軍卡斯帕洛夫(Gary Kasparov)。儘管圖靈的預言實現了,但是他期望西洋棋程式的設計能有助於理解人類如何思考,卻沒有實現。從圖靈的時代以來,電腦在西洋棋中的巨大進展,都是由於電腦工程上的推進,而不是人工智慧的進步。深藍有256個平行處理器,這讓它能每秒檢查2億個可能的棋步,並且能預判未來14步的棋局發展。許多人同意美國麻省理工學院(MIT)語言學家喬姆斯基(Noam Chomsky)的看法,認為電腦打敗棋王就好比推土機在奧林匹克的舉重賽中獲勝一樣無趣。

圖靈測試
  傳統的爭論集中在智慧的定義上,圖靈在1950年避開這樣的爭論,而提出以一個實際的測試來檢測電腦的智慧(這個測試如今被稱為「圖靈測試」)。參與圖靈測試的有三方:詢問人、接受詢問的電腦,以及一名與電腦一樣接受詢問的人。透過對參與圖靈測試的另外兩方提出問題,詢問人要從他們的回答來判斷出誰才是電腦。在測試的過程中,所有的對話都必須透過鍵盤和螢幕來完成。詢問人可以據其喜好,提出各式各樣的廣泛又尖銳的問題,而電腦也被允許作任何回答以誤導對方、隱藏自己的身分(譬如說,當被問到「你是一部電腦嗎?」,它可以回答「不是」,或是在要求做大數目的乘法時停頓很久,然後給出一個錯誤的答案)。至於與電腦一樣接受詢問的人,則必須幫助詢問人做出正確的判斷,辨別出他是人類的身分。一些不同的人分別扮演詢問人和接受詢問的人,如果有足夠比例的詢問人不能區分被詢問者是電腦還是人類,那麼(根據支持圖靈測試的人的想法)這部電腦就被視為一個有智慧,會思考的個體。
  美國慈善家勒布納(Hugh Loebner)在1991年起設立一年一度的勒布納獎的競賽,他提供10萬美元獎金給第一部通過圖靈測試的電腦,並每年提供2,000美元給當年表現最佳者。然而, 圖靈測試固若金湯,未曾有人工智慧程式越過它的門檻。


人工智慧的早期里程碑
第一批人工智慧程式
  最早成功的人工智慧程式是在1951年由斯特雷奇(Christopher Strachey)寫成,他後來成為英國牛津大學「程式設計研究小組」的主任。斯特雷奇的西洋跳棋程式,是在英格蘭曼徹斯特大學的電腦「費蘭梯馬克一號」(Ferranti Mark I)上面執行的。到1952年夏天,這個程式已經可以用合理的速度完成整個棋局。
  有關機器學習最早成功實現的訊息發表在1952年。英國劍橋大學的奧廷格爾(Anthony Oettinger)寫了一個程式叫作「購物者」(Shopper),它是在EDSAC電腦上運作的。購物者的虛擬世界是個有八家商店的購物中心。當購物者收到指示要購買某一項貨品時,它會隨機地到一家一家商店去尋找,直到找到該貨品為止。在搜尋時,購物者會記住到訪過的每一家商店裡陳列的一些貨品(正如人類購物者那樣)。下一次購物者要找相同的貨品,或者其他它曾經記住的貨品時,它就能直接去那家正確的商店。這個簡單的學習形式,正是在前面「何謂智慧?」一節中所指出的,叫作「機械學習」。
  在美國第一個運作的人工智慧程式也是個西洋跳棋程式。這個程式由塞繆爾(Arthur Samuel)在1952年寫成,是IBM 701的原型。塞繆爾以斯特雷奇的西洋跳棋程式為基礎,經過多年努力而做了相當大的擴充,1955年他增添了一些功能,讓程式能從經驗裡學習。塞繆爾結合了機械學習和歸納兩種機制,這個突破讓該程式在1962年的一場棋賽中,擊敗康乃狄克州的前任棋王。

演化式計算
  塞繆爾的西洋跳棋程式,也是演化式計算史上值得一記的最早期成就之一(其程式「演化」的方式,是透過以「修訂過的程式」與「目前最好的版本」進行對決,其中勝出的版本就成為新的標準)。典型的演化式計算,使用自動歸納和自動產生「下一代」程式的方法,直到演化出更高效能的結果為止。
  今天的演化式計算的主要支持者霍蘭(John Holland),也為IBM 701電腦的原型寫了測試軟體。尤其是他協助設計一隻類神經網路的「虛擬」老鼠,經過訓練後,這老鼠能擁有走出迷宮的本事。這個工作使霍蘭相信,從下而上的進路是行得通的。霍蘭繼續為IBM提供諮詢意見的同時,他在1952年到密西根大學攻讀數學博士的學位。然而,不久後他就轉到電腦與資訊處理中一個新的跨學科領域(後來稱為「通訊科學系」)。這個系是由伯克斯(Arthur Burks)所創立,他也是「電子數位積分計算機」(ENIAC)和後繼的「離散變量自動計算機」(EDVAC)的建造人之一。霍蘭很有可能是世界上第一個電腦科學博士,他在1959年的博士論文中,提出了一種新類型的電腦──多處理器電腦,也就是為網路中的每一個人工神經元各自分派一個處理器(1985年希利斯〔Daniel Hillis〕解決了工程上的困難,建造出第一部多處理器電腦──擁有65,536個處理器的「思考機器公司超級電腦」)。
  霍蘭畢業後就留在密西根大學任教,在往後的40多年時間里,他指導了許多自動演化式計算方法的研究,這些方法現在稱為「遺傳演算法」(genetic algorithm)。霍蘭實驗室中的系統包括:一個西洋棋程式、單細胞生物模型,以及一個控制摹擬瓦斯管道網路的分類系統。不過,遺傳演算法已經不再局限於「學術」的論證;一種重要的實際應用是遺傳演算法與目擊證人合作,能夠畫出罪犯的畫像。

邏輯推理和問題解決
  邏輯推理的能力是智慧的一個重要方面,因而總是人工智慧研究的一個主要焦點。這個領域的一個重要的畫時代事件是1955~1956年蘭德公司的紐維爾和蕭(J. Clifford Shaw)聯同卡內基-梅隆大學的西蒙所寫的一個定理證明程式。這個程式稱為「邏輯理論家」(The Logic Theorist),它是設計來證明《數學原理》(1910~1913)中那些定理的,這3冊一套的鉅著是由英國數學家兼哲學家懷德海(Alfred North Whitehead)和羅素(Bertrand Russell)寫成的。其中有一例,由程式所產出的證明,比原書所寫的更好。
  紐維爾、西蒙和蕭繼續研發,寫出一個更強的程式──通用解題程式(General Problem Solver, 簡稱GPS)。第一個版本的GPS在1957年運作,並且持續工作了大約10餘年。GPS使用「嘗試與錯誤」法,能夠解決各式各樣的難題,讓人印象深刻。然而,對GPS及其同類型程式的一個批評是,它缺少任何學習能力,也就是說,程式的智慧完全是第二手的,不管是什麼資訊,都是由撰寫程式的人明確地寫進去的。

英語對話
  最著名的兩個早期人工智慧程式是「伊莉莎」(Eliza)和「帕里」(Parry),它們進行了一場奇特的智慧對話(當中的細節在1966年首度出版)伊莉莎是由美國麻省理工學院人工智慧實驗室的魏岑鮑姆(Joseph Weizenbaum)所寫,模擬一位人類心理治療師。帕里則是由史丹福大學精神病理學家科爾比(Kenneth Colby)寫成,模擬一位人類偏執狂患者。精神病理學家被要求判斷跟他們對談的到底是帕里還是真的人類偏執狂患者時,往往都分辨不出來。然而,不管是帕里還是伊莉莎,都無法合理地被描述為有智慧。帕里的話語是由程式撰寫人員事先建立,並儲存在電腦的記憶體中。伊莉莎也是如此,依靠事先建立的句子和簡單的程式設計技巧。

人工智慧程式語言
  紐維爾、西蒙和蕭在編寫「邏輯理論家」和GPS的期間,發展了自己的「資訊處理語言」(Information Processing Language, 簡稱IPL),這是一種為人工智慧程式設計而量身訂做的語言。IPL的核心是高度有彈性的資料結構,他們稱之為一個「表單」。一個表單就是簡單而條理分明地列出一系列資料項目。某些或是所有表單裡的項目,自身可能也是個表單。這個架構導致非常豐富的分支結構。
  1960年麥卡錫(John McCarthy)結合IPL的成分與λ演算(lambda calculus, 一種正式的數理邏輯系統),發展出程式語言LISP(表列處理程式),成為美國人工智慧工作的主要語言(λ演算是由普林斯頓的邏輯學家丘奇〔Alonzo Church〕在1936年發明的,當時他正在研究述詞邏輯的「判定問題」──當圖靈發明通用圖靈機時,也碰到這個相同的問題)。
  邏輯程式語言PROLOG是由法國艾克斯-馬賽大學的柯爾梅勞爾(Alain Colmerauer)構思的,1973年該大學首次使用這種語言。PROLOG後來又經英國邏輯學家科瓦爾斯基(Robert Kowalski)進一步發展,他是愛丁堡大學人工智慧小組的成員。這種語言使用了一種被稱為「解析」(resolution)的強大定理證明技術,是在1963年由英裔邏輯學家羅賓遜(Alan Robinson)發明的,當時他任職於美國原子能委員會在伊利諾州的阿爾貢國家實驗室(Argonne National Laboratory)。PROLOG能夠判定一個給定的陳述是否邏輯地從其他給定的陳述導出。例如,給定陳述「所有邏輯學家都是理性的」和「羅賓遜是一位邏輯學家」,當PROLOG被問到「羅賓遜是否理性的?」時,它就能給出肯定的答案。 PROLOG被廣泛地應用在人工智慧的工作上,尤其是在歐洲和日本。
  日本東京「新一代電腦科技研究院」的研究員,就是用PROLOG作為成熟邏輯程式語言的基礎。這類語言被稱為「第五代語言」,研究院用它們來發展非數值平行電腦(nonnumerical parallel computer)。
  其他的近期成果包括開發能對與時間相關的數據作合理推斷的語言,譬如“the account was paid yesterday.”這些語言建立在時態邏輯之上,它讓陳述有了時間的坐標(時態邏輯是在1953年由哲學家普賴爾〔Arthur Prior〕所發明,他當時任教於紐西蘭基督城的坎特伯里大學)。

微世界程式
  科學家在處理現實世界難纏的複雜性時,經常忽視比較不那麼相關的細節,如物理學家經常在他們的模型中忽視摩擦和彈性。同樣地,麻省理工學院人工智慧實驗室的明斯基(Marvin Minsky)和帕佩爾特(Seymour Papert)也在1970年提出,人工智慧的研究應該把注意力集中於被稱為「微世界」(microworld)的簡化環境之中,發展有智慧行為能力的程式。現在許多研究都集中在所謂的「積木世界」,也就是在一個平面上散落了各式各樣形狀大小顏色不一的積木。
  微世界進路早期的成功例子是由麻省理工學院威諾格拉德(Terry Winograd)所寫成的SHRDLU(程式的細節在1972年出版)。 SHRDLU控制一隻機器手臂,在平面上耍弄散落的積木。機器手臂和積木都是虛擬的。SHRDLU能對鍵入的自然英語指令作出回應,像是“Will you please stack up both of the red blocks and either a green cube or a pyramid.”,程式也能回答有關自己行動的問題。雖然SHRDLU最初被奉為重大突破,但是不久後威諾格拉德就宣布,事實上程式已走到死胡同。程式中倡導的技術已經證實不適合應用在更寬廣、更有趣味的的世界上。此外,SHRDLU對積木微世界以及關於它的陳述所表現的理解,事實上也只是個幻影。SHRDLU對於什麼是綠色積木,其實毫無概念。
  微世界進路的另一項產品是薛奇(Shakey),這是一部可動式機器人,由美國史丹福研究院的拉斐爾(Bertram Raphael)和尼爾遜(Nils Nilsson)等人在1968~1972年間所建造。機器人被放置在一個特製的微世界,一個有牆壁、門口,以及一些形狀簡單的木製積木的空間。每一面牆都有精心地畫上油漆的護壁板,好讓機器人能夠「看見」地板上哪裡有牆壁(把現實世界簡化是微世界進路的典型做法)。薛奇約有十幾種基本能力,如轉、推、爬坡。
  批評者指出,薛奇的環境是高度簡化的,而且強調在這種簡化的環境中,薛奇的行動仍然極其緩慢;一些人類從準備到執行只需幾分鐘的行為,薛奇卻要花上數天功夫。
  微世界進路的最大成功是一種稱為「專家系統」的程式,在下一節中有所描述。


專家系統
  專家系統(expert system)適用於某一類微世界,這類微世界獨立自足又相對地簡單,如一個船倉及其貨物的模型。建立這樣的人工智慧系統,就是竭盡所能把某個狹窄領域的一位專家(或一組專家)該知道的所有資訊輸進系統裡,所以一個好的專家系統往往比一位人類專家還要優秀。目前有許多商業專家系統,包括醫療診斷、化學分析、信用授權、財務管理、組織規畫、金融交易,油田和礦物的探勘、遺傳工程、汽車設計和製造、相機鏡片的設計、電腦安裝的設計、飛行航線日程規畫、貨品配置,以及家庭電腦用戶的自動化協助服務。

知識和推理
  專家系統的基本元件是一個知識庫(knowledge base, 簡稱KB)和一個推理引擎。儲存在知識庫的資訊是透過與該領域的專家訪談所取得,訪談者(或知識工程師)把取自專家的資訊彙編成一組規則,這些規則往往以「如果……那麼」的結構呈現,稱為「生產規則」(production rule)。推理引擎讓專家系統能夠運用知識庫裡的規則進行演繹推論,例如,如果知識庫裡有這樣的生產規則:「如果X,那麼Y。」和「如果Y,那麼Z。」,那麼推理引擎就能夠演繹推論出「如果X,那麼Z。」專家系統甚至可以詢問它的使用者:「在我們考慮的這個情況下,X是真的嗎?」如果答案是肯定的,專家系統將得到Z的結論。
  有些專家系統使用模糊邏輯(fuzzy logic)。在標準邏輯中,真值只有兩個,即真和假。這個絕對精確的限制,使得模糊的屬性或情況很難描述(如頭髮要稀少到什麼程度才能精確地稱為禿頭?)人類專家使用的規則往往含有模糊的措辭,因此,對專家系統的推理引擎而言,使用模糊邏輯也是管用的。

DENDRAL
  1965年美國史丹福大學的人工智慧研究者費根鮑姆(Edward Feigenbaum)和遺傳學家萊德伯格(Joshua Lederberg),開始發展「啟發式分子構造固定系統」(Heuristic DENDRAL, 後來簡稱DENDRAL),那是一個化學分析的專家系統。譬如說,被分析的物質可能是碳、氫和氮的化合物。DENDRAL會從光譜攝影取得的資料開始分析,然後猜測該物質的分子結構。DENDRAL在這個任務上的表現堪與化學家競爭,它也曾應用於工業和學術上。

MYCIN
  美國史丹福大學於1972年起開發的MYCIN,是診治血液感染的專家系統。MYCIN會試著根據報告的症狀和醫療測試的結果來診斷病人,這個程式可能會要求取得關於病人的進一步資料,或是建議另加實驗測試,以作出可能的診斷,然後它會推薦一個療程。如果有需要的話,MYCIN可以解釋它的推理過程,說明為什麼會作出那樣的診斷和療程建議。MYCIN使用大概500條生產規則, 其表現就大致上可以與血液感染方面的人類專家旗鼓相當,甚至比一般開業醫師還要好。
  然而,專家系統對於它們專業知識的局限性完全沒有概念,也並不理解。例如,如果MYCIN面對受槍傷而流血致死的病人,程式可能會把症狀誤診為細菌感染。對於明顯的筆誤,專家系統也會依然據此作出反應,比如根據被不小心填錯位置的病人體重和年紀的資料而給出明顯不當的用藥劑量。

賽克計畫
  賽克(CYC)計畫是迄今符號進路人工智慧中最大的實驗。在電腦、半導體,以及電子學製造集團「微電子與電腦科技公司」的贊助之下,賽克計畫於1984年展開。1995年計畫主持人萊納特(Douglas Lenat)以資產分派的方式在美國德克薩斯州奧斯汀組建了賽克公司(Cycorp, Inc.)。賽克公司最野心勃勃的目標是建立一個儲存了相當比例人類常識的資料庫,計畫將有一億個常識的陳述或規則編進賽克,預期一億這個「臨界值」會讓系統本身能夠直接從普通敘述中產出進一步的規則,最終成為未來幾代專家系統的基礎。
  僅僅依靠一小部分編進資料庫的常識,賽克就有推理能力,足以擊敗更簡單的系統。例如,賽克運用其規則「跑馬拉松非常耗費體力,人們耗費體力時會流汗,以及當某個東西流汗時,它就是溼的。」就能夠從「賈西亞正在進行一項馬拉松賽跑」推論出「賈西亞是溼的。」在尚未解決的問題中,尤以搜尋和問題解決為重。譬如說,如何在資訊庫中自動搜尋與一個特定問題相關的資訊?在實際可行的時間內更新、搜尋,以及在實際可行的時間內用其他方式操作龐大的符號系統時,人工智慧研究人員稱之為「框架問題」(frame problem)。有些符號進路人工智慧的批評者相信,框架問題大多是無解的,所以符號進路將永遠造不出真正的智慧系統。舉例來說,在系統的知識達到人類的水準之前,賽克可能早就被框架問題所挫敗了。


連結論
  連結論(connectionism, 或稱為「類神經計算」)的發展,源自人腦在神經元層次如何運作的研究,尤其是關於人們如何學習和記憶方面。1943年美國伊利諾大學神經生理學家麥卡洛克( Warren McCulloch)和芝加哥大學數學家皮茨(Walter Pitts),發表了在類神經網路和自動機方面影響深遠的論文。他們認為腦中的每一個神經元就是一個簡單的數位處理器,而整個腦就是計算機器的一種形式。正如麥卡洛克後來所說的:「我們所思所為(我想我們做得相當成功),就是把腦看作是一部圖靈機。」

建造一個人工神經網路
  然而,直到1954年美國麻省理工學院的法利(Belmont Farley)和克拉克(Wesley Clark)才造出第一個可運作的人工神經網路──儘管受限於電腦記憶體,它最多只能有128個神經元。他們能夠訓練網路,讓它辨識簡單的圖形。另外,他們發現經過訓練的網路,就算有百分之十的隨機損壞,也不會影響它的表現──這個特色讓人聯想到,腦可以忍受因為手術、意外或疾病所造成的有限度傷害。
  上面圖片中描繪的簡單類神經網路說明了連結論的核心概念。網路中5個神經元中的4個是用作輸入的,與它們連結的第五個則用來輸出。每個神經元只有活化(1)與非活化(0)兩個狀態,每一條通往輸出神經元N的連結都有一個「權重」,而要計算輸入給N的總權重,就是把所有通往N的活化神經元的連結權重加總起來。譬如說,假設只有X和Y兩個輸入神經元處於活化狀態,而從X到N的連結權重是1.5,從Y到N的連結權重則是2,那麼輸入給N的總權重就是3.5。如同在上圖所示,N的活化門檻是4,也就是說,如果N的總輸入權重等於或超過4,N就會活化;否則,N就不會活化。那麼,舉例來說,如果只有X和Y兩個輸入神經元活化,N是不會活化的;但是如果X、Y和Z全都活化,N就會活化。
  訓練網路有兩個步驟。首先,網外的代理人輸入一個圖形,然後觀察N的行為。第二,網外的代理人根據下列規則去調整連結權重:
  A如果實際的輸出是0而要求的輸出是1,小額定量地提高通往N的活化神經元的連結權重(這樣當下一次網路被輸入同一個圖形時,N就會比較容易活化)。
  B如果實際的輸出是1而要求的輸出是0,小額定量地降低通往N的活化神經元的連結權重(這樣當下一次網路被輸入同一個圖形時,N就會比較不容易活化)。
  網外的代理人(實際上是個電腦程式),會對訓練樣品中的每一個圖形進行上述兩個程序,並重複多次。在多次重複這些程序的期間,連結權重的形式打造出來的網路,將能夠正確回應每一個輸入的圖形。讓人激賞的是,學習的過程完全是機械式的,一點人為干預或調節也沒有。權重的提高或降低,是以定量而自動的方式完成,而且完全相同的學習程序也適用於各種不同的任務上。

辨認器
  1957年美國康乃爾大學康乃爾航空實驗室(位於紐約綺色佳)的羅森布拉特(Frank Rosenblatt),開始研究他稱之為「辨認器」(perceptron)的人工神經網路。在人工智慧領域,他透過對類神經網路性質的實驗研究(採用電腦模擬)和詳盡的數學分析作出了重大貢獻。羅森布拉特是個富有魅力的傳播者,很快就有許多美國的研究小組研習辨認器。羅森布拉特和他的跟隨者把他們的研究稱為「連結論者」來強調獲知設置和改變神經元之間聯繫的重要。現代研究者已經採用了這個術語。
  羅森布拉特的貢獻之一是,把訓練程序從法利和克拉克的兩層網路應用推廣至多層網路。羅森布拉特用「逆傳修正」(back-propagating error correction)這個片語來描述他的方法,現在連結論者對這個方法和「逆傳」這個術語已經司空見慣。

動詞變化
  有一個著名的連結論實驗是由美國加州大學聖地牙哥分校區所主導的(發表於1986年),魯梅哈特(David Rumelhart)和麥克克利蘭(James McClelland)訓練了一個用來產生英文動詞過去式的網路,它分為兩層,每一層有460個神經元,共有920個人工神經元。原型動詞(如come、look、 sleep)表現在輸入層的神經元,負責調節的電腦程式觀察輸出層神經元的實際回應與要求回應(如came)之間的差異,然後根據上面所說的程序機械式地調節整個網路裡的連結,稍稍把網路往正確反應的方向推。大概有400個不同的動詞一個一個輸進網路,而網路中的連結因應每次的輸入而調節。使用同樣這些動詞大概重複了200次整個程序之後,網路除了能夠正確地產生先前這批動詞的過去式外,許多新輸入的陌生動詞也同樣難不倒它。例如,當第一次輸入"guard",它就會輸出 "guarded";輸入"weep",就會輸出 "wept"; 輸入"cling",就會輸出 "clung";甚至輸入"drip",它也會輸出 "dripped"(以兩個p完成)。這是歸納學習中一個令人激賞的例子(不過,有時候英語中的特例對網路而言實在是太多了,該程式會由"squat"產出 "squawked",從"shape"產出 "shipped",以及從"mail"產出"membled"。)
  連結論的另一個名字是「平行分散式處理」(parallel distributed processing),它強調兩個重要特性。首先,大量相對簡單的處理器(神經元)以平行的方式運作。第二,類神經網路以分散的方式儲存資訊,每一個個別的連結都參與了多項不同資訊的儲存。讓過去式網路能夠有效運作(譬如從"weep"產出"wept")的技術,並不是把資訊儲存在網路中某個特定的位置,而是經由訓練所打造出來的整個網路連結權重的形式。人腦看來也是以分散的方式儲存資訊,而連結論者的研究則有助於了解那是如何辦到的。

其他類神經網路
  近期發展的類神經計算包括下列幾項:
  1. 視覺感知:網路能夠從視覺資料辨識臉孔和其他物件。美國明尼蘇達大學的洪梅爾(John Hummel)和比德爾曼(Irving Biederman)所設計的類神經網路,能夠從白描圖中認出10個物件。這個網路能認出有柄的大杯子和煎鍋等物件,即使是不同角度下所畫的。由麻省理工學院波焦(Tomaso Poggio)研發的網路,能夠從認出由金屬線彎曲而成的各式各樣角度不一的形狀、從不同角度拍下的表情各異的人臉照片,以及有景深和方位的黑白卡通畫裡的物件。
  2. 語言處理:類神經網路能夠把手寫或用打字機打好的文件轉換為電子文件。美國國稅局已委製一個類神經系統,可以自動閱讀稅務申報和信件。類神經網路也可以把語音轉換成列印文件,或把列印文件轉換成語音。
  3. 財務分析:類神經網路在貸款風險評估、不動產估價、破產預測、股價預測,以及其他商業的應用上已越來越多。
  4. 醫療應用:包括偵測肺節腫和心律不整,以及預估藥物的副作用。
  5. 電信:類神經網路的電信應用,包括電話轉接網路的調控,以及數據機和衛星連線的回波消除。


新人工智慧
新的基礎
  目前稱為「新人工智慧」(nouvelle AI)的進路,是在1980年代後半葉由美國麻省理工學院人工智慧實驗室的澳洲人布魯克斯(Rodney Brooks)開創的。新人工智慧有別於強人工智慧的強調人類水準的智慧表現,他們熱中於相對較中庸的目標──昆蟲水準的智慧表現。新人工智慧反對符號進路人工智慧的基本原則,他們認為像「微世界程式」一節中所描述的那些建構出來的內在模型,是不能信賴的。新人工智慧的開創者主張,真正的智慧是必須有面對真實世界的能力。
  新人工智慧的的一個核心概念是,智慧就如同複雜行為所表現的那樣,是由一些簡單行為的相互作用而「突現」出來的。譬如說,一部機器人的簡單行為包括:避免碰撞,往一個移動中的物體運動時會謹慎地接近它,而太靠近時又會暫時停下來。
  新人工智慧其中一個有名的例子是布魯克斯的機器人赫伯特(紀念赫伯特‧西蒙),它所面對的環境是麻省理工學院人工智慧實驗室裡忙碌的辦公室。赫伯爾特搜尋桌子上的空汽水罐,然後把它拿走。這個機器人看似有目的的行為,是由15個簡單行為互相影響所突現出來的。最近,布魯克斯建造了一部可動式機器人的原型,目標是應用在火星地表的探險上。
  新人工智慧避免了「賽克計畫」一節中所談的框架問題,新系統並沒有關於它們環境的複雜符號模型。取而代之的是,在系統需要該資訊之前,讓資訊「留在世界之中」。新系統連續不斷以它的感應器與世界互動,而不是建立一個內在的世界模型──當它在某個特定的時間需要資訊時,才會閱讀外在世界來獲取一切所需資訊(正如布魯克斯主張,最好的世界模型就是世界本身,它總是精確地擁有最新和最完整的每個細節)。

情景進路
  總的來說,傳統人工智慧試圖建造的智慧是非實體的,它與世界的互動不是直接的(如賽克)。另一方面,新人工智慧試圖建造的是能在現實世界的情景中體現的智慧──這方法後來被稱為「情景進路」。布魯克斯稱許圖靈在1948和1950年草擬的情景進路,並引用他的話,為機器配置「用錢能買到的最好的感覺器」。圖靈寫道,機器可以被教導為「能理解和說英語」, 而且透過「平常教育孩子的方式就行了」。圖靈把它與集中於抽象活動(如下西洋棋)的人工智慧進路相對照,他認為這兩個進路都是值得投入的,但是情景進路一直沒有引起多少注意,直到前不久才有了變化。
  加州大學柏克萊分校的哲學家德雷福斯(Bert Dreyfus)的著作中,也曾預言情景進路。1960年代之初,德賴弗斯就開始反對物理符號系統假說,主張智慧行為無法完全由符號描述來掌握。作為另一選項,德賴弗斯倡議的智慧,強調需要一個身體,它能在周遭移動,並直接與實際的物件互動。雖然一度遭人工智慧的擁護者辱罵,但德雷福斯現在已被視為情景進路的先知。
  新人工智慧的批評者指出,現在要建造能夠展現真實昆蟲行為複雜性的系統,都還做不到。如果有研究人員宣稱他們的新系統很快就能擁有意識和語言,看來完全是言之過早。


強人工智慧可行嗎?
  如同這篇文章前面所描述的,應用人工智慧和認知模擬的持續成功發展,似乎是滿確定的。然而,強人工智慧──也就是致力於複製人類智能的人工智慧,仍有爭議。專業期刊和大眾出版刊物誇大它的成功,已經損壞了它的名聲。目前,即使是全面展現蟑螂智慧的系統,都已證明是難以達到的,至於人類水準的系統就更不用說了。列舉人工智慧確實的成就時,不能過度渲染。60年的符號進路人工智慧研究,迄今無法提供任何堅實的證據,以證明符號系統能夠展現人類水準的一般的智慧;就連最簡單的無脊椎動物神經系統都建立不了;對新人工智慧持批評態度的人則指出,那種認為涉及語言理解、計畫以及推理能力的高等行為能經由簡單行為(如迴避障礙、控制視線,以及操控物件)的互動而突現出來的觀點,根本就是編造神話。
  然而,缺少堅實的進展可能只是證明了強人工智慧的困難,而不是不可能。讓我們回頭看看強人工智慧的核心概念問題。一部電腦可能思考嗎?喬姆斯基認為,爭辯這個問題是沒有意義的,因為是否把「思考」這個詞的一般用法擴展到機器上,基本上是可以任意決定的。喬姆斯基主張,這樣的決定是對還是錯根本不是一個事實問題,正如我們是否應該作出決定說「飛機會飛」是正確的,或者決定不說「船會游泳」是錯誤的那樣,根本不成其為問題。不過,這似乎把問題太簡單化了。重要的問題在於,說一部電腦會思考是恰當的嗎?如果答案是肯定的這樣,電腦必須滿足什麼條件才能算是會思考?
  一些作家以圖靈測驗測試作為智慧的定義。然而,圖靈自己就指出,一部應該被稱為有智慧的電腦,如果它無法成功地模擬人類,完全可能無法通過他的測試。例如,設計來上月球監督採礦的智慧機器人,為什麼必須能夠通過和人類一樣的談話測試?如果有智慧的實體有可能無法通過測試,那麼該測試就起不了定義智慧的作用。即使電腦已經通過測試,是否真能顯示它擁有智慧?這也是存疑的,正如1956年資訊理論學者香農(Claude Shannon)和人工智慧先驅麥卡錫所指出。他們爭辯說,要設計一部機器,擁有詢問人在測試的固定時間內可能問的所有問題的回應,原則上是可行的。就像帕里,這部機器能夠在一張巨大的表單上找到適當的回應,以回答訪談人的問題。這個反例似乎表明,原則上一個完全沒有智慧的系統也能通過圖靈測試。
  事實上,人工智慧並沒有提供智慧的真正定義,甚至連低於人類層次的智慧也是如此。老鼠是有智慧的,但是什麼樣的人工智慧成就,才能讓研究者宣稱他們成功做到老鼠層次的智慧?在沒有合理明確的標準能判定一個人工系統是否有智慧以前,就沒有一個客觀的方式能論斷一個人工智慧研究計畫到底是成功還是失敗。人工智慧未能提供一個令人滿意的智慧判準,其後果之一是,每當研究者完成一個人工智慧的目標(譬如說能夠把報紙文章的內容做成摘要,或擊敗世界西洋棋冠軍),批評者都可以說:「那不是智慧!」同之前的圖靈一樣,明斯基對定義智慧問題的回應是,智慧只是我們命名尚未理解的任何問題解決的心智歷程的一個名詞。明斯基把智慧比作「未探索的非洲地區」:一旦我們發現它,它就消失了。
有誰推薦more
全站分類:創作 詩詞
自訂分類:不分類
發表迴響

會員登入