也就一個月前,連續弄疼美國的中國大陸二款第六代戰鬥機、裝備電磁彈射和阻攔索的076兩棲攻擊艦、空警3000預警機、反隱身雙體無人預警機,美國政府尚且無解也拿不出對策。這些天才消停TikTok一陣子的風波,又來個不算小的DeepSeek大事,美國可真是叫中國大陸給折騰得喘不過氣來著。
至今美國政府對於中國大陸新出爐的軍事裝備還反應不過來,也就沒啥好説説的啦。TikTok事情不算小且發生在美國本土,好歹美國政府和民間私營企業對其上了對策,只是這種強盜行為不齒,TikTok也給美國上了眼藥,短時間要出啥個結果不好説。倒是DeepSeek是中國大陸土生的企業,但卻對美國AI產業界造成極大的震撼力。
美國也許想利用高階晶片,尤其是AI晶片對中國大陸來個像美蘇“軍備競賽”的另類競賽,美國想以算力見長的AI晶片,得耗用高金額支出拖垮中國大陸的半導體產業,進而影響到中國的經濟成長。總之就是不讓中國大陸好過美國,永遠存活在追趕美國的後頭,這次的AI角力可稱之“算力和算法競賽”。
當年雷根提出星際大戰概念,畫了個大餅,並且如假包換地畫了許多未來星際大戰的武器裝備圖,犯蠢的蘇聯隨了上去,加大力度在“軍備競賽”上。蘇聯一方面得大額軍費支出,令一方面美國利用石油危機給蘇聯造成能源輸出外賣的困頓,收入嚴重下滑。不多久笨瓜的哥巴契夫因為得意於西方世界頒給他的諾貝爾和平獎,將偌大的蘇聯帝國給弄垮解體了,真是蘇聯的罪人。
今天美國一直以來都在做許多將來武器裝備概念的PPT(簡報)大圖,只是這些美國未來概念的武器裝備不是還停留在實驗室裡,就是做出來的產物叫美國自己都不敢苟同,可以算是失敗的產品,另外這些新東西的成本叫人咋舌。相反地,中國大陸卻一一將美國以PPT製作的概念武器裝備給實踐了,而且比美國的還要好成本更低,這下子美國不敢同中國大陸在武器裝備上來場競爭,怕是給中國大陸拖垮她的經濟。
美國的武器裝備已經開始落後解放軍,雖然美軍的軍事實力勘強,但要打贏中國大陸難的呦。美國現存就只高階晶片勝過中國大陸,這等晶片也就是電腦手機用的CPU、GPU(現在該晶片功能擴展泛稱AI晶片),而這類晶片就是我們通稱的硬體。
我們知道電腦或手機之所以能夠運作,不是單單靠外表看是硬邦邦的機殼和內部的硬件而已,軟體也是主角之一,不可或缺。硬件屬CPU最主要,而現今當紅的AI產品則是以GPU為主,這就為什麼NVidia(輝達)是現在的當紅炸子雞,股價屢創新高的了。
很多搞軟體設計的人都知道,為了避開硬體的受限,於是會借用軟體的編程來彌補硬體之不足,其實在早期對於那些開發遊戲軟體的設計師來説,鉗有GPU顯示卡並不普遍,他們都是在軟體的設計上絞盡腦汁,也是以先於他人發現目標追求贏局,這不難理解,在軍事武器更是表現絕對,亦即所有的武器都得先於敵人的快。你想金庸的武俠小説就一口絕“天下武功唯快不破”的道理了。
對於同一件案硬體和軟體都有著同樣的處理能力,如果由硬體的晶片來執行鐵定快於軟體的執行,因為晶片的執行是直接的,而軟體則需要層層進程,起碼IO(輸入輸出)部分就夠耗時,何況CPU的處理還得排隊等著。但是已經完工的晶片是死的,一旦有所變化,軟體比較容易更新,這是為何你在使用電腦軟體時會時不時地通知你可以更新了的道理,但你有碰過要你更新晶片嗎?只有更換新電腦一途罷了。
這次中國大陸某公司推出的DeepSeek為何叫Open AI公司的Chat GPT o1膽寒呢?因為一開始大家都囿於AI晶片GPU固有的巢臼,總認為只有更多更先進的GPU配備才能勝任AI大模型的開發,也就是説要有足夠的算力(運算能力;computility)才能開發出他們所謂的大模型,嚴謹説是他們想要的通用大模型。一般人習以的認知,衡量算力強弱是指硬體GPU晶片多寡功能多強來著。
站在現在的美國立場來説是這樣的,然而在中國大陸的心裡頭,通用大模型偏向娛樂方面。中國大陸是世界工廠,所以中國大陸的企業更傾向利用AI開發有利於製造方面的專業大模型,但是這不表示中國大陸不需要通用大模型,中國大陸也有自己的通用大模型,例如文心、通義、豆包都是,只是沒有Chat GPT來的強悍罷了,說穿了人家美國限制出口高階一點的GPU給中國大陸,中國大陸只能使用閹割過的GPU晶片,配備就已經輸了,如何拚得過擁有一手貨源的美國企業。
好了,既然硬體方面的GPU中國大陸尚且追不上美國,美國又不賣,那就另謀對策了。前面説了軟體的編程設計是可以取代硬體之不足,那不就得了,想法子就是。硬體的過程説是算力,那軟體要等齊硬體或是勝過硬體,靠的便是算法(Algorithm;解決問題的策略機制),算法對於養成的軟體工程師來説是必備且必要的。早期的遊戲軟體賣不賣的好,比拚的是誰家編寫的軟體更順暢得了,後來有了獨立CPU的GPU顯示卡,才如虎添翼如魚得水般更加順手。
算法不能狹義只指程式的編寫,舉凡在架構、過程等方方面面能夠更加有效于達成目標、解決問題都可説是算法。早些年中國大陸的超級計算機持續幾年站在全球第一,美國面子掛不住,最後決定不准賣美國產的CPU和GPU給中國大陸製造超級計算機的單位、機構,中國大陸為了避免困撓退出超級計算機的全球競賽。事後至今時有報導,中國大陸照樣做出的超級計算機比美已經幾年居全球第一的美國超級計算機,甚且可能贏過美國,就此看出沒有美國領先的晶片,以架構、編寫過程同樣可以達成目標。
奪過全球第一的中國大陸超級計算機應屬國家或政府單位所有,已經退出全球競賽,現今的情況怎樣透明度不夠,無從知悉。今天DeepSeek可是一家民營企業的產品,報導説用的只能是被輝達閹割過,其功能不及原H100和A100一半不到的H800或H80或A800,但是卻表現等同Chat GPT o1或勝過。
DeepSeek最新R1版本的訓練費用,僅僅是Chat GPT o1的三十分之一,也就是説只花了人家三十分之一的錢,卻做出了相同的效果。而且免費還開源,不像Open AI掛名Open卻不Open(開源)還所費不貲,這讓Open AI的工程師處境尷尬異常,不知如何解釋,叫Open AI情何以堪啊。
DeepSeek的公司自己説了,為了彌補算力之不足,只能從算法、數據優化、訓練過程優化另闢蹊徑,通俗説即是施以軟體手法來達成現世已有的成績,這結果是有了相近的成績,還降低不少成本。還有的是DeepSeek也能在中國大陸自己開發出較為美國落後的算力晶片上達成目標,這下子也叫美國心慌慌乁。
美西方發達國家在商業上的行為是在買方無力開發的產品賣以高價,哪天買方有了自我開發的苗頭便無情的打壓遏止其發展,最好是掐死它讓其胎死腹中。等到對手自行研發的產品不死,有了初步成績時,便將他們的產品低價傾銷賣給對手,讓對手生產的成本不敵賣方的售價而倒閉,最後再又回到從前那樣。
這不,中國大陸在美國帶頭下打壓、遏止中國大陸半導體產業的研發,但二年多下來,中國大陸在中低階亦即成熟製程的晶片已見成效,不僅能夠滿足自己的需求,還能外銷出去,於是美國再拾起他們慣用的賤招,還動用他們不滿其他國家使用的貼補政策,傾銷中低階晶片賣給中國大陸。這可好,已經有自信的中國大陸,不再是唯唯諾諾的不得已聽話的國家,也對美國提起反傾銷晶片的調查。
幾十年下來中國大陸已養成教育許許多多的優秀工程師,近幾年不論是民用或是軍用的現代科技創新爆發出無數的新產品。這方面美國去實務虛好些年下來少了許多本國白人工程師,雖然美國矽谷絕多數企業用了不少華裔和印度裔工程師,但又奈何啊。誰叫美國只喜歡賺快錢的金融資本,厭棄幹髒活累活的工業資本。
剛剛上任的川普新政府在1月21日,宣佈了一項名為“Stargate”(星際之門)的人工智慧(AI)基礎設施投資項目。初始股權投資人有日本軟銀、OpenAI、甲骨文,計畫未來四年投資5000億美元發展AI,以確保美國的全球領先地位。不過這下子讓花小錢照樣辦大事的DeepSeek叫川普政府如何是好,美國花大錢辦事,卻隨時可能叫DeepSeek等之類產品打臉,才上任沒幾天的川普難的呦。
Hallyeh 2025/2/2










