全世界五大生成式AI公司,在深度學習中文資料過程中,是否曾經對台灣的著作權人給付過使用費?
2026/05/29 17:15
瀏覽98
迴響1
推薦3
引用0
台灣欲發展主權AI,最困難的問題,就是如何取得生成式AI深度學習的中文資料,取得時,如何一一得到授權?應付多少使用費?
我好奇,全世界五大生成式AI,它們如何得到台灣著作權人的授權作深度學習?尤其是如何付費給台灣的著作權人?共給付了多少錢?
我擔任幾十家台灣出版公司的法律顧問,也擔任一些報社及雜誌社的法律顧問,卻沒有聽說,他們從全世界五大生成式AI公司拿過使用費,也沒有人向它們尋求授權。
我們主管機關經濟部智慧財產局說,發展主權AI,在深度學習過程中,如果沒有得到著作權人的授權,是侵害著作權的行為,於是於是:
我問chatGPT:
全世界五大生成式AI,在深度學習中文資料過程中,是否曾經對台灣的著作權人給付過使用費?共給付了多少錢?
chatGPT回答:
如果您問的是目前使用量最大的五大生成式 AI(大致可包括 OpenAI 的 ChatGPT、Google 的 Gemini、Meta Platforms 的 Meta AI、Anthropic 的 Claude,以及 Microsoft 的 Copilot),那麼就「深度學習中文資料過程中,是否曾向台灣著作權人付費」而言,目前能確認的情況其實相當特殊:
迄今為止,幾乎沒有公開證據顯示這些 AI 公司曾經針對台灣著作權人的中文著作,大規模逐一取得授權並支付使用費。
目前公開可查到的付款,大致分成三種:
第一種:根本沒有付費,而直接抓取網路資料訓練
許多大型語言模型早期訓練資料來自 Common Crawl、Books3、Wikipedia、網頁抓取資料庫等來源。
大量作家、出版社、新聞媒體主張其著作被納入訓練,但未事先取得授權,因此才產生美國近年大量 AI 著作權訴訟。(arXiv)
如果是台灣出版社、新聞網站、部落格、學術論文或一般中文網站內容,被爬蟲抓入訓練資料集的情況極可能存在,但目前沒有公開資料顯示 OpenAI、Google、Meta 或 Anthropic 曾逐一向台灣權利人支付授權金。
第二種:向大型媒體集團購買授權
近兩年開始,AI 公司逐漸改採授權模式。
例如:
• OpenAI 與 Axel Springer 簽署授權協議。(金融時報)
• OpenAI 與 News Corp 達成五年合作,外界估計總值超過 2.5 億美元。(contenseo.com)
• Amazon 與 The New York Times Company 達成 AI 授權合作。(Reuters)
• Meta 與 Reuters、News Corp 等媒體進行授權合作。(Axios)
但這些公開授權案幾乎全部發生於美國或歐洲大型媒體集團。
目前尚未看到 OpenAI、Google、Meta、Anthropic 或 Microsoft 與台灣大型出版社、報社或著作權集管團體簽署公開的大型 AI 訓練授權案。
第三種:訴訟和解後補償
最具代表性的是 Anthropic。
2025 年 Anthropic 為 Claude 訓練使用大量盜版書籍資料庫而遭作者集體訴訟,後來同意支付約 15 億美元和解金。(Axios)
外界估計平均每本受影響著作約可分配 3,000 美元左右。(Econlib)
但這筆錢主要是支付美國及英語世界作者與出版社。
目前並未看到有台灣作家或出版社被列入公開受償名單。
就台灣而言,金額是多少?
若嚴格問:
「五大生成式 AI 公司迄今是否曾對台灣著作權人支付 AI 訓練使用費?支付多少?」
目前能確認的答案恐怕是:
公司 已知是否向台灣著作權人支付 AI 訓練授權費
OpenAI 無公開紀錄
Google 無公開紀錄
Meta Platforms 無公開紀錄
Anthropic 無公開紀錄
Microsoft 無公開紀錄
因此:
目前公開可證明支付給台灣著作權人的金額,幾乎可以說是「零」或至少「未曾公開揭露」。
這也是近年台灣著作權界爭論很大的問題:
台灣的中文出版品、新聞報導、部落格文章、論文及網頁內容,很可能已被全球 AI 模型大量吸收學習;但相較於美國大型媒體集團已開始取得數千萬甚至數億美元授權收入,台灣著作權人目前幾乎看不到任何實質分潤機制。
這也正是您先前關心的《促進資料創新利用發展條例草案》以及主權 AI 討論中的核心爭點之一:台灣究竟要採日本式資料利用優先模式,還是建立類似集體授權、法定授權金或資料信託制度,使本國權利人能從 AI 訓練獲得報酬。(
限會員,要發表迴響,請先登入







