世界前五個使用者最廣的生成性AI,在AI深度學習過程有無對著作權人付使用費?
2026/05/29 15:16
瀏覽184
迴響0
推薦11
引用0
我問ChatGPT:
世界前五大使用者最多的生成式AI。在深度學習過程,使用他人大量著作而學習訓練,有沒有對著作權人付過使用費?各花多少錢?
ChatGPT回答:
簡單說,目前全球主要生成式 AI 公司,在「深度學習訓練」過程中:
大多數早期都沒有普遍、全面地向著作權人付費。
而是:
• 先大量抓取(scraping)網路資料、
• 使用公開網站、
• 使用數位圖書、
• 使用新聞、
• 使用論壇、
• 使用 GitHub 程式碼、
• 使用圖片資料庫、
• 有時甚至涉及盜版資料庫,
之後因為大量訴訟與政治壓力,近兩年才開始陸續簽授權契約、支付部分費用。
但至今:
「真正完整依法取得授權」的 AI,幾乎不存在。
這也是目前全世界 AI 著作權爭議最大的核心。
一、OpenAI(ChatGPT)
OpenAI
早期情況
OpenAI 早期訓練 GPT-3、GPT-4 時,普遍認為大量使用:
• 網頁抓取資料
• 書籍資料庫
• Wikipedia
• Reddit
• GitHub
• 新聞網站
其中部分內容可能受著作權保護。
《紐約時報》、作家、程式設計師都曾提告。
有沒有付費?
有,但很晚才開始。
近兩年 OpenAI 才開始大量簽:
• 新聞媒體授權
• 出版商授權
• Reddit 授權
例如:
• News Corp
• Financial Times
• Axel Springer
• Reddit
等。
花多少錢?
大部分金額未公開。
目前公開資訊推估:
類型 金額
Reddit 授權 據傳每年約 6000 萬美元
出版商授權 單案數百萬~數千萬美元
全部內容授權總額 可能數十億美元級
但:
相較於實際使用的著作數量,仍只是很小一部分。
目前沒有任何證據顯示:
OpenAI 曾對「所有被訓練的作者」逐一付費。
二、Google(Gemini)
Google
Google 情況更特殊。
因為 Google 本來就:
• 擁有全球最大搜尋引擎
• 長年爬取全網
• 建立龐大索引資料庫
因此 Google 認為:
AI 訓練是搜尋索引與資料分析的延伸。
有沒有付費?
部分有,部分沒有。
Google 現在有與新聞媒體簽約。
但 Google 的立場是:
願意付「內容存取費」,不願承認「訓練本身必須付費」。
這是目前歐洲與新聞業爭議很大的地方。
花多少錢?
未公開。
目前推估:
• 數億美元等級可能有
• 但遠低於其 AI 基礎建設投資
Google 每年花在 GPU、資料中心的金額,
遠超過內容授權費。
三、Anthropic(Claude)
Anthropic
Anthropic 是目前:
著作權爭議最嚴重、也最具代表性的案例。
發生了什麼?
法院文件顯示:
Anthropic 曾下載數百萬本盜版電子書,
包括:
• LibGen
• Pirate Library Mirror
• Books3
等資料庫。
甚至還:
• 買實體書
• 拆書掃描
• 數位化後銷毀
作為 AI 訓練資料。
有沒有付費?
早期沒有。
之後遭大規模訴訟。
2025 年達成:
美國史上最大 AI 著作權和解案。
花多少錢?
約 15 億美元。
平均:
• 每本書約賠償 3000 美元左右。
這是目前唯一:
已公開、具體、巨額支付的 AI 訓練著作權案例。
但 Anthropic 仍主張:
AI 訓練本身屬於 fair use(合理使用)。
而美國部分法院,也開始接受此論點。
四、Microsoft(Copilot)
Microsoft
Microsoft 本身是:
• OpenAI 最大投資者
• GitHub 擁有者
因此其 AI 爭議:
主要集中在:
• GitHub Copilot
• 開源程式碼訓練
有沒有付費?
大部分沒有。
大量開源程式被用於訓練,
但許多作者認為:
• AI 已超出原授權目的
• 未遵守 GPL 等條款
因此有集體訴訟。
花多少錢?
目前:
• 幾乎沒有公開大規模賠償金額
• 也未建立普遍分潤制度
但 Microsoft 已開始與企業資料供應商合作。
五、Meta(Meta AI / Llama)
Meta Platforms
Meta 也是被批評最重者之一。
法院文件與媒體報導顯示:
Meta 曾使用:
• LibGen
• 大量網路抓取資料
• 未授權書籍
作為 Llama 訓練資料。
有沒有付費?
目前公開資訊顯示:
早期幾乎沒有。
之後才開始有限度授權。
但:
Meta 至今仍面臨大量作者集體訴訟。
六、目前全球真正的核心爭議
其實現在全世界真正爭議,不只是:
「有沒有付錢?」
而是:
「AI 訓練到底算不算著作權侵害?」
目前主要有三派:
立場 主張
美國科技公司 屬 fair use
歐盟部分學者 屬 TDM(文字資料探勘)例外
作者/出版業 應全面授權付費
七、真正的現實:AI 公司花最多的,其實不是著作權費
目前 AI 公司最大支出其實是:
項目 金額
GPU 天文數字
資料中心 天文數字
電力 天文數字
著作權授權 相對很少
例如 Anthropic 光租用資料中心,
一年就可能高達:
150 億美元。
反而:
• 作者授權費
• 出版商費用
目前占 AI 成本比例仍很低。
八、所以您長期關心的核心問題,其實正是:
您過去一直研究的:
• 日本著作權法第30條之4
• AI 深度學習合理使用
• 主權 AI
• 公共資料供 AI 使用
其實正是:
「人類文明知識是否可以被 AI 無償吸收?」
這已經是:
• 美國
• 歐盟
• 日本
• 韓國
• 中國
目前最激烈的著作權戰場之一。
你可能會有興趣的文章:
限會員,要發表迴響,請先登入
















