Google 砸 400 億押 Anthropic、美國對 DeepSeek 升外交戰、AI 收割倒閉新創 Slack
Google 對 Anthropic 加碼至多 400 億美元、Meta 把代理推理交給 AWS Graviton;美國國務院全球發 DeepSeek 蒸餾警告;倒閉新創 Slack 對話正被 AI 公司搶購。
4 月最後一週的 AI 與半導體新聞落在同一條軸線上:模型公司在搶下一輪算力的長約、雲端商與晶片廠把代理推理工作負載拆出 GPU、訓練資料的下一個前線從公開網路推進到倒閉新創的內部 Slack。同時間,美國對中國 AI 模型的指控從產業戰升上外交層級,而 AI 規模化所撞上的物理瓶頸——能源、半導體封裝良率、輸出可信度——也同時被攤開來。以下按權重整理。
AI 算力長約戰白熱化:Google → Anthropic 400 億、Meta 拉 Graviton 跑代理推理
Alphabet 對 Anthropic 加碼至多 400 億美元。
- 第一階段:100 億美元現金,以 3,500 億美元估值投入
- 第二階段:Anthropic 達設定目標後,Google 再追加 300 億美元
這筆投資不是純現金注資,伴隨更深的硬體基礎設施綁定。Anthropic 同期年化營收從去年底 90 億美元飆破 300 億美元,9 個月內跳了 3 倍。需求成長直接推動算力長約:本月稍早 Anthropic 與 CoreWeave 簽長期雲端合約,亞馬遜投資高達 250 億美元,年底前 Trainium2 與 Trainium3 晶片總計達 1 GW 規模上線;同時與 Google、博通簽下新合作協議,預計 2027 年起取得數個 GW 等級的下一代 TPU 算力。
值得注意的是這次的時機點。Anthropic 今年 2 月剛完成 300 億美元新一輪融資,投後估值 3,800 億美元;同月在私人次級市場 Forge Global 上的估值飆至 1 兆美元,超越 OpenAI 在同一市場的 8,800 億美元。在 上週報告 內已拆過:1 兆是流動性溢價,不是估值真理,差距 2.6 倍是想買的人多、能賣的內部人少。
但 1 兆估值確實在影響 Google 的下注規模。當 Anthropic 在初級市場已逼近 4,000 億而二級市場資金願意付 1 兆,先把 100 億現金鎖進去、把另外 300 億押在里程碑上,是對「估值還會往哪走」的對沖式表態。
同一週 Meta 與 AWS 簽下新合作,將大規模部署 Graviton 處理器——金額未公開。表面上是 Meta 的算力擴張新章;實際上反映的是 AI 基建架構的轉向。
- GPU 仍主導大型模型訓練
- 代理式 AI 帶起的即時推理、程式碼生成、搜尋、多步驟任務協調等工作負載偏 CPU 密集
- AWS Graviton 採 Arm 架構,正是針對這類場景設計
- 最新 Graviton5 配備 192 核心、快取容量為上一代 5 倍、核心間通訊延遲最高減少 33%
- 採台積電 N3 製程;AWS 從晶片到伺服器架構全鏈自研
- 效能較上一代提升 25%、能源效率優於現成處理器
Meta 每日服務 36 億用戶、全球 32 座資料中心仍不夠支應。願意比照 Google 與微軟以大筆資金換算力的同時,這次訊號比金額本身更重要:當代理推理把 CPU 路徑做出新的需求曲線,超大規模廠的算力組合不再以 GPU 為唯一單位。
可見的訊號是兩條算力長約都在放大同一件事——AI 公司在綁未來 18-24 個月的供給,雲端商與晶片廠的議價權在過去一年內已實質性轉換到買方的「能不能拿到」這一側。若 Anthropic 在年底前真把 Trainium 帶到 1 GW 規模、把 TPU 數個 GW 預定到 2027,閉源前沿模型的供給受限不會是季度性題目,而是兩年期結構問題。
美國對 DeepSeek 升戰至外交層級:智財戰打進使館電報
美國國務院 4 月 24 日對全球駐外使館發出外交電報,要求外交人員與其對應人員談論「對手擷取並蒸餾美國 AI 模型的疑慮」。另一份單獨的交涉函已發送至北京。
電報點名 DeepSeek、月之暗面(Moonshot AI)、稀宇科技(MiniMax)等中國公司,指控其大規模從美國先進 AI 實驗室竊取智慧財產。蒸餾是利用較舊或較大的模型訓練新模型、複製其能力且成本通常遠低於從零打造的技術——過去一年在開源社群是公開且常見做法,但這次被升級到「鋪路給美國政府後續行動及對外接觸」的政策層級。
電報的關鍵指控有兩段語言值得記下。一是「透過暗中、未經授權的蒸餾行為所開發的 AI 模型,讓外國人士得以推出在特定基準測試看似具有相當效能的產品,且成本僅原版的一小部分,但這些產品未能完整重現原始系統的全部效能」;二是這些行動「刻意剝離原有模型中的安全協議,並破壞了確保這些 AI 模型在意識形態上保持中立及追求真理的機制」。第一段把蒸餾框成「複製品但不完整」,第二段把蒸餾框成「移除對齊」——這是把技術差距論述轉換為國家安全論述的標準動作。
DeepSeek 同日推出 DeepSeek V4 預覽版,由華為昇騰晶片提供全面支援。這個時間重合不會是巧合:在 上週報告 的 V4 段落內已拆過 V4 是中國模型 + 中國晶片自主鏈第一次走通的公開證據,同日國務院電報的時間點,正在把「中國有沒有能力做出獨立的前沿 AI 系統」變成國際法外交議題。
中國駐美大使館回應稱指控毫無根據。OpenAI 今年 2 月已向美國國會議員警告 DeepSeek 以 OpenAI 及其他美國 AI 公司為目標複製模型;白宮本週也提出類似指控。
短期可預期:若這份電報在外交層級的對話真的引發其他西方政府跟進的政策動作(如新的出口管制、雲端服務存取限制、開源權重平台合規要求),開源 AI 社群會被拉進一個過去幾年沒處理過的合規環境。許多西方政府和部分亞洲政府已禁止官員使用 DeepSeek 產品;下一步可能會是託管 DeepSeek 權重的國際平台被要求檢視。
倒閉新創的 Slack 對話正被 AI 公司搶購:訓練資料的下一個前線
語音轉錄新創 Cielo24 倒閉,前執行長 Shanna Johnson 透過倒閉善後服務商 SimpleClosure,把公司 13 年累積的「營運廢氣」(operational exhaust)賣給 AI 公司——金額達數十萬美元,超過新台幣 300 萬元。
「營運廢氣」涵蓋的範圍如下:
- 每一封電子郵件
- 每一個 Slack 對話與玩笑
- Jira 工單與專案紀錄
- 員工 13 年累積的數 TB Google 雲端硬碟資料
SimpleClosure 推出的 Asset Hub 平台已替近百家倒閉公司處理這類交易,成功為創辦人追回逾 100 萬美元;每家公司平均落在 1 萬至 10 萬美元之間。競爭對手 Sunset 執行長 Brendan Mahony 補充:定價取決於規模、年份與「數據豐富度」,與程式碼提交紀錄綁定的 Jira 工單比單一文件更值錢,醫療與金融等特定產業的內部數據還享市場溢價。
為什麼 AI 公司開始搶購倒閉新創的內部數據?OpenAI 前首席科學家伊爾亞・蘇茨克維(Ilya Sutskever)已指出,公開網路訓練資料在 2024 年底前實質耗盡。維基百科、Reddit 論壇與數位化書籍構成的公開語料庫可以教模型講話,但不會教代理式 AI 怎麼處理跨部門爭論、bug 追蹤、決策往來——這些天然模擬「人在工作時如何思考與溝通」的內部數據,正是訓練代理式 AI 執行複雜任務最欠缺的素材。
值得注意的是 Cielo24 的 13 年數據用「數十萬美元」就成交。對比 Anthropic 與 OpenAI 動輒上百億的算力支出,訓練資料這一側的單位成本目前還非常便宜——但這只是因為市場剛開始定價。SimpleClosure 執行長 Dori Yona 對外講「順勢開發推出 Asset Hub」這句話,意思是這個業務的需求曲線在過去半年才剛被 AI 實驗室帶起來。
隱私是這場交易的炸彈。在這些新創公司奮鬥的員工,傳送 Slack 訊息時不會預料到這些夾雜私人情感的對話會成為訓練第三方 AI 的生財工具。真實世界數據合規公司 Protege 執行長 Bobby Samuels 直接警告:匿名化處理絕非按下開關那麼簡單;如果做得不乾淨,使用數據的公司能反推特定組織與個人的活動,這些隱私甚至可能洩漏到 AI 模型的輸出結果中。2020 年 OpenAI 與 Google 等機構的研究已證實這個恐懼:大型語言模型會無意間「逐字記憶」訓練數據,並可能在特定提示下將機密字句原封不動地吐出。
人工智慧與數位政策中心(Center for AI and Digital Policy)創辦人 Marc Rotenberg 把問題講得更直接:「員工隱私依然是核心隱憂,特別是因為人們已經變得如此依賴 Slack 這類內部通訊工具。這不是一般的通用數據,而是可辨識的個人。」
短期可預期:當倒閉新創內部資料的商業化路徑被 SimpleClosure 與 Sunset 走通、單筆交易金額仍小到避開大眾關注,第一波集體訴訟或勞動法挑戰會從加州或紐約這類員工保護較強的州開始。若這個邊界沒有被監管或合約寫法及時補上,下一輪結束的新創公司在簽倒閉服務時,員工 Slack 對話會內建進交易條件。
AI 虛擬人物可能正在悄悄改寫選舉討論:英屬哥大警示
英屬哥倫比亞大學在《Science》刊登政策論壇論文,警告大型語言模型與多代理人系統的進展,已讓單一操作者能管理大規模 AI「聲音」干預選舉討論——而且不一定靠假訊息呈現。
論文點出這類 AI 角色與傳統機器人帳號的差異:
- 能即時協調,根據他人回饋持續修正說法
- 模仿在地語氣與用詞,潛入線上社群參與討論
- 透過大量小型測試找出最具說服力的訊息,再即時最佳化傳播策略
- 可長時間、密集且看似正常地互動,慢慢改寫人們對議題與政治人物的判斷
這個操作模式的真正威力不在於散播某個明顯的假新聞,而在於讓網路上看似自然的「共識」其實是人為操控的結果。深偽(Deepfake)內容與假新聞網路已是早期警訊;UBC 電腦科學家 Kevin Leyton-Brown 提到,這類內容已在美國、台灣、印尼與印度等地的近期選舉討論中出現。同時間,監測組織也發現親克里姆林宮網路在大量散布內容,可能意在影響未來 AI 系統的訓練資料與資訊排序——把今天散布的內容變成明天 AI 答案的源頭。
研究者認為最令人擔憂之處不是某個敘事被散布,而是民眾對網路資訊的信任方式正在改變。當使用者越來越難辨識未知帳號真偽,名人與大型平台上既有影響力的權重會被進一步放大,草根聲音則更難突圍。
短期可預期:下一場選舉就是檢驗這項技術影響力的關鍵時刻。若沒有能在 swarm 操控擴散前及時偵測的機制——對線上討論做來源、傳播路徑、論述演化的縱貫追蹤——民主社會處理「信任危機」的成本會在 12 個月內顯著拉高。
農電共生的算力解方:< 2% 農地能餵飽 AI 資料中心
新研究以州層級資料推估美國農電共生(agrivoltaics)潛力,得到一個直接的數字:在部分擁有大型 AI 資料中心的州,動用不到 2% 農地就可能為資料中心供應所需電力,且部分情境還能提升農作產量。
具體佔地比例如下:
- 垂直式農電共生:占農地約 0.003%-2%
- 單軸追蹤式:占農地約 0.001%-0.548%
- 兩種設計都能與農機作業相容,垂直式可作風障、改善作物微氣候,有助於小麥、馬鈴薯與多種蔬菜的產量
這個數字之所以重要,是因為 AI 用電已開始威脅電網規劃。EPRI 估美國資料中心 2024 年耗電 177-192 TWh,2030 年可能攀升至 380-790 TWh;高成長情境下,資料中心會消耗全美 17% 的電力。維吉尼亞州等地的用電壓力最為突出,建設速度遠快於電廠與輸電系統擴充速度,已成為可靠供電與成本控制的風險來源。
值得注意的是這項研究提供的不是新的能源類型,而是把現有再生能源與農地的衝突用「共生」框架解開。場內發電、儲能、彈性負載管理之外,農地同時兼任糧食生產與 AI 供電基地,是一條過去被低估的路徑。短期可預期:若 EPRI 的高成長情境真的在 2027-2030 年之間實現,AI 資料中心選址會從「靠近光纖節點」優先轉為「靠近可共生農地或既有電廠」優先。
台廠光檢測在先進封裝啃下美商版圖:「一顆都不能壞」的全檢時代
AI 晶片在先進封裝環節的微小瑕疵都可能造成上千萬成本損失。在「一顆都不能壞」的壓力下,半導體產業正引爆前所未有的「百百檢」商機,而台廠光檢測族群已逐步打破美商科磊(KLA)長期主導的格局。
關鍵數字:
- 外資估台積電 CoWoS 產能將從 2023 年的 11.8 萬片,大幅增加到 2028 年的 298.8 萬片
- 全球半導體檢測設備市場未來 5 年年均複合成長率 9.86%
- AI 帶動的半導體檢測設備,5 年複合成長率超過 16%——明顯高於整體需求
由田科技總經理張文杰把規模感講得直接:「現在一顆輝達最基本款 AI 晶片,製造過程都得經過 400 至 500 道程序,高階晶片更是上千道;好不容易前段晶圓良率穩定,若在封裝環節,因為一粒微塵或一絲污染導致報廢,損失的可是數萬美元的成品價值。」
蔡司市場經理林坤興指出檢測典範的結構性轉變:前段晶圓製造多半以整片良率計算,只要整體達到一定標準,少數不良晶粒仍在可接受範圍;但到了封裝階段,每一顆晶片都是最終產品,自然無法容忍任何瑕疵。隨著封裝結構日益複雜,後段對品質的要求轉向「逐顆把關」,全檢需求快速升溫、技術門檻同步拉高。工研院產科國際所研究經理張雯琪補充:自動光學檢測(AOI)正加速取代人眼搭配顯微鏡,成為半導體檢測市場主流。
值得注意的是這條供應鏈的軟體尾巴。檢測設備一旦打入供應鏈,便能隨產能擴張同步放量,並透過後續軟體升級、參數調校與維運持續創造高利潤服務收入。這個結構讓台廠不只賺一次設備銷售,而是吃進整個 CoWoS 擴張曲線的服務分潤。
在 上週報告 的台積電法說段落內已拆過:魏哲家罕見打破擴產慣例、CoWoS 與面板級封裝同步擴。這次光檢測族群崛起的時機點,正是把先進封裝供應鏈的台灣縱深從前段晶圓延伸到後段品檢——若魏哲家「不打算給別人機會」的擴產真的在 2026-2028 年實現,光檢測台廠的訂單能見度會比設備本身的營收曲線更早被外資反映。
AI 在科學儀器:UCSD 顯微術靠光學物理擋幻覺、POSTECH 從頸部肌肉讀無聲說話
兩篇 AI 應用於科學儀器的研究這週同時被報導出來,落在兩個不同光譜的兩端——一端是把 AI 整合進高階研究儀器、解掉幻覺問題;另一端是把 AI 壓進穿戴式裝置、提供失聲患者的替代溝通管道。
加州大學聖地牙哥分校(UCSD)Jacobs 工程學院 Zhaowei Liu 團隊在《Nature Communications》發表「unrolled blind-SIM」(UBSIM)方法,建立在結構光照明顯微鏡(SIM)之上。
- 影像清晰度約為傳統顯微鏡的兩倍
- 活細胞測試中可輸出每秒 50 幀高解析影片
- 重建速度比簡化系統快數百到數千倍,幾乎能在拍攝當下即時觀看
- 整合光學物理原理,降低 AI 模型「想像」出不存在結構的風險
論文第一作者 Zachary Burns 直接點出問題:許多神經網路在面對新資料時可能想像出不存在的結構,這對科學研究是一大問題。UBSIM 的價值不在「更快」這件事,而在「更快但不亂編」。在生命科學影像領域,AI 的速度從來不是瓶頸——可信度才是。光學物理整合是把 AI 在這個場景的可用性從「demo 好看」拉到「能寫進論文」的關鍵。
韓國浦項工科大學(POSTECH)在《Cyborg and Bionic Systems》發表的穿戴式 AI 感測器走另一個方向。核心是「多軸應變映射感測器」,結合迷你攝影機、柔性矽膠層與參考標記點,貼合於頸部追蹤皮膚與肌肉的細微形變;辨識端結合卷積神經網路(CNN)與 Transformer,解析應變圖樣後重建語音、再以使用者聲音特徵合成。
實驗結果如下:
- 訓練樣本 5,186 筆,受試者 6 名 23-32 歲健康成人,詞彙範圍涵蓋 NATO 音標 26 字
- 分類準確率 85.8%
- 90 分貝白噪音環境下表現與一般 60 分貝環境相近
- 模型壓縮後檔案從 12.4 MB 降至 3.6 MB、推論時間從 0.018 秒縮到 0.003 秒,準確率仍維持 82%
未來目標是幫助因聲帶受損或喉部手術而失聲的患者重新「發聲」,並可能應用於工廠、建築工地、會議室或圖書館等不便開口的場景。
兩個研究放在一起讀,可見的訊號是 AI 在科學儀器的兩個落地方向已經分流:高階研究儀器靠物理整合擋幻覺,穿戴式輔具靠模型壓縮做到實時推理。短期可預期:UBSIM 這類「物理整合」的設計模式會在更多科學儀器領域出現,因為這是處理 AI 幻覺的非機器學習解法——而幻覺正是阻擋 AI 進入嚴肅科學工作流的最後一哩路。
- → DeepSeek V4 預覽版的第三方代理任務評測陸續展開,與 Anthropic Claude 在程式碼生成上的差距會更清晰
- → SimpleClosure 與 Sunset 等倒閉新創資料變現平台的監管風險升溫,影響「員工 Slack 對話可否成為訓練資料」的法律邊界
- → 美國 11 月以前的選舉討論內,AI 角色操控的早期跡象會否被獨立研究機構量化追蹤
今天的新聞密度集中在 AI 規模化的下一個物理瓶頸——算力、訓練資料、能源、製造良率與輸出可信度同時被放在桌面上。