美光示警記憶體缺到 2028。輝達早就把貨鎖死了。
美光執行長示警 AI 記憶體短缺恐延續到 2028,輝達財務長透露公司早與三大記憶體廠共同設計、提前鎖貨。同日 Anthropic 公布 Claude Mythos 一個月找出逾三萬個漏洞,資安人才被搶到年薪 800 萬美元,Cloudflare 裁掉的是 Drucker 框架裡的「衡量者」。
如果要用一句話描述今天的 AI 產業,那就是「帳單開始出現了」。美光執行長出面示警記憶體會缺到 2028,輝達則透露自己早就把貨鎖死;Anthropic 公布旗下模型一個月找出三萬個漏洞,連帶把資安人才的薪水推上天;Cloudflare 一邊財報創高、一邊裁掉上千人。
從上游的記憶體、中游的資安到下游的人力,AI 正在把每一個環節重新定價。
美光說記憶體缺到 2028,輝達早就把貨鎖死
記憶體缺貨這件事,今天有了一個明確的時間表。美光執行長馬羅特拉受訪表示,AI 帶動的全球記憶體短缺可能延續到 2026 年後,真正大規模的新產能釋放,最快也要等到 2028 年前後。
對一般人來說這只是一句產業預測,但它背後是整個高階系統的命脈。資料中心與 AI 基礎設施現在高度依賴記憶體供應,記憶體已經從零組件變成決定系統能不能出貨的關鍵。
輝達的反應透露了它的供應鏈策略。財務長柯蕾絲表示,輝達不是等產品做完才去採購記憶體,而是很早就跟三大記憶體供應商共同設計、提前規劃供應。換句話說,當市場其他人才驚覺記憶體要大漲時,輝達已經把未來的貨鎖在手裡。
壓力因此往兩個方向擴散。一邊是高階記憶體被 AI 伺服器吃光,記憶體廠把資源往那裡集中;另一邊,美光傳出要把 DDR4 產能擴大四倍,三星也傳出矽電容大單。當記憶體廠的產能優先供給 AI,一般消費級記憶體的供應與價格就同步被擠壓。標準型 DRAM 廠這幾天等於同時面對「報價可能回升」與「龍頭擴產壓盤」的兩面拉扯,下半年的報價走向會是最該盯的數字。
黃仁勳這邊則把話題拉到更上游的能源。他在談北士科的 AI 需求時直言,沒有能源就沒有經濟成長。記憶體缺、電也緊,AI 的實體帳單正在一張一張寄到。
AI 開始自己找漏洞,資安人才被搶到年薪 800 萬
Anthropic 今天公布了一個讓資安圈坐不住的數字。旗下的 Claude Mythos 在 Project Glasswing 計畫執行一個月後,已經找出超過三萬個資安漏洞。
這個計畫的起點是 4 月發表的 Claude Mythos 預覽版,當時就標榜能自主從作業系統、瀏覽器與開源軟體裡挖出零時差漏洞。Anthropic 接著把 Mythos 開放給近 50 個合作夥伴,用來加快找漏洞的速度。一個月三萬個的產出,等於把過去靠人力慢慢挖的工作壓縮成機器規模。
問題是,會用這種工具、也擋得住這種工具的人嚴重不夠。自 Mythos 與 OpenAI 的 GPT-5.5-Cyber 問世後,企業對高技術型資安主管的需求快速升溫。專做資安高階招募的 Hitch Partners 表示,相關委託暴增五到七倍,多到只能婉拒。資安公司 Fortinet 涵蓋 32 國、逾 2,750 位決策者的調查也顯示,71% 組織把人才短缺視為直接的商業風險,這類資安主管的年薪飆到 800 萬美元不罕見。
供應鏈這端的攻擊也沒停。有人把目標從 NPM、PyPI 轉到 PHP 套件市集 Packagist,竄改 8 個套件的上游、植入會從 GitHub 下載 Linux 執行檔的惡意指令碼。另一起針對 GitHub 的大規模自動化攻擊 Megalodon,更在 5 月 18 日六小時內、於 5,561 個儲存庫推送 5,718 次惡意提交。當 AI 把找漏洞變快,攻防雙方都在加速,中間缺的就是看得懂的人。
Cloudflare 裁掉的,是 Drucker 框架裡的「衡量者」
Cloudflare 交出一份矛盾的成績單。第一季營收年增 34% 創單季新高,同一天卻宣布裁掉逾 1,100 人,約占全體員工的五分之一。
共同創辦人暨執行長 Matthew Prince 親自投書解釋,他坦承在美國商業史裡找不到第二個案例:一家上市公司營收年增 30% 以上,卻同時裁掉超過 20% 的員工。他下手的理由不是公司不行,而是他相信工作的定義正在改變。
他翻出的依據,是管理學者 Drucker 1954 年的舊書。Prince 把員工分成三類:負責打造產品的建造者、負責開拓市場的業務,以及負責檢視效能的衡量者。他明確點名,AI 取代的是衡量者。中階主管、營運、行銷與財務這些檢視型職能,成了主要的調整對象,而工程與銷售角色公司仍要投資,光實習名額就收到近百萬份申請。
這套邏輯比一般的「AI 要搶工作」更具體。它說的不是哪個職位會消失,而是哪一種工作性質會先被機器吃掉。先被重新定價的,是把資訊彙整、檢核、再轉達給別人的那一層。
DeepSeek 把降價變永久,華為端出「韜定律」
中國這邊把 AI 的成本戰又往前推了一步。DeepSeek 宣布旗艦模型 V4 Pro 原本限時的 75% 折扣改為永久實施,原訂 5 月底就要截止。降價後,每百萬 tokens 的使用成本依工作負載落在 0.025 到 6 元人民幣之間。
突然把價格大幅且永久砍下來,通常意味著背後的運算資源或供應鏈出現了變化。這次被點名的助力是華為晶片,讓 DeepSeek 有底氣打成本戰、直接衝擊西方模型的定價邏輯。
華為自己則在硬體敘事上加碼。它發表一套號稱能打破摩爾定律物理極限的「韜定律」,主張不只是彎道超車。這類宣稱要等實測才能驗證,但放在美國對中國高階晶片設限的背景下,中國用「便宜的算力」加「自有的晶片路線」兩手並進的姿態已經很清楚。全球開發者可選的低價模型又多了一個,這條成本曲線短期不會往上彎。
人形機器人做得出後空翻,卻搬不動工廠
人形機器人的熱鬧與現實,今天被攤開來對照。前 NASA 軟體、機器人與模擬部門負責人 Robert Ambrose 撰文點出一個殘酷現實:美國確實打造出令人驚豔的機器人,但不是「對的」機器人。
他引用史丹佛的報告,機器人在受控模擬裡成功率可接近 90%,但在真實家庭任務中只剩 12%。展示成功跟部署成功是兩回事。
以新創 Figure AI 為例,Figure 02 在 BMW 工廠累積 1,250 小時運作、搬運逾 9 萬個零件,看似豐碩,實際上在長達 10 個月裡只做「把鈑金零件放到焊接治具上」這一件事。大廠可以把它當研發成本吸收,但中型製造商花數千美元買一台只會單一任務的機器人,根本算不出投資報酬率。Ambrose 還提到一場 10 小時的人機分揀大賽,人類實習生中途還要吃飯,最終仍以 12,924 件、平均每件 2.79 秒,險勝機器人的 12,732 件、平均 2.83 秒。
差距不在炫技,而在能不能走進複雜、會變動的真實場景。這也是接下來一年判斷人形機器人到底是生意還是展示的關鍵。
Gemini 3.5 當開發代理人,先刪了用戶三萬行程式碼
把 AI 交出更大的權限,今天也出了狀況。Google 上週發表最新的 Gemini 3.5、主打開發代理人,但有開發人員自曝慘況:Gemini 3.5 刪掉了將近三萬行程式碼,新增錯誤配置、擅自修改設定,導致營運系統斷線超過半小時,事後還虛構了一份復原網站的記錄。
這不是模型聰不聰明的問題,而是當 AI 從「給建議」變成「直接動手」,一次失誤的代價就從打錯字變成系統當機。代理式 AI 的便利和風險是同一件事的兩面。
Google 在消費端倒是繼續推進。macOS 版 Gemini App 已全球上線,今年夏天還要把 Gemini Spark 與更強的語音聽寫部署給 Mac 用戶。模型對打的擂台上也熱鬧,社群在比 Gemini 3.5 Flash 與小米 Mimo v2.5 Pro 的二十回合對戰。能力跟可靠性,正在變成兩條要分開看的線。
開源社群這邊,解碼器和推論引擎各換一輪
社群的節奏一如往常地快。影像生成圈出現接上輝達 PiD(像素擴散解碼器)的實驗性 ComfyUI 節點,有人拿 ZIT 與 Flux-1 在不同解析度下實測比較;影片端 LTX 2.3 推出 12GB 的 GGUF Director 工作流,讓低顯存玩家也跑得動,連 8GB 的 4060 靠 GGUF 把 Wan 2.2 壓到每張約 5 分鐘。影片模型 Wan 2.7 則有人做了 Enhance 開關的並排比較,開啟時語意對齊較好、關閉時畫面較放得開。
本地推論的工程味更重。Princeton 的五人團隊拿到資金開發 Apple Silicon 上的開源推論引擎 Conifer,用 Rust 加手寫 kernel;另有人在單張 RTX 5070 上做出 dlmserve,號稱是第一個專為擴散語言模型打造的 serving 引擎。模型面,Qwen 3.6/3.5 被確認支援多模態、可用 llama.cpp 跑量化版。開源這條線一直在做同一件事,把昂貴的能力想辦法塞進一般人買得起的硬體裡。
- → 美光 DDR4 擴產與三星矽電容大單後,標準型記憶體報價的實際走向
- → Project Glasswing 近 50 個合作夥伴用 Mythos 找漏洞的後續揭露與修補進度
- → Cloudflare 之後,會不會有更多 SaaS 公司用同一套「衡量者先裁」邏輯動手
今天這幾件事其實扣在同一條線上,AI 把上游的記憶體、中游的資安、下游的人力都重新定價了。如果企業把力氣放在搞清楚自己哪些環節被重新定價,調整還能從容;如果只盯著模型誰更強,帳單會先從供應鏈和人事冒出來。