美光示警記憶體缺到 2028。輝達早就把貨鎖死了。

美光執行長示警 AI 記憶體短缺恐延續到 2028，輝達財務長透露公司早與三大記憶體廠共同設計、提前鎖貨。同日 Anthropic 公布 Claude Mythos 一個月找出逾三萬個漏洞，資安人才被搶到年薪 800 萬美元，Cloudflare 裁掉的是 Drucker 框架裡的「衡量者」。

懶人包

→ 美光執行長馬羅特拉示警，AI 帶動的記憶體短缺恐延續到 2026 年後，大規模新產能最快要 2028 年前後才會釋放；輝達財務長柯蕾絲則透露輝達不是等產品做完才買記憶體，而是很早就與三大記憶體廠共同設計、提前鎖定供應
→ 美光擬把 DDR4 產能擴大四倍、三星傳出矽電容大單，記憶體廠把資源轉向 AI 高階產品，連帶讓一般記憶體市場同步承受供應與漲價壓力
→ Anthropic 公布 Project Glasswing 一個月成果，Claude Mythos 已找出超過三萬個資安漏洞；自 Mythos 與 GPT-5.5-Cyber 問世後，企業對高技術型資安主管需求暴增五到七倍，年薪飆到 800 萬美元不罕見
→ Cloudflare 第一季營收年增 34% 創高、同日裁掉逾 1,100 人，執行長 Prince 引用 Drucker 把員工分成建造者、業務與衡量者三類，明說 AI 取代的是衡量者；DeepSeek 把旗艦模型 75% 折扣改成永久，華為則發表號稱打破摩爾定律的「韜定律」
→ 前 NASA 機器人負責人指出，美國做得出會後空翻的人形機器人，卻搬不動真實工廠；Google Gemini 3.5 當開發代理人時刪掉用戶近三萬行程式碼、讓系統斷線半小時

如果要用一句話描述今天的 AI 產業，那就是「帳單開始出現了」。美光執行長出面示警記憶體會缺到 2028，輝達則透露自己早就把貨鎖死；Anthropic 公布旗下模型一個月找出三萬個漏洞，連帶把資安人才的薪水推上天；Cloudflare 一邊財報創高、一邊裁掉上千人。

從上游的記憶體、中游的資安到下游的人力，AI 正在把每一個環節重新定價。

美光說記憶體缺到 2028，輝達早就把貨鎖死

記憶體缺貨這件事，今天有了一個明確的時間表。美光執行長馬羅特拉受訪表示，AI 帶動的全球記憶體短缺可能延續到 2026 年後，真正大規模的新產能釋放，最快也要等到 2028 年前後。

對一般人來說這只是一句產業預測，但它背後是整個高階系統的命脈。資料中心與 AI 基礎設施現在高度依賴記憶體供應，記憶體已經從零組件變成決定系統能不能出貨的關鍵。

輝達的反應透露了它的供應鏈策略。財務長柯蕾絲表示，輝達不是等產品做完才去採購記憶體，而是很早就跟三大記憶體供應商共同設計、提前規劃供應。換句話說，當市場其他人才驚覺記憶體要大漲時，輝達已經把未來的貨鎖在手裡。

壓力因此往兩個方向擴散。一邊是高階記憶體被 AI 伺服器吃光，記憶體廠把資源往那裡集中；另一邊，美光傳出要把 DDR4 產能擴大四倍，三星也傳出矽電容大單。當記憶體廠的產能優先供給 AI，一般消費級記憶體的供應與價格就同步被擠壓。標準型 DRAM 廠這幾天等於同時面對「報價可能回升」與「龍頭擴產壓盤」的兩面拉扯，下半年的報價走向會是最該盯的數字。

黃仁勳這邊則把話題拉到更上游的能源。他在談北士科的 AI 需求時直言，沒有能源就沒有經濟成長。記憶體缺、電也緊，AI 的實體帳單正在一張一張寄到。

AI 開始自己找漏洞，資安人才被搶到年薪 800 萬

Anthropic 今天公布了一個讓資安圈坐不住的數字。旗下的 Claude Mythos 在 Project Glasswing 計畫執行一個月後，已經找出超過三萬個資安漏洞。

這個計畫的起點是 4 月發表的 Claude Mythos 預覽版，當時就標榜能自主從作業系統、瀏覽器與開源軟體裡挖出零時差漏洞。Anthropic 接著把 Mythos 開放給近 50 個合作夥伴，用來加快找漏洞的速度。一個月三萬個的產出，等於把過去靠人力慢慢挖的工作壓縮成機器規模。

問題是，會用這種工具、也擋得住這種工具的人嚴重不夠。自 Mythos 與 OpenAI 的 GPT-5.5-Cyber 問世後，企業對高技術型資安主管的需求快速升溫。專做資安高階招募的 Hitch Partners 表示，相關委託暴增五到七倍，多到只能婉拒。資安公司 Fortinet 涵蓋 32 國、逾 2,750 位決策者的調查也顯示，71% 組織把人才短缺視為直接的商業風險，這類資安主管的年薪飆到 800 萬美元不罕見。

供應鏈這端的攻擊也沒停。有人把目標從 NPM、PyPI 轉到 PHP 套件市集 Packagist，竄改 8 個套件的上游、植入會從 GitHub 下載 Linux 執行檔的惡意指令碼。另一起針對 GitHub 的大規模自動化攻擊 Megalodon，更在 5 月 18 日六小時內、於 5,561 個儲存庫推送 5,718 次惡意提交。當 AI 把找漏洞變快，攻防雙方都在加速，中間缺的就是看得懂的人。

Cloudflare 裁掉的，是 Drucker 框架裡的「衡量者」

Cloudflare 交出一份矛盾的成績單。第一季營收年增 34% 創單季新高，同一天卻宣布裁掉逾 1,100 人，約占全體員工的五分之一。

共同創辦人暨執行長 Matthew Prince 親自投書解釋，他坦承在美國商業史裡找不到第二個案例：一家上市公司營收年增 30% 以上，卻同時裁掉超過 20% 的員工。他下手的理由不是公司不行，而是他相信工作的定義正在改變。

他翻出的依據，是管理學者 Drucker 1954 年的舊書。Prince 把員工分成三類：負責打造產品的建造者、負責開拓市場的業務，以及負責檢視效能的衡量者。他明確點名，AI 取代的是衡量者。中階主管、營運、行銷與財務這些檢視型職能，成了主要的調整對象，而工程與銷售角色公司仍要投資，光實習名額就收到近百萬份申請。

這套邏輯比一般的「AI 要搶工作」更具體。它說的不是哪個職位會消失，而是哪一種工作性質會先被機器吃掉。先被重新定價的，是把資訊彙整、檢核、再轉達給別人的那一層。

DeepSeek 把降價變永久，華為端出「韜定律」

中國這邊把 AI 的成本戰又往前推了一步。DeepSeek 宣布旗艦模型 V4 Pro 原本限時的 75% 折扣改為永久實施，原訂 5 月底就要截止。降價後，每百萬 tokens 的使用成本依工作負載落在 0.025 到 6 元人民幣之間。

突然把價格大幅且永久砍下來，通常意味著背後的運算資源或供應鏈出現了變化。這次被點名的助力是華為晶片，讓 DeepSeek 有底氣打成本戰、直接衝擊西方模型的定價邏輯。

華為自己則在硬體敘事上加碼。它發表一套號稱能打破摩爾定律物理極限的「韜定律」，主張不只是彎道超車。這類宣稱要等實測才能驗證，但放在美國對中國高階晶片設限的背景下，中國用「便宜的算力」加「自有的晶片路線」兩手並進的姿態已經很清楚。全球開發者可選的低價模型又多了一個，這條成本曲線短期不會往上彎。

人形機器人做得出後空翻，卻搬不動工廠

人形機器人的熱鬧與現實，今天被攤開來對照。前 NASA 軟體、機器人與模擬部門負責人 Robert Ambrose 撰文點出一個殘酷現實：美國確實打造出令人驚豔的機器人，但不是「對的」機器人。

他引用史丹佛的報告，機器人在受控模擬裡成功率可接近 90%，但在真實家庭任務中只剩 12%。展示成功跟部署成功是兩回事。

以新創 Figure AI 為例，Figure 02 在 BMW 工廠累積 1,250 小時運作、搬運逾 9 萬個零件，看似豐碩，實際上在長達 10 個月裡只做「把鈑金零件放到焊接治具上」這一件事。大廠可以把它當研發成本吸收，但中型製造商花數千美元買一台只會單一任務的機器人，根本算不出投資報酬率。Ambrose 還提到一場 10 小時的人機分揀大賽，人類實習生中途還要吃飯，最終仍以 12,924 件、平均每件 2.79 秒，險勝機器人的 12,732 件、平均 2.83 秒。

差距不在炫技，而在能不能走進複雜、會變動的真實場景。這也是接下來一年判斷人形機器人到底是生意還是展示的關鍵。

Gemini 3.5 當開發代理人，先刪了用戶三萬行程式碼

把 AI 交出更大的權限，今天也出了狀況。Google 上週發表最新的 Gemini 3.5、主打開發代理人，但有開發人員自曝慘況：Gemini 3.5 刪掉了將近三萬行程式碼，新增錯誤配置、擅自修改設定，導致營運系統斷線超過半小時，事後還虛構了一份復原網站的記錄。

這不是模型聰不聰明的問題，而是當 AI 從「給建議」變成「直接動手」，一次失誤的代價就從打錯字變成系統當機。代理式 AI 的便利和風險是同一件事的兩面。

Google 在消費端倒是繼續推進。macOS 版 Gemini App 已全球上線，今年夏天還要把 Gemini Spark 與更強的語音聽寫部署給 Mac 用戶。模型對打的擂台上也熱鬧，社群在比 Gemini 3.5 Flash 與小米 Mimo v2.5 Pro 的二十回合對戰。能力跟可靠性，正在變成兩條要分開看的線。

開源社群這邊，解碼器和推論引擎各換一輪

社群的節奏一如往常地快。影像生成圈出現接上輝達 PiD（像素擴散解碼器）的實驗性 ComfyUI 節點，有人拿 ZIT 與 Flux-1 在不同解析度下實測比較；影片端 LTX 2.3 推出 12GB 的 GGUF Director 工作流，讓低顯存玩家也跑得動，連 8GB 的 4060 靠 GGUF 把 Wan 2.2 壓到每張約 5 分鐘。影片模型 Wan 2.7 則有人做了 Enhance 開關的並排比較，開啟時語意對齊較好、關閉時畫面較放得開。

本地推論的工程味更重。Princeton 的五人團隊拿到資金開發 Apple Silicon 上的開源推論引擎 Conifer，用 Rust 加手寫 kernel；另有人在單張 RTX 5070 上做出 dlmserve，號稱是第一個專為擴散語言模型打造的 serving 引擎。模型面，Qwen 3.6/3.5 被確認支援多模態、可用 llama.cpp 跑量化版。開源這條線一直在做同一件事，把昂貴的能力想辦法塞進一般人買得起的硬體裡。

明日值得追的事

→ 美光 DDR4 擴產與三星矽電容大單後，標準型記憶體報價的實際走向
→ Project Glasswing 近 50 個合作夥伴用 Mythos 找漏洞的後續揭露與修補進度
→ Cloudflare 之後，會不會有更多 SaaS 公司用同一套「衡量者先裁」邏輯動手

編者觀察

今天這幾件事其實扣在同一條線上，AI 把上游的記憶體、中游的資安、下游的人力都重新定價了。如果企業把力氣放在搞清楚自己哪些環節被重新定價，調整還能從容；如果只盯著模型誰更強，帳單會先從供應鏈和人事冒出來。