一周AI大事:黃仁勛親自給馬斯克送貨,OpenAI被曝將對成人內容“開綠燈”快訊
Anthropic公司為其AI模型Claude推出了名為,谷歌這是鐵了心要當AI界的,二、AI技術與產品發布。
一、重磅工具:Claude獲“技能”加持,“瑞士軍刀”已上膛
新聞:Anthropic公司為其AI模型Claude推出了名為“技能”(Skills)的新功能。這是一種可按需加載的自定義指令與工作流打包機制。Claude可以在相關場景中動態調用“技能”,無需冗長的上下文即可處理專業化任務。“技能”新功能支持將代碼規范、報告格式或分析等團隊特定工作流程進行編碼并存儲,并通過設置界面和SDK統一管理。“技能”具備可組合性與可移植性,開發者可將多個“技能”整合成定制化工作流,通過Claude應用、Claude Code及其API無縫調用。
Anthropic同步發布了實施指南與資源庫,其中包含創建自定義“技能”的說明,并在相關資源庫中提供可處理Excel和PPT等任務的預置“技能”。這種新功能與MCP(組件化模塊協議)相輔相成,有效擴展了AI模型的智能體能力。由于“技能”的資源庫是開源的,有望像MCP一樣獲得廣泛采用。
“技能”功能現已作為功能預覽版向Pro、Max、Team及Enterprise等訂閱計劃的用戶開放。
銳評:等于給Claude配了把可隨時換技能的瑞士軍刀。
二、AI技術與產品發布:從會拍片的Sora到會打工的Haiku,軟硬件多點爆發
1. 新聞:Anthropic正式發布Claude Haiku 4.5。這是一款面向大規模智能體系統與復雜思維鏈的高速低成本模型。在編碼與智能體任務基準測試中,Haiku 4.5表現突出,其在SWE-bench的通過率為73.3%,Terminal-bench得分41%,綜合表現直逼Claude Sonnet 4。其卓越的性能、高速率與合理的成本定位,使其成為智能體AI應用的理想選擇。Anthropic強調:“Sonnet 4.5擅長將復雜問題解構為多階段計劃,并能協調多個Haiku 4.5實例并行執行子任務。”
銳評:Haiku 4.5貌似“物美價廉”的實習生,專門給“項目經理”Sonnet 4.5打下手。
2. 新聞:谷歌發布Veo 3.1及Veo 3.1 Fast,新增原生音頻增強、精準敘事控制、參考圖像引導及長視頻場景擴展功能。Veo 3.1引入的首尾幀轉場與“素材融合”特性支持將多張參考圖像合成動態視頻。業界評測認為,Veo 3.1在音頻質量、圖像轉視頻的契合度以及畫面一致性方面均有所提升。目前用戶可通過Gemini API體驗付費預覽版,該模型兼容AI Studio、Vertex AI、Gemini應用及Flow平臺。
銳評:谷歌這是鐵了心要當AI界的“全能導演”。
3. 新聞:OpenAI發布Sora 2更新,默認視頻時長延長至15秒,最長可生成25秒視頻。Pro訂閱用戶新增“故事板”功能,支持逐秒規劃視頻,實現更精細的生成過程控制。不過,Sora 2近期因生成涉及公眾人物的視頻引發版權與倫理爭議。OpenAI強調公眾人物及其家屬應有權控制AI生成內容中的自身形象。
銳評:AI造戲越來越溜,但千萬不能隨便把名人當角色。
4. 新聞:百度MuseStreamer現可生成20秒以上視頻。該模型支持實時交互式長視頻生成,用戶可動態改寫劇情或延長過渡。
銳評:時間加長還能隨時改戲,國內視頻AI也是卷起來了。
5. 新聞:World Labs發布實時生成型世界模型RTFM,可交互式渲染3D一致性場景。官方技術博客闡明該模型聚焦效率、可擴展性與時間一致性三大目標,并演示了如何用單張H100顯卡部署密集型世界模型。公開演示版支持用戶實時探索生成的世界。雖然RTFM現階段仍屬概念驗證,但已趨近實用化。
銳評:RTFM是想用一塊H100“裝下全世界”。
6. 新聞:OpenAI優化ChatGPT記憶管理機制,通過自動內存管理解決"存儲已滿"問題,旨在提升系統可靠性并降低用戶側的存儲限制。
銳評:系統不再老是因為記憶滿格而卡殼,用戶體驗要輕快不少。
7. 新聞:微軟以“讓每臺Win11電腦變身AI PC”為目標,推出操作系統級Copilot語音智能體。這項集成至系統底層的安全沙箱技術,支持后臺語音驅動的任務執行,專為多任務并行場景下的智能工作流設計。該公司表示“Copilot語音與視覺功能的突破性價值在于交互的便捷性。用戶通過喚醒詞‘Hey Copilot’即可用自然語言下達指令,視覺模塊則可在獲得授權后實時分析屏幕內容,提供應用教學、項目建議或操作指導。”
銳評:微軟是鐵了心推Copilot語音助手。
8. 新聞:Cognition推出SWE-grep和SWE-grep-mini兩款經強化學習訓練的多輪上下文檢索智能體,專精AI代碼搜索。這些模型能快速呈現關聯代碼段,為Windsurf Fast Context子智能體提供核心動力,并通過高并行架構顯著降低搜索延遲。
銳評:這次是給AI配了個“代碼搜索引擎”,程序員的“工具箱”快被“一鍋端”了。
9. 新聞:Facebook推出AI自動選片功能,幫助用戶從相冊中挑選最佳照片或視頻以生成動態或帖子,有效簡化了內容創作流程。
銳評:專治“選擇困難癥”,以后發圈終于不用糾結。
10. 新聞:針對AI內容泛濫的輿論反饋,Pinterest新增內容管控工具,允許用戶在美容、藝術等特定板塊限制生成式AI內容的顯示,并強化了內容標簽功能。這種用戶主導的AI接觸管理機制,值得其他社交媒體平臺學習借鑒。
銳評:主打眼不見為凈。
11. 新聞:谷歌為Gemini API引入“谷歌地圖數據關聯”(Grounding with Google Maps)功能,使模型可依托最新地理數據生成更準確的本地化回答。這一功能可與搜索引擎關聯組合使用,進一步保障信息真實性,相關演示案例已在AI Studio開放測試。
銳評:Gemini接上“谷歌地圖”,精準回答“附近有啥好吃的”。
12. 新聞:谷歌升級AI Studio,優化了開發者與用戶體驗。新版本推出集成Gemini、生成式媒體模型、語音合成與實時模型的統一工作臺Playground,簡化了模型切換流程并優化了聊天界面的一致性。
銳評:開發者少了來回切換的煩惱。
13. 新聞:針對通過API構建Claude智能體的開發者,AWS已經在Amazon Bedrock上集成了最新的Claude模型Opus 4.1、Sonnet 4.5、Haiku 4.5。其中Haiku 4.5的API定價為每百萬輸入/輸出token 1/5美元。
銳評:云巨頭的AI資源庫主打一個“我全都要”。
14. 新聞:英偉達開始出貨DGX Spark。這款桌面級AI超級工作站專為本地推理與原型開發設計,上市即售罄。LMSYS的獨立評測列出了其規格與性能亮點:GPU(GB10)峰值性能達1 PFLOP(FP4張量),整體算力介于RTX 5070與5070 Ti之間;其革命性突破在于采用了128GB的統一內存架構,實現CPU與GPU內存池的無縫共享。這種統一架構使DGX Spark能直接加載運行大模型,徹底規避了系統內存與顯存間的數據傳輸開銷,讓DGX Spark可運行的AI模型規模遠超傳統臺式機。據悉,英偉達首席執行官黃仁勛在星艦第11次試飛前后,親自向馬斯克交付了DGX Spark。
銳評:算得上AI PC中的愛馬仕。
15. 新聞:OpenAI CEO薩姆·奧特曼(Sam Altman)稱將于今年12月份起放寬ChatGPT內容限制,向通過認證的成人用戶開放成人向內容。此舉旨在打造類似GPT-4o風格的可定制個性化體系,在保障安全的前提下實現不同年齡段用戶的差異化服務。
銳評:兜兜轉轉還是沒繞開人類本能。
三、AI研究資訊:從“解碼癌癥”到“掌控核聚變”,谷歌“煉丹”不止
1. 新聞:谷歌推出開源癌癥變異分類模型DeepSomatic。它能精準區分遺傳變異與體細胞變異,在復雜樣本測試中表現超越現有方案。
銳評:AI在醫學界又當起了顯微鏡和第二只眼。
2. 新聞:谷歌與耶魯大學合作發布基于Gemma架構的癌癥研究模型Cell2Sentence-Scale 27B。該模型基于超10億token的轉錄組與生物數據訓練,能將RNA序列信息表示為文本式“細胞句子”。研究人員運用C2S-Scale進行單細胞分析,成功識別出經濕實驗驗證的潛在癌癥治療路徑。該研究的論文預印本與模型已經同步公開。
銳評:科研人員的解碼器又升級了。
3. 新聞:谷歌DeepMind與Commonwealth Fusion Systems達成合作,通過深度學習實現等離子體控制以加速聚變能源研發。這一AI系統結合深度強化學習與TORAX模擬器,優化了等離子體控制與托卡馬克裝置的性能,推動清潔且無限的聚變能源邁向現實。
銳評:AI不只能看天象,還想造星。
四、AI商業與政策:大廠芯片狂飆,高盛高喊“繼續投”
1. 新聞:OpenAI宣布與博通合作開發定制AI芯片。OpenAI負責加速器與系統架構設計,博通將于2026年下半年啟動量產部署。該項目目標是實現10GW算力規模,為下一代前沿模型與大規模推理提供基礎支撐。此次合作標志著OpenAI向開放基礎設施戰略轉型,通過博通以太網技術多元化其計算架構,也凸顯出AI專用芯片在推理階段的重要性。
銳評:算力界又要有新玩家和新規則。
2. 新聞:英偉達透露Meta與Oracle將在AI數據中心網絡標準化中采用Spectrum-X以太網架構,訓練效率與擴展性是選擇這一開放加速方案的主因。
銳評:老黃不僅賣“算力”,還要插手“網線”生意。
3. 新聞:蘋果發布M5芯片,宣稱峰值AI性能較M4提升4倍,專為下一代設備端AI負載打造。M5將率先用在新款MacBook Pro、iPad及Vision Pro上,預計數周內上市。
銳評:如果Siri還是那個智障,這4倍性能大概也只能用來P圖。
4. 新聞:英特爾公布一款搭載160GB內存、具備高能效的數據中心GPU,并將其加入該公司的AI加速器組合,旨在推動英特爾以開放系統與軟件架構為核心的新AI戰略。這款GPU代號為“Crescent Island(新月島)”,根據英特爾介紹,它專為運行推理工作負載的風冷企業級服務器而設計,強調“功耗與成本優化”。Crescent Island采用Xe3P微架構,配備160GB LPDDR5X內存,并支持多種數據類型,為大語言模型提供充足運行空間。
銳評:英特爾想用“性價比推理”從英偉達“虎口奪食”。
5. 新聞:Spotify與主流唱片公司達成協議,共同開發“負責任”的AI產品體系,確保持續尊重版權、保障藝術家收益,并為音樂人保留自主選擇是否授權AI工具使用自己作品的權利。該公司還同步設立AI研究實驗室,集中精力研發以藝術家權益為核心的技術方案。
銳評:Spotify先下手為強,拉著唱片公司“拜山頭”。
6. 新聞:谷歌母公司Alphabet計劃在印度南部投資超100億美元,兩年內于安得拉邦港口城市維沙卡帕特南建設一座1吉瓦級數據中心。這標志著谷歌在全球擴張戰略中押注印度市場。
銳評:“三哥”的電網扛得住嗎?
7. 新聞:中國工程院院刊《Engineering》評選的“2025全球十大工程成就”在“2025年世界工程組織聯合會全體大會暨全球工程大會”上正式發布。其中英偉達Blackwell GPU架構和DeepSeek開源大語言模型上榜。
銳評:大廠技術上榜,當之無愧。
8. 新聞:蘋果公司正進行重大戰略調整:暫停開發更輕便、低價的Vision頭顯(內部代號或為“Vision Air”),將資源集中于智能眼鏡的研發。據長期跟蹤蘋果動態的資深分析師馬克·古爾曼(Mark Gurman)透露,在親身體驗了競爭對手Meta新推出的內置顯示屏智能眼鏡后,他確信蘋果的這一轉向是明智之舉。
銳評:庫克明白過來,沒人想頂著個“滑雪鏡”出門。
9. 新聞:近期AI領域的巨額資本開支引發了市場對其可持續性的擔憂。高盛最新研報明確揭示,當前AI投資規模遠未過熱,這一投資水平具備可持續性,這意味著AI基礎設施建設的宏觀敘事依然穩健。該研究表示,AI相關投資占美國GDP的比例目前遠低于歷史上其他技術周期。
銳評:哪有泡沫?高盛說不存在的。
10. 新聞:中國互聯網絡信息中心(CNNIC)正式發布《生成式人工智能應用發展報告(2025)》。《報告》顯示,截至2025年6月,我國生成式人工智能用戶規模達5.15億人,較2024年12月增長2.66億人,用戶規模半年翻番;普及率為36.5%。主要應用場景包括回答問題、日常辦公、休閑娛樂、創作內容等。其中,利用生成式人工智能產品回答問題的用戶最為廣泛,達80.9%。
銳評:我國人工智能正在從“可用”走向“好用”、從“試用”走向“常用”。
11. 新聞:加州頒布AI在線安全法規,強制要求聊天機器人在與未成年人互動時明確披露AI身份。加州州長紐森簽署了SB243法案,該法案規定,在用戶可能誤以為與人類對話的場景中,AI必須主動說明身份。此外,加州的《AI透明度法案》也將生效,主要規定了企業層面的合規義務。
銳評:加州要求“AI陪聊”也得“持證上崗”。
五、AI觀點與文章:微軟定義“人機協作”,你的同事可能不是人
新聞:微軟AI業務首席營銷官賈里德·斯帕塔羅(Jared Spataro)在《AI正在重塑商業》一文中,闡釋了領先企業正邁向“人主導、AI驅動”的新組織形態。
他總結了三大趨勢:
獲取專業知識的成本驟降:“企業可快速部署基于產品、市場或專有知識的智能體,直接嵌入組織數據、系統與安全防護體系。”
人機協作帶來的工作重構:“當數字員工融入各業務環節,組織從‘為人設計信息流程’轉向‘為智能體優化執行效率’。”
知識復利效應:“智能體以人類系統無法企及的速度創造新型知識循環。”
斯帕塔羅早前發表的文章《CEO前沿企業建設指南》進一步闡釋了AI為先的含義。這些論述共同勾勒出企業級AI應用引發的根本性組織變革圖景,其預見性值得肯定。
銳評:說白了就是你的同事可能不是人,但老板一定還是人。(辰辰)
1.TMT觀察網遵循行業規范,任何轉載的稿件都會明確標注作者和來源;
2.TMT觀察網的原創文章,請轉載時務必注明文章作者和"來源:TMT觀察網",不尊重原創的行為TMT觀察網或將追究責任;
3.作者投稿可能會經TMT觀察網編輯修改或補充。
