进击的DeepSeek,一夜之间登岸Microsoft Azure、Curso
作者:[db:作者]日期:2025/02/01 浏览:
起源:呆板之心
春节假期未过半,DeepSeek 掀起的巨浪还在影响着全部跟人工智能有关的范畴。
明天一觉悟来, DeepSeek R1 模子曾经正式参加 Azure AI Foundry 跟 GitHub 模子目次,开辟职员能够疾速地停止试验、迭代,并将这款热点模子集成到他们的任务流程中。
这让各人感叹:不永久的竞争敌手,也不永久的配合搭档,每家公司都应当疾速拥抱变更。
究竟昨天的微软还在说:DeepSeek 合法盗取了 OpenAI 的常识产权。现在天的微软:DeepSeek 现已在咱们的 AI 平台上推出,欢送各人实验。
微软公司人工智能平台副总裁 Asha Sharma 表现,DeepSeek R1 经由了严厉的红队跟保险评价,包含模子行动的主动评价跟普遍的保险检察,以下降潜伏危险。
与此同时,DeepSeek 的 R1 跟 V3 均已登岸 AI 代码编纂器 Cursor。
亚马逊云科技也发布:企业跟开辟者能够在 Amazon Bedrock 跟 Amazon SageMaker AI 中安排 DeepSeek-R1 模子,别的还能够应用 AWS Trainium 跟 AWS Inferentia 经由过程 Amazon Elastic Compute Cloud (Amazon EC2) 或 Amazon SageMaker AI 以经济高效的方法安排 DeepSeek-R1-Distill 模子。
亚马逊首席履行官 Andy Jassy。图源:https://x.com/ajassy/status/1885120938813120549
间隔 DeepSeek R1 引爆 AI 圈只不外十天,这些科技公司的反映速率再次证实了 DeepSeek 给国内外带来的震动水平。
它乃至让 OpenAI 的高层们初次对别家公司的模子停止公然点评,实属常见:
图源:https://x.com/lvwerra/status/1884314249574662439
起首,DeepSeek 模子的提高再次标明,2025 年的人工智能比赛将十分剧烈,比方从 V3 到 R1 的迭代只距离短短多少周时光。
其次,DeepSeek 推翻了人们对 AI 本钱的见解。
OpenAI 前政策研讨员 Miles Brundage 表现,R1 应用了两个要害的优化技能:更高效的预练习跟头脑链推理强化进修。这种组合使模子可能实现 o1 级机能,同时应用更少的盘算才能跟资金。
DeepSeek 的胜利让人们思考,能否真的须要数十亿美元的盘算才干博得人工智能比赛。传统观念以为,年夜型科技公司将主宰人工智能的下一步,仅仅是由于它有充足耗费的‘闲钱’。当初,看起来年夜型科技公司只是在烧钱。盘算出这些模子的现实本钱有点辣手,因为制裁,DeepSeek 可能‘无奈老实地说出它领有什么范例的 GPU 跟几多个 GPU’。
但缭绕 DeepSeek 的争议可能刚开端。
一方面,OpenAI 跟微软现在正在考察这家中国竞争敌手能否应用了 OpenAI 的 API 来练习 DeepSeek 的模子。彭博社本周早些时间报道称,微软的保险研讨职员客岁底经由过程 OpenAI 开辟者账户检测到大批数据被应用,这些数据可能与 DeepSeek 有关。
另一方面,据彭博社报道,美国正在考察 DeepSeek 能否经由过程新加坡的第三方购置了进步的英伟达芯片,以躲避相干限度。
图源:https://www.bloomberg.com/news/articles/2025-01-31/us-probing-whether-deepseek-got-nvidia-chips-through-singapore
DeepSeek 能否真的违背了上述限度?在一篇长文中,有名剖析师 Ben Thompson 表现,从 DeepSeek 以往公然的每一代模子的研发细节来看,大批翻新方式都是为战胜应用 H800 而不是 H100 所隐含的内存带宽缺乏成绩而计划。
‘DeepSeek 现实上对每个 H800 上的 132 个处置单位中的 20 个停止了编程,专门用于治理跨芯片通讯。这在 CUDA 中现实上是弗成能做到的。DeepSeek 工程师不得不升级到 PTX,这是 Nvidia GPU 的初级指令集,基础上就像汇编言语一样。这是一个猖狂的优化级别,只有在应用 H800 时才有意思。’
‘DeepSeek 在计划此模子时做出的全部决议只有受限于 H800 时才有意思;假如 DeepSeek 能够应用 H100,他们可能会应用更年夜的练习集群,而专门针对战胜带宽缺乏的优化会少得多。’
‘我下面提到,假如 DeepSeek 能够应用 H100,他们可能会应用更年夜的集群来练习他们的模子,由于这将是更简略的抉择;现实上,他们不,并且带宽受限,这推进了他们在模子架构跟练习基本设备方面的很多决议。看看美国试验室:他们不花太多时光停止优化,由于 Nvidia 始终在踊跃推出更强盛的体系来满意他们的需要。阻力最小的道路就是向 Nvidia 付费。但是,DeepSeek 只是证实了另一条道路是可行的:在较弱的硬件跟较低的内存带宽上,大批优化能够发生明显的后果;仅仅向 Nvidia 付出更多用度并不是制造更好模子的独一方式。’
在文章中,Ben Thompson 还夸大了 DeepSeek R1 带给全部科技巨子的临时影响:
从久远来看,模子商品化跟更廉价的推理(DeepSeek 也证实了这一点)对年夜型科技公司来说十分有利。
假如微软可能以极低的本钱为客户供给推理效劳,那么这象征着微软在数据核心跟 GPU 上的付出会更少,或许,斟酌到推理本钱要低得多,应用率可能会年夜幅进步。
另一个年夜赢家是亚马逊:假如有十分高品质的开源模子,它们能够以远低于预期的本钱供给效劳。
苹果也是年夜赢家。推理所需的内存需要年夜幅增加,使边沿推理愈加可行,而苹果领有最好的硬件。Apple Silicon 应用同一内存,这象征着 CPU、GPU 跟 NPU(神经处置单位)能够拜访共享内存池;这象征着苹果的高端硬件现实上领有最好的推理花费芯片(Nvidia 游戏 GPU 的最年夜 VRAM 为 32GB,而苹果的芯片的最年夜 RAM 为 192 GB)。
与此同时,Meta 是最年夜的赢家。客岁秋日,我曾经论述了 Meta 营业的各个方面怎样从人工智能中受益;实现这一愿景的一年夜阻碍是推理本钱,这象征着,斟酌到 Meta 须要坚持当先位置,推理本钱年夜幅下降以及练习本钱年夜幅下降将使这一愿景更轻易实现。
与此同时,谷歌的情形可能更糟:硬件请求的下降减弱了谷歌 TPU 的绝对上风。更主要的是,一个零本钱推理的天下增添了代替搜寻的产物的可行性跟可能性。固然,谷歌的本钱也下降了,但任何转变近况的行动都可能是负面的。
经此一役,往年的年夜模子格式将会怎样演化,你怎样看?
相关文章