当前位置:硬件测评 > 微软、谷歌、亚马逊打响大机型时代的云战争

微软、谷歌、亚马逊打响大机型时代的云战争

  • 发布:2023-09-30 06:37

  随着互联网企业软件云支出收紧,增速放缓逐渐成为笼罩云厂商的乌云。

  ChatGPT的出现打破了这个瓶颈,AI将重塑软件。软件公司作为云厂商的客户,正在积极将大模型带来的AI能力嵌入到现有的工作流程中,以完成更高级别的自动化。

  随着新的云客户逐渐枯竭,软件公司不再为了上云而上云,而是努力利用AI来提高生产力。 “这是未来十年云计算市场最大的增幅,计算基础设施是大模型的绝对红利受益者。”从事云计算行业十多年的人士向极客公园解释道。

  在这样的前景下,海外几大云服务公司——微软、亚马逊、谷歌、甲骨文——迅速做出了改变。这几个月来,云巨头真金白银地开发大模型、战略投资、自研AI芯片……大模型时代方兴未艾,他们已经瞄准了新一代人工智能软件客户。

  旧世界远非牢不可破。云市场正在快速洗牌,巨头开启了新的竞争大幕。

  毕竟,移动互联网时代老大哥的没落已经迫在眉睫了。几年之内,诺基亚从巅峰时期70%的手机市场份额变成无人关注,只是因为错误的决策。对于大型模型,云行业已经迅速形成共识:这一次的AI绝非一个小变数。从行业快速发展速度来看,目前的领先者也可能被抛在后面。

  2023年已经过去一半了。本文将对海外几大云公司进行梳理。如今云厂商竞争的关键是什么?

  01

  开发AI专用芯片,

  你不能把你的“命”交给NVIDIA

  大模型时代到来之后,对于云服务商来说,如今最稀缺的资源就是算力,或者说是AI芯片。投资最底层的基础设施——AI加速芯片,已经成为当今云厂商竞争的首要焦点。

  稀缺和昂贵被认为是云厂商加速自研芯片研发的首要原因。连马斯克这样的科技圈大佬都评价“这东西(NVIDIA GPU)比药还难得到”,并偷偷为自己的AI公司www.sychzs.cn从NVIDIA购买了一万张卡,还收集了大量的闲置股权在甲骨文中。

  这样的稀缺程度体现在云空子的业务上,直接对应的是“卡脖子”造成的业务损失。就连先发制人的微软也被曝出传闻称,由于GPU短缺,内部AI研发团队实施了GPU配给制度,各种新计划被推迟,新客户不得不排队数月才能获得Azure。

   即使是风险投资机构也必须依靠英伟达芯片库存来抢项目。对于N卡,各方已经到了“用尽一切手段”的地步。

  稀缺的另一个名字是昂贵。考虑到大型模型的计算能力要求增加了十倍,卡只会变得更加昂贵。近日,一位投资者向极客公园表示,“年初卖8万元的A100单卡,现在已经卖到16万元了,而且还买不到。”据此,云巨头必须支付数万张卡。 “NVIDIA税”只会是一个天文数字。

  将自己的生命悬在别人手中是什么感觉?微软是最受欢迎的公司,最有发言权。一个月前,The Information独家报道称,微软已成立300人的“团队”,加快AI芯片自研步伐。代号Cascade的服务器芯片最早可能于明年推出。

   不仅仅是因为“卡脖子”,云厂商开发自研芯片,还因为另一层——GPU不一定是最适合运行AI的芯片。自研版本可能会对特定的AI任务进行优化。

  当今大多数高级人工智能模型确实都是由 GPU 提供支持,因为 GPU 比通用处理器更擅长运行机器学习工作负载。然而,GPU 仍然被视为通用芯片,而不是真正适合人工智能计算的处理平台。正如远川研究院《英伟达帝国的一道裂缝》所指出的,GPU并不是为了训练神经网络而设计的。人工智能发展得越快,这些问题就越暴露出来。依靠CUDA和各种技术逐个场景“神奇修改”是一种选择,但并不是最优方案。

  亚马逊、谷歌和微软一直在开发称为 ASIC(专用集成电路)的芯片,它们更适合人工智能。 The Information 采访了多位芯片行业从业者和分析师,得出的结论是,Nvidia GPU 有助于训练 ChatGPT 背后的模型,但 ASIC 通常可以更快地执行这些任务,并且消耗更少的电量。

  如上图所示:亚马逊、微软、谷歌都提升了芯片自研的重要性,针对数据中心领域开发了两类芯片:标准计算芯片和专门用于训练和训练的芯片。运行芯片的机器学习模型,这些模型可以为 ChatGPT 等聊天机器人提供动力。

  目前,亚马逊和谷歌已经为内部关键产品开发了定制的ASIC,并通过云端将这些芯片提供给客户。自 2019 年以来,微软还一直致力于开发定制 ASIC 芯片,为大型语言模型提供支持。

  根据云客户和微软发布的性能数据,这些云提供商开发的一些芯片,例如亚马逊的Graviton服务器芯片以及亚马逊和谷歌发布的AI专用芯片,在性能上已经可以与传统芯片制造商的芯片相媲美。可比。 Google TPU v4 的速度比 Nvidia A100 快 1.2-1.7 倍,同时功耗降低 1.3-1.9 倍。

  02

  战略投资竞赛:

  巨头花钱“买顾客”

  除了芯片研发,海外各大云公司竞争的第二个关键点是对外战略投资,抢夺AI客户和AI项目。

  与风险投资相比,巨头的战略投资具有绝对优势。 OpenAI与微软的合作就是一个绝佳的范例,开创了大模型与战投联手的先例。这是因为大型模型和相关应用所需的资源壁垒极高。只有钱,有限的钱,根本不足以抢到AI项目。毕竟,谷歌、微软、AWS、甲骨文或英伟达不仅可以开出巨额支票,还可以提供云积分和 GPU 等稀缺资源。

  从这个角度来说,抢项目、抢客户都发生在云和巨头之间,没有其他对手。他们正在开始一场新游戏——寻求人工智能公司承诺他们将使用他们的云服务而不是竞争对手的云服务。

  微软担任OpenAI独家云服务提供商。在为OpenAI支付巨额云费用的同时,还获得了OpenAI的股权、产品优先使用权等一系列令人羡慕的权益。

  微软的竞争对手也在争先恐后地争取其他人工智能客户。这些云供应商为人工智能公司提供大幅折扣和信用,以赢得他们的业务。批评者表示,这类似于购买客户,尽管在企业软件领域购买未来或当前客户的股权并不罕见。

据 The Information 早些时候报道,甲骨文还提供了价值数十万美元的计算积分,作为人工智能初创公司租用甲骨文云服务器的激励措施。

  谷歌可能是这些主要云供应商中最活跃的,为人工智能初创公司提供现金和谷歌云积分的组合,以换取股权。今年早些时候,谷歌向 OpenAI 的主要初创挑战者之一 Anthropic 投资了 4 亿美元。谷歌云在二月份表示,它已成为 Anthropic 的“首选”云提供商。

  近日,谷歌向“文森特视频”领域的AI公司Runway投资1亿美元。但在此之前,亚马逊 AWS 将 Runway 视为重要的人工智能初创客户。今年3月,AWS与Runway宣布建立长期战略合作伙伴关系,成为其“首选云提供商”。现在,Runway似乎成为谷歌和亚马逊对决中的“棋子”之一,因为Runway也有望从谷歌租用云服务器。

   此前,谷歌云还宣布与另外两家热门AI公司建立合作伙伴关系:Vincent图形领域的Midjourney和聊天机器人www.sychzs.cn,后者此前是Oracle的关键云客户。

  现在判断这些交易是否会帮助谷歌赶上更大的云计算竞争对手AWS和微软还为时过早,但谷歌云正在进攻。

   The Information 数据库中的 75 家 (AI) 软件公司中,谷歌至少为 17 家提供了部分云服务,比任何其他云提供商都多。亚马逊紧随其后,至少有 15 家公司使用 AWS 进行云计算。微软和甲骨文分别为六家公司和四家公司提供云服务。当然,使用多个云在行业中也很常见,75 家公司中至少有 12 家混合使用多个云提供商。

  03

  大模左右

  胜利的真正关键

  算力和战力投入是这场云战争初期必须争夺的制高点。但从长远来看,大型车型才是市场竞争胜败的真正关键。

  微软要成为领导者,与OpenAI的合作不可或缺。再加上微软团队优秀的工程能力,GPT-4在几个月内就被嵌入到了微软的“全家桶”中。过去六个月,微软利用OpenAI产品的优先使用权和企业软件产品的降价优势,抢占更多云市场。然后依靠升级为Microsoft 365 Copilot的产品线的涨价来获得更大的收入。

  根据云栖资本研究,微软的底层模型基本依赖于OpenAI。接入大模型后,微软开始以更低的价格打包销售Teams、Power BI、Azure等应用层产品。

  微软首席财务官 Amy Hood 在 4 月份告诉投资者,随着越来越多的人开始使用其服务,OpenAI 将为 Azure 带来收入。

  最新报告显示,微软正在向一些 Office 365 客户额外收取 40% 的费用,以测试 AI 功能,这些功能可以自动完成在 Word 文档中编写文本和创建 PowerPoint 幻灯片等任务。至少 100 名客户已支付最高 100,000 美元的固定费用。数据显示,推出不到一个月,微软就从 Microsoft 365 Copilot 的 AI 功能中获得了超过 6000 万美元的收入。

   与微软形成鲜明对比的是,曾经的领头羊亚马逊云在大模式上一步步落后,如今面临着更加严峻的挑战。

  AWS 是人工智能云服务的早期开发商,自 2016 年左右开始制定计划。但客户找不到这些服务,其中包括面部识别、将文本转换为逼真的语音以及用于执行客户等任务的原始形式的聊天机器人服务,非常有用。 AWS还在2017年推出了SagaMaker,这是一款面向工程师的AI数字工具,帮助他们开发和使用机器学习模型。这一度成为AWS的主力AI产品。

  但在接下来的几年里,AWS的AI产品没能跟上大语言模型的浪潮。自2021年11月起,微软开始销售基于GPT系列模型开发的AI产品,供企业客户使用。与此同时,谷歌还抓住了主要的人工智能初创公司作为云客户,并向其云客户出售专有的人工智能软件。即使是云计算落后的甲骨文在为AI初创公司提供计算资源方面也有其优势。

  AWS 正在努力迎头赶上。今年 4 月,它宣布了一项云服务,允许客户将 Stability、Anthropic 和 AI 21 Labs 的大型模型作为基础集成到他们自己的产品中。作为回报,AWS 与这些合作伙伴分享部分收入。

  2023年Google I/O大会上,CEO Sundar Pichai介绍Google最新AI进展 |图片来源:Google官网

  Google起得很早,却赶着去参加一个迟到的会议。作为在大机型领域积累最深的各大厂商,谷歌在ChatGPT发布后的反应并不令人不快。作为回应,它迅速发布了会话智能机器人Bard和新一代大型语言模型PaLM 2。结果发布会上直接翻车了,后续跟进。产品发布速度也并不理想,这与微软强大的工程能力形成鲜明对比。

  最后值得一提的是,很早就跌出云市场前列的Oracle,在这波热潮中竟然有逆袭之势。

  甲骨文长期以来一直是云领域的落后者,但在向与 OpenAI 竞争的知名人工智能初创公司租赁云服务器方面取得了令人惊讶的成功。据 The Information 报道,部分原因是 Oracle Cloud 可以比 Amazon Web Services 或 Google Cloud 更经济高效地运行复杂的机器学习模型。

  Oracle Cloud 参与 AI 竞赛的方法似乎与 AWS 类似,后者开发自己的 AI 软件来销售给客户,但也将出售开源 AI 软件和其他 AI 开发商产品的访问权限。

  此外,有内部人士透露,甲骨文已经开始测试OpenAI的产品,以丰富其针对B端客户的产品线,包括人力资源和供应链管理软件,但甲骨文更有可能为此开发自己的软件。未来的人工智能功能可以帮助甲骨文客户快速生成职位描述并安排招聘人员和候选人之间的会议,尽管该公司仍在决定首先改进哪些产品。

  参考:

  《英伟达帝国的一道裂缝》|十川综合研究所

  大厂商大车型:实战才是硬道理 | 《云栖未来视野》

  谷歌和微软的其他人工智能竞赛:服务器芯片|信息

  对 AWS 人工智能战略的怀疑上升|信息

  Google、Nvidia 和 Microsoft 提供 VC 无法提供的信息

  Pro Weekly:生成式人工智能刺激云需求和竞争|信息

  Google 投资 AI 初创公司 Runway,从 AWS 手中夺取云业务|信息

  微软向部分 Office 365 客户收取 40% 的额外费用以测试 AI 功能|信息

相关文章