题图|视觉中国

DeepSeek-R1蔓延速度之快,让伟大的前辈ChatGPT都成了“老爷车”。

DeepSeek-R1凭借其特有的"认知预判"架构,在2025年率先实现了生成质量与推理速度的平衡,成为有史以来增速最快的大模型。

而且单代AI技术整体的“领先有效期”越来越短,对企业形成愈加频繁地强烈冲击。

在这种形势下,一方面企业要持续跟踪最新的技术,另一方面同时还要保证自己AI应用落地的效果——这已经成为企业在AI上的巨大挑战。

DeepSeek-R1强,让企业更焦虑

DeepSeek-R1比较容易产生“幻觉”,恰恰是源于其关键创新:正式回答前的深度思考。

这个类似于人类在回答复杂问题前,会先在脑海中梳理思路,内容更有条理性和逻辑性。因其生成文字的能力足够强,逻辑足够强大,这些幻想出来的“假话”往往还非常难分辨。

要么让它负责前期思考,提供解决问题的框架;要么在完成资料搜集后,利用它强大的语言能力进行内容整合输出。最终结合部分其他大模型的成果,实现总体效果的最佳化。

对需要产生商业价值的企业级生成式AI应用来说,这完全不可接受。这就是生成式AI著名的“不可能三角”:准确、性能、成本。


这三方面的综合要求,最终转化为了AI应用搭建、知识储备、模型训练与部署等环节中的复杂挑战。即使那些已完成数字化转型的企业,也常在这些环节中偏离正轨,最终导致投入大量资金却未能获得预期效果。

“解药”,藏在谁手里?

答案其实很明确,在云厂商手里。

今天凌晨,亚马逊云科技宣布在Amazon Bedrock平台上推出全托管、无服务器的DeepSeek-R1模型,是首个提供DeepSeek-R1作为全托管、正式商用模型的海外云厂商。所以,对于出海企业而言,DeepSeek on Bedrock是一个绝佳的选择。


DeepSeek-R1作为Amazon Bedrock上首个完全托管的中国大模型,在今年1月底的部署版DeepSeek-R1上线之后就获得了企业客户的好评,数千用户已经Amazon Bedrock的自定义模型导入功能进行了部署。

此次更新的完全托管版相比之前的部署版,能够进一步使用Amazon Bedrock上所有功能,包括模型蒸馏、安全防护、数据加密、模型评估以及开箱即用的工具。

亚马逊云科技这一次的更新,从事实上证明了云计算厂商在AI大模型时代依旧具有明确的竞争优势:

1、更准确——云端大模型商店,汇聚全球最领先的AI大模型,供企业快速调用;企业数据全面防护,驱动大模型训练和运转; 2、更强性能——云原生架构方便多种模型和海量Agent协作;大规模GPU计算基础设施,随时调用; 3、更低成本——减少企业自身使用大模型、蒸馏小模型的工作量;灵活调用的计算资源,可以从根本上减少计算花费。

绝大多数企业无法拥有机器学习专家、数据科学家和语言模型专家,人才成本、人才累积都无法承受。

云计算厂商,则可以在人才和基础设施方面进行更积极的投入,更好、更快地挖掘技术潜力。同时还能积极推进与全球多家最领先AI创业公司合作。生态化的合作方式,让众多客户企业能够享受到全球最领先的AI人才、AI创业公司的技术成果。


亚马逊云科技通过与Anthropic、DeepSeek、Cohere等头部AI创业公司深度合作,让Amazon Bedrock上可选基础大模型来到180多款,其中50款可以云原生部署,比如Claude3.7 Sonnet、DeepSeek-R1、Llama 3.3、Nova系列模型、Mistral Large等。

相比大模型的“有无问题”,云计算厂商还是有更进几步的思考:

一、多模型的选择和部署

根据国际知名咨询机构Gartner的最新预测:因为单一模型无法同时满足企业的所有功能性和非功能性要求,所以到2027年,中国80%的企业将使用多模型生成式人工智能策略来实现多样化的模型功能,来获得成本效益。

但想要完成复杂的多模型部署与应用协调并非易事,在打造专用模型的过程中,企业还很可能因为自身并没有足够庞大且高质量的数据集来训练和优化,导致效果不佳。最终出现落地进程比不过技术快速迭代的速度,导致“技术落地即过时。”

Amazon Bedrock的多种大模型的同平台、同Marketplace搭载,就为企业多模型组合使用创造了便利。企业完全可以根据自己的需求特点,实现云上多模型策略:根据自己的具体场景需求,把多个大模型,按照“高级的高性能安全模型、中级的平衡型模型、Good-Enough便宜大碗好用模型”雇佣一组不同学历和资历的AI员工,兼顾场景、性能、准确和成本。

例如亚马逊云科技自己的Nova模型,就是典型的“便宜大碗安全好用型”,本身就涵盖了多个版本,在各类基准测试中表现持平来自于Google的Gemini 1.5 Flash,同时比后者还有更快的输出速度和性价比,适用于企业客服、内容生成、简单数据分析、企业内部自动化等场景。就非常适合当做“Good-Enough”模型,企业可以拿它与Claude 3.7 Sonnect、DeepSeek-R1这样的强模型组合,形成高低搭配。

二、能落地、上生产,才是好模型

企业客户需要趁手的开发平台、工具、功能,实现真正的从技术落地到上生产的老大难问题。

Amazon SageMaker AI,让用户可以在集成式开发环境高效地构建、训练和部署机器学习模型。Amazon Bedrock自带防护机制中的“自动推理检查”功能,则可以从根源上尽可能消除大模型运行过程中的“幻觉”问题。

云计算结合大模型的解决方案,正在全面推动云计算再次成为企业IT基础设施的最佳选择。


在知名咨询机构PWC的一份关于领先企业在云计算和AI领域的投入调研中,有92%的行业领先企业都正在计划增加自己的云预算,其中63%更是将云预算的增长提升了6%以上(远高于通货膨胀率)。

越来越多的企业正在通过AI驱动的云架构加速数据现代化,将IT能力与AI紧密结合,从而在行业中获得领先地位。

亚马逊云科技,企业AI时代的“僚机”

亚马逊云科技CEO Matt Garman在一次采访中明确指出AI时代云计算厂商的核心任务——持续走在企业前列,帮助客户捕捉关键选择。

他以两个例子来说明这一观点:第一,为用户提供最先进的技术和产品,例如推理能力更强的DeepSeek-R1大模型;第二,打造有竞争力的AI计算基础,例如亚马逊云科技专门为人工智能训练和推理设计的Tranium2人工智能芯片。

Garman特别强调,云计算厂商并非像其他公司一样急于推出聊天机器人,而是基于客户需求,打造一个聚合平台,提供多种大模型和各环节工具,帮助客户将新技术真正应用于业务,让AI成为企业的关键竞争优势。

亚马逊云科技的实践与传统云计算时代并无本质不同——始终走在技术探索的前沿,在掌握新技术后,将成果反馈给客户。

为了确保领先,亚马逊还在不断增加投入。根据第三方研究机构的统计,亚马逊继续在基础设施的支出上领衔全球云厂商,2024年AI基础设施投资更是推动了资本支出的大幅增加。亚马逊CEO Andy Jassy在此前的第四季度财报会上专门指出:亚马逊第四季度263亿美元资本支出的"绝大部分"用于亚马逊云科技的AI投资。


"开放的多赢逻辑"、"保持技术实力的绝对优势"、"只盯着客户的需求"——这是亚马逊云科技在生成式AI时代走向新高度背后的逻辑。

本内容为作者独立观点,不代表虎嗅立场。未经允许不得转载,授权事宜请联系 hezuo@huxiu.com

本文来自虎嗅,原文链接:https://www.huxiu.com/article/4062550.html

ad1 webp
ad2 webp
ad1 webp
ad2 webp