星期四, 8 1 月

DeepSeek震撼股市未阻西方AI热潮 算力与竞争是关键

中国人工智慧(AI)开发商DeepSeek近1年前推出新模型震撼业界,一些具领先地位的西方科技股大跌。如今这些公司股价不仅反弹还续涨,DeepSeek却不再火热,究竟为何有此消长?

美国财经媒体CNBC报导,2023年成立的DeepSeek在2024年底推出免费开源大型语言模型(LLM)V3,并称其是用算力较低的晶片训练,因此所需成本比美国顶尖AI公司如OpenAI和Google(谷歌)的模型少许多。

2025年1月DeepSeek再发表推理模型R1,与许多世界领先的LLM相较,达到相似基准甚至超越。

当时引发美国AI晶片业巨擘辉达(Nvidia)股价单日暴跌17%,市值蒸发近6000亿美元;同日美国晶片大厂博通(Broadcom)股价同样崩跌17%,荷兰先进半导体制造设备业者艾司摩尔(ASML)股价也重挫7%。

顾能(Gartner)分析师坎达巴图(HarithaKhandabattu)解释,这是因为R1改变了全球对AI前沿模型的成本曲线及对中国竞争力的看法。

投资公司D.A. Davidson分析师普莱特(Alex Platt)也说,R1「确实出乎市场意料」,因为当时一般说法是,中国在相关领域落后美国9到12个月。

晨星(Morningstar)分析师柯列洛(Brian Colello)指出,那时市场担忧的是,若有模型能以较少算力达到与最先进系统相似结果,恐影响AI基础建设需求,进而冲击辉达这类公司营收。

但现在看来,「2025年(AI基建)支出反而未见放缓;且展望未来,2026年及之后的支出预期还会加速」。

的确过了11个月后,当时大跌的公司股价不仅收复失土还继续上涨。辉达在10月成为首家市值突破5兆美元的企业,博通全年股价大涨49%,艾司摩尔劲扬36%。

反观DeepSeek此后虽然发布了7个新的模型版本,但都只是将V3和R1更新,而非全新模型,因此未再掀起相同轰动。

顾能的坎达巴图表示,尽管DeepSeek较近期推出的模型在效能上「有可靠的明显提升」,但市场仍认为,这些属于「延续与巩固,而非全新冲击」。

根据市场分析师说法,DeepSeek至今未推出全新模型,一部分原因很可能是算力有限。

英国「金融时报」(Financial Times)去年8月便报导,DeepSeek原计划5月推出R2模型,但由于用中国企业华为的晶片训练时遭遇挑战,因此延后发布。

当时报导说,中国当局由于面临美国禁止辉达最强大晶片出口,因此为了减少对美国产品依赖,于是鼓励DeepSeek使用华为处理器。

「晶片战争」(Chip War)一书作者米勒(ChrisMiller)直言:「过去几年,中国在算力数量取得方面一直受限,一大部分原因是美国限制晶片销售。而若想要打造先进(AI)模型,就必须能够取得先进运算。」

DeepSeek本月稍早发表的1篇论文也坦言,若与Google的Gemini 3这类前沿闭源AI模型相较,他们仍面临「某些限制」,包括运算资源。

与此同时,西方尖端AI公司陆续推出新的先进模型,例如OpenAI在8月发表了GPT-5,Google和Anthropic也在11月分别推出Gemini 3和Claude Opus4.5,令市场人士更加确信,美国在AI领域的领导地位将持续下去。

顾能分析师强德拉塞卡伦(Arun Chandrasekaran)表示,随著AI模型推出速度加快,能力改善程度渐增,业界竞争更激烈,突然出现商品化冲击的疑虑已经缓和。 $(document).ready(function () {nstockStoryStockInfo();});

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注