据《CNBC》报导,美国AI新创公司Scale AI创办人Alexandr Wang指出,DeepSeek拥有约5万个辉达H100晶片,而这些AI晶片早在2022年拜登政府时期就遭列出口管制措施,禁止出口给中国公司。由于中国在AI发展遭到美国全面限制,尤其又以提供AI训练的算力来源、也就是包括辉达、AMD这几年所打造的AI GPU,几乎在过去一段时间遭到拜登政府一步步封杀出口管道,然而,DeepSeek的出现,显示可以透过各种低成本、或是算力较低的方式,也能训练出如OpenAI的o1的模型。

DeepSeek声称,他们只花了550万美元,就打造出如此成就,如今在中国App store的下载排行更是排名首位。至于近期引发热议的DeepSeek-R1,由于其为开源LLM,代表任何开发者都可以下载并根据自身需求修改,严重冲击当前的AI语言模型商业模式,尤其是仅用2048个H800、耗时2个月就推出6710亿参数的DeepSeek-V3,相较于Meta的4050亿参数Llama 3.1,使用超过1.6万个H100,花了54天,更是耗费数亿美元经费,DeepSeek的训练效率提升11倍。

中媒《每日经济新闻》报导,一名Meta工程师相当焦虑并写下文章,指称Meta内部因为DeepSeek陷入恐慌,DeepSeek-V3在基准测试已经让Llama 4相形见绌,更强调对方是仅用550万美元就能做到这点的中国AI新创公司,不过,该文章真实性还有待查证。

Alexandr Wang则是爆料,DeepSeek拥有约5万个辉达H100晶片,但显然此事不能公开说明,因为这违反美国AI晶片禁令,他认为之后该公司会受到美国政府的晶片出口管制措施与相关限制。拜登政府从2022年开始,就限制包括H100、H200晶片出口给中国公司,甚至连符合算力规定的H800、A800等特供中国的晶片,也在之后的禁令遭到限制。

不过,美国商务部近期针对辉达的AI晶片流入中国进行调查,除了近期爆出中国AI新创公司有突破性发展,多家外媒也在去年提及,中国公司利用各种管道,甚至是让白手套公司,将最新先进AI晶片,或是有一定算力的GPU走私到中国,让中国AI发展能在美国全面封锁下持续推进。


點擊閱讀下一則新聞 點擊閱讀下一則新聞
中国AI黑马撼动生态 辉达股价大跌13%市值蒸发15兆