中央社报导,中国的DeepSeek因标榜低成本也能训练出强大AI模型,颠覆AI训练不能没有精密昂贵晶片的刻板印象,引发科技类股恐慌,辉达27日收盘重挫17%,创美股上市公司史上单日最大跌幅。
● 美科技类股惨遭血洗
华尔街日报指出,以科技类股为主的那斯达克综合指数(Nasdaq Composite)下跌3.1%;标普500指数(S&P 500)上周缔造历史新高后下跌1.5%。许多公司损失达双位数。甲骨文(Oracle)股价下跌14%,美超微(Super Micro Computer)下跌13%,晶片制造商博通(Broadcom)重挫17%。
道琼斯市场数据(Dow Jones Market Data)显示,27日的市场大浴血让美国股市蒸发约1兆美元。美股今天的跌势堪称突如其来的逆风,因为自川普当选以来美股即处于历史高位,投资人押宝新政府亲商政策,同时享受AI类股涨势的红利。
● DeepSeek是什么
纽约时报指出,DeepSeek是由中国对冲基金幻方量化(High-Flyer)创办与经营的新创公司,目标是打造出与OpenAI的ChatGPT、Google的Gemini等相近的人工智慧(AI)科技。
DeepSeek在中国以吸引年轻AI人才著称,提供高薪和参与尖端研究计划机会,招揽顶尖大学的研究人员,幻方量化与DeepSeek均为中国企业家梁文锋所经营。
● DeepSeek何以如此震撼
DeepSeek去年12月26日推出DeepSeek-V3这款大型语言模型,性能已可与OpenAI和Google等美企旗下优秀的聊天机器人媲美,单这点已让外界惊艳。然而DeepSeek在一份说明技术构建的研究论文里称他们训练AI所用晶片数量远少于其他美企后,犹如引发地震。
全球一些顶尖企业用超级电脑训练聊天机器人时动辄得用上至少1.6万片晶片,然而DeepSeek工程师们说他们仅使用约2000片辉达(Nvidia)晶片。
此外,自从2022年底OpenAI掀起旋风以来,「不动辄重砸数十亿美元没法训练出强大AI系统」始终是主流观点,也予人唯有像微软、Google、Meta等科技巨擘才玩得起先进AI、辉达这类AI晶片厂将一片光明的印象。
然而DeepSeek称他们仅花费约560万美元和相对原始的运算能力训练自家系统,这比Meta建构旗下最新AI所花资金便宜约10倍,引来AI产业反思是否真有必要砸天文数字的资金、AI产业是否将泡沫化等。
● DeepSeek是如何办到使用较少晶片
美国的顶尖AI工程师们表示,DeepSeek的研究论文提出一些让人印象深刻的巧思来降低晶片使用量,简言之就是种让晶片分析数据时更有效率。
先进AI系统需归纳文字、图片、影音等大量数据来学习技能,DeepSeek则把这些数据分析工作分配给多个不同模型,每个模型负责特定领域,如此一来维持高效数据处理的同时还缩短运算时间。这种方法之前不是没有人用过,只是没法像DeepSeek用更少的运算能力做到。
精通建构高效AI系统的卡内基美隆大学(CMU)电脑科学教授戴特摩斯(Tim Dettmers)说:「现在看显然除OpenAI这类公司外,其他人也能玩。DeepSeek使用的方法人人都能依样画葫芦。」
● DeepSeek技术真能媲美OpenAI、Google吗
根据一些标准基准测试,DeepSeek-V3一如市场现有的同类产品,即能有效地答复询问、解决逻辑问题并自行做编程。
就在DeepSeek公布自身技术前,OpenAI才揭橥一款名为OpenAI o3的新系统,效能似乎比DeepSeek-V3更强,只是还没对外推出。OpenAI o3的设计是能对数学、科学和电脑程式等问题「推理」;一些专家认为,DeepSeek还不具备这种未来AI趋势的推理能力。
然DeepSeek旋即在1月20日发布自家推理模型DeepSeek-R1,终于引发投资圈和其他人因意识到DeepSeek带来的影响性而于这周末陷入恐慌。
● 对DeepSeek的质疑
华尔街日报指出,几名晶片分析师今天对DeepSeek能以如此低的成本构建出与美国先进AI模型相匹敌产品的说法提出质疑。研究机构伯恩斯坦(Bernstein)分析师瑞斯冈(Stacy Rasgon)仍不认为「DeepSeek是以500万美元打造出OpenAI」。
花旗(Citi)分析师马里克(Atif Malik)则表示「虽然DeepSeek的成就具突破性,但我们对它能在不使用先进GPU进行优化下依然能缴出成果的说法抱持怀疑」。
此外,美国财经新闻网CNBC指与其他中国聊天机器人一样,DeepSeek在被问及某些敏感话题时有局限性,例如问它关于中国领导人习近平一些政策时,DeepSeek似乎会回避。
● 美国的晶片禁令难道没用吗
为维持美国在全球AI竞赛领先地位,之前拜登政府限制向中国和其他竞争对手出售高性能晶片。DeepSeek的表现引发外界质疑,会否这些限制手段反迫使中国研究人员利用网上各种免费工具发挥创意。
有些专家依然支持美国做法,称很多限制措施是近期才上路,遏止住中国研发AI的效果会随时间益发增强。
但DeepSeek的突破仍给川普新政府一道难题:得考虑是否不仅要维系拜登政府后期推动的晶片禁令,甚至还要加大掐脖力道,像是连辉达降阶版的H20晶片都不能卖给中国。美国一些国会议员今天已呼吁川普政府实施更严格的出口管制,进一步限缩中国在AI取得进展。
● 何谓开源AI
与许多公司一样,DeepSeek也把自身最新的AI系统「开源」(open sourced),即把支撑AI的运算代码公开给其他企业和研究人员,让所有人都能使用这些技术来建构、推广自己的产品。DeepSeek与其他中国企业能如此迅速拿出具竞争力的AI产品,部分也是受惠于他人开源。
开源于AI世界兴起是在2023年,Meta免费分享名为Llama的系统。当时许多人认为只有像Meta这种拥有靠专门晶片支撑大数据库的公司继续分享,开源生态才能蓬勃。但DeepSeek证明,就算没有美国科技巨擘,开源生态照样能有声有色。
不少专家认为美国大公司不该开源自身技术,以免被用于散播假讯息或造成其他严重损害;一些美国议员已在探究立法设限的可行性。
但另有专家认为,如果在美限制开源,中国反将获益,因为若好的开源技术都来自中国,日后反变成美国的研究人员和公司靠中国的技术发展自身系统。长此以往会让中国成为AI研发领域的核心,进一步加速北京全面构建AI,包括无人武器等军事系统。
● DeepSeek让美警觉 其他国家则受鼓舞
华尔街日报指出,并非所有人都认为DeepSeek将颠覆AI产业。分析师瑞斯冈表示,尽管DeepSeek可能找出降低AI训练成本的方法,但随AI需求持续飙升,科技公司仍需更多的算力,不愁晶片卖不出,「DeepSeek会是AI产业生态的末日吗,我们不觉得」。
不过DeepSeek的成功,可能重塑AI发展的全球竞争格局,让美国以外的国家感到振奋。
像法国政府今天就表示,DeepSeek证明只要业者灵活具备巧妙技术,纵使资金少或无法获得顶级晶片,照样能在AI世界逐鹿中原。法国的官员就认为,不仅中国有机会,欧洲和世界其他地区也有机会追上矽谷。