CNBC报导,China 的 DeepSeek 推出其 AI 模型供商业免费使用,并公开了从零开始构建该模型的技术细节。该公司表示,在开发该模型时,仅在 AI 晶片上的花费约 600 万美元(约 1.9 亿元台币)。
虽然一些人对这一数字的准确性提出质疑,但相较于美国科技公司投入数亿甚至数十亿美元开发 AI 模型,这一成本显得极具竞争力。
这一进展可能开启了印度 AI 模型研发的起点,因为以往训练大型语言模型通常需要数千颗耗能高且昂贵的 AI 晶片。此外,这可能也为印度科技企业带来重大转折点,像是 Infosys 这类公司过去主要依赖美国科技公司开发的 AI 模型。
商业转型公司 WNS 表示,DeepSeek 的 AI 模型对于印度科技企业而言是一项「关键进展」。这种低成本研发模式将使印度能够训练新的 AI 模型,以支援印度各地区语言。
目前市面上的大型语言模型,如 OpenAI 的 GPT-4o 和 Anthropic 的 Claude Sonnet 3.5,主要支援有限几种语言。
但现在透过运用 DeepSeek 的技术创新,这些企业可以显著降低成本,加快市场推广速度。」
产业调查显示,资料隐私与高昂成本是企业迟迟不采用 AI 技术的主要因素之一。如果 DeepSeek-R1 的优势能够得到验证,将可迅速消除这些顾虑,并解决更多 AI 应用的难题。
印度政府目前也在推动 AI 晶片的补助计划,以帮助学术界与新创企业发展 AI 模型。
此外,印度 IT 服务公司也可能间接受益于 DeepSeek。分析师预计,这些 IT 公司的大型企业客户可能会将部分预算从 AI 研发转向其他 IT 领域。