如何看待DeepSeek横空出世？

时间：1738914475154 来源：东方新报原创

作者：言果

近期，一股“来自东方的神秘力量”成为了硅谷乃至全世界科技人士热议的话题。引爆这场讨论的是中国人工智能初创企业深度求索（DeepSeek），其中低成本、高性能、开源是海外媒体和业内人士谈论的高频词语。那么，我们该如何看待DeepSeek的横空出世？

DeepSeek，全称杭州深度求索人工智能基础技术研究有限公司，成立于2023年7月，是一家创新型科技公司，专注于开发先进的大语言模型（LLM）和相关技术。

1月20日，该企业正式发布推理大模型DeepSeek-R1，一经推出就震动美国科技股；1月27日，DeepSeek应用登顶苹果中国区和美国区应用商店免费App下载排行榜；1月31日，英伟达、亚马逊和微软三家巨头企业，在同一天宣布接入DeepSeek-R1……这些现象的背后又有哪些启示？

低成本与高性能。从性能上看，DeepSeek-R1可比肩OpenAI o1，但AI模型的训练成本大幅降低。据报道，R1模型的训练成本仅为557.6万美元。相比之下，OpenAI的GPT模型训练成本高达1亿美元。当前，DeepSeek应用程序已取代OpenAI的ChatGPT，成为美国苹果应用商店下载量最大的免费应用程序。

打破“规则“。目前，“买芯片堆算力”已成为全球人工智能产业长期以来的路径依赖。而来自中国的初创企业却以“四两拨千斤”的方式，用相对低性能的芯片实现了人工智能性能的追赶。此外，在算法训练方面，有别于OpenAI的“题海战术”，DeepSeek的训练则更精准，用算法先行一步做好归类，再输送给大模型。更重要的是，这一成就是在美国对华芯片出口管制加强的背景下实现的。因此，在动辄数亿或数十亿美元的人工智能产业，DeepSeek的表现引发硅谷震动。据报道，当地时间1月27日，美国芯片巨头英伟达（NVIDIA）股价暴跌约17%，博通公司股价下跌17%，超威半导体公司（AMD）股价下跌6%，微软股价下跌2%。此外，人工智能领域的衍生品，如电力供应商也受到重创。美国联合能源公司股价下跌21%，Vistra的股价下跌29%。

完全开源。除了极致性价比，让DeepSeek的大模型脱颖而出的是其代码和训练方法的完全开源。开源策略可以形成一个强大的技术社区。目前，DeepSeek-R1已成为开源社区Hugging Face上下载量最高的大模型，下载量达10.9万次，这意味着全球的开发人员正在试图了解这一模型以辅助他们自己的AI开发。正如DeepSeek创始人梁文锋表示：“我们不过是站在开源社区巨人们的肩膀上，给国产大模型这栋大厦多拧了几颗螺丝。”

值得一提的是，火爆出圈的DeepSeek遭遇到华为等中国企业同等境遇。近日，多国宣布对该软件使用设限，其中在意大利的苹果和谷歌应用商店中已无法下载DeepSeek的应用。对此，日本内阁官房长官林芳正在近日的记者会上表示：“未听说个人信息保护委员会确定特别应对方针。”他还指出：“将密切关注AI相关国际开发动向等，采取妥善应对措施。”

技术始终是服务于人。开源是世界大同的美好愿望。各国科技发展与全体人类前途正在实现双向奔赴，尽管“小院高墙”林立，都无法阻止科技发展的步伐。