近期,一股“来自东方的神秘力量”成为了硅谷乃至全世界科技人士热议的话题。引爆这场讨论的是中国人工智能初创企业深度求索(DeepSeek),其中低成本、高性能、开源是海外媒体和业内人士谈论的高频词语。那么,我们该如何看待DeepSeek的横空出世?
DeepSeek,全称杭州深度求索人工智能基础技术研究有限公司,成立于2023年7月,是一家创新型科技公司,专注于开发先进的大语言模型(LLM)和相关技术。
1月20日,该企业正式发布推理大模型DeepSeek-R1,一经推出就震动美国科技股;1月27日,DeepSeek应用登顶苹果中国区和美国区应用商店免费App下载排行榜;1月31日,英伟达、亚马逊和微软三家巨头企业,在同一天宣布接入DeepSeek-R1……这些现象的背后又有哪些启示?
低成本与高性能。从性能上看,DeepSeek-R1可比肩OpenAI o1,但AI模型的训练成本大幅降低。据报道,R1模型的训练成本仅为557.6万美元。相比之下,OpenAI的GPT模型训练成本高达1亿美元。当前,DeepSeek应用程序已取代OpenAI的ChatGPT,成为美国苹果应用商店下载量最大的免费应用程序。
打破“规则“。目前,“买芯片堆算力”已成为全球人工智能产业长期以来的路径依赖。而来自中国的初创企业却以“四两拨千斤”的方式,用相对低性能的芯片实现了人工智能性能的追赶。此外,在算法训练方面,有别于OpenAI的“题海战术”,DeepSeek的训练则更精准,用算法先行一步做好归类,再输送给大模型。更重要的是,这一成就是在美国对华芯片出口管制加强的背景下实现的。因此,在动辄数亿或数十亿美元的人工智能产业,DeepSeek的表现引发硅谷震动。据报道,当地时间1月27日,美国芯片巨头英伟达(NVIDIA)股价暴跌约17%,博通公司股价下跌17%,超威半导体公司(AMD)股价下跌6%,微软股价下跌2%。此外,人工智能领域的衍生品,如电力供应商也受到重创。美国联合能源公司股价下跌21%,Vistra的股价下跌29%。
完全开源。除了极致性价比,让DeepSeek的大模型脱颖而出的是其代码和训练方法的完全开源。开源策略可以形成一个强大的技术社区。目前,DeepSeek-R1已成为开源社区Hugging Face上下载量最高的大模型,下载量达10.9万次,这意味着全球的开发人员正在试图了解这一模型以辅助他们自己的AI开发。正如DeepSeek创始人梁文锋表示:“我们不过是站在开源社区巨人们的肩膀上,给国产大模型这栋大厦多拧了几颗螺丝。”
值得一提的是,火爆出圈的DeepSeek遭遇到华为等中国企业同等境遇。近日,多国宣布对该软件使用设限,其中在意大利的苹果和谷歌应用商店中已无法下载DeepSeek的应用。对此,日本内阁官房长官林芳正在近日的记者会上表示:“未听说个人信息保护委员会确定特别应对方针。”他还指出:“将密切关注AI相关国际开发动向等,采取妥善应对措施。”
技术始终是服务于人。开源是世界大同的美好愿望。各国科技发展与全体人类前途正在实现双向奔赴,尽管“小院高墙”林立,都无法阻止科技发展的步伐。