中国AI初创企业在芯片限制下逆势崛起:技术创新与挑战并存尽管面临美国对尖端芯片的出口限制,中国人工智能初创企业在追赶美国领先AI模型方面展现出令人瞩目的速度,其发展态势超出了许多业内人士的预期。本文将深入探讨中国AI初创企业如何在重重限制下取得进展,以及它们面临的挑战与机遇
尽管面临美国对尖端芯片的出口限制,中国人工智能初创企业在追赶美国领先AI模型方面展现出令人瞩目的速度,其发展态势超出了许多业内人士的预期。本文将深入探讨中国AI初创企业如何在重重限制下取得进展,以及它们面临的挑战与机遇。
北京DeepSeek公司于今年11月发布的最新大型语言模型预览版,据称其能力可与OpenAI于9月发布的推理模型o1预览版相媲美。这一消息并非个例,其他中国公司也纷纷发布了类似的声明。阿里巴巴和腾讯支持的初创企业月之暗面表示,其专注于数学的模型性能接近o1模型;阿里巴巴更是宣称其实验性研究模型在数学领域的表现甚至优于o1预览版。
然而,需谨慎对待这些说法。目前,这些公司尚未发布详细论证其模型性能的论文,且人工智能模型能力缺乏统一的测试标准,因此很难客观验证这些声明的准确性。尽管如此,一些美国专家对中国模型的表现给予了肯定。OpenAI前研究员、现人工智能企业家安德鲁·卡尔(Andrew Carr)指出,中国人工智能领域正在“快速追赶”,DeepSeek团队在短短几个月内成功复制OpenAI的推理模型,令许多同行惊讶。
美国数学邀请赛(AIME)是评估模型性能的一个常用测试。DeepSeek声称其模型在AIME测试中的表现优于OpenAI。但美国媒体对今年AIME的15道试题进行的实验表明,虽然OpenAI的o1预览模型在解题速度上领先于DeepSeek、月之暗面及阿里巴巴的实验模型,但所有模型都能在首次尝试中给出正确答案,这本身已是一项显著成就。例如,在一个关于双人游戏策略的字谜问题上,OpenAI程序仅用10秒便得出答案,而DeepSeek则耗时两分多钟。
自2022年以来,中国人工智能开发人员受到美国对尖端AI芯片(例如英伟达的高性能芯片)出口限制的影响,今年12月,拜登政府进一步收紧了出口管制政策。然而,中国开发人员展现出强大的创新能力,找到了应对之策。
月之暗面创始人杨植麟表示,公司专注于强化学习,通过模仿人类的试错过程来提高模型性能,从而降低对计算资源的需求,并提升模型能力。此外,自去年年底以来,“混合专家”(MoE)技术也得到了越来越多的应用。MoE技术通过初始路由机制将特定问题分配给最擅长处理该类问题的专家模型,类似于餐厅厨师长根据订单分配菜品给不同厨师,从而有效降低了对高性能芯片的依赖。腾讯在今年11月宣布,其最新发布的MoE模型性能可与Meta今年7月推出的Llama 3.1模型相媲美。但美国研究人员通过审阅两家公司发表的论文指出,腾讯的模型可能仅使用了Meta模型十分之一的计算资源完成训练。
DeepSeek最初是High-Flyer(一家管理着80亿美元资产的量化对冲基金管理公司)旗下的人工智能研究部门。2021年,DeepSeek连接约1万颗英伟达A100芯片,构建了名为Fire-Flyer2的AI训练集群。DeepSeek在今年8月发表的一篇论文中表示,Fire-Flyer2的性能接近英伟达相似芯片构成的系统,但成本和能耗显著降低。此外,DeepSeek在5月发布的关于其MoE模型的论文,因采用更高效的数据处理技术而备受关注。Anthropic联合创始人杰克·克拉克(Jack Clark)在其博客中提到,DeepSeek的Fire-Flyer2集群是中国应对出口管制的一个典型策略,认为中国通过构建卓越的软件与硬件堆栈绕过了出口管制,并在人工智能模型领域展现出强大的竞争力。
尽管如此,许多中国AI开发者仍然通过中间商交易和海外数据中心获取受限制的英伟达芯片。然而,中国公司高管指出,尖端芯片的短缺依然是限制初创企业发展的主要瓶颈,而这一差距可能进一步扩大。目前,英伟达的客户正在准备大规模部署其最新的AI数据中心芯片Blackwell。
在国际竞争中,美国企业持续加大投入。埃隆·马斯克(Elon Musk)旗下的xAI已建成一个由10万颗英伟达芯片组成的数据中心,并筹集了50亿美元用于进一步扩展;亚马逊AWS也计划使用数十万颗自主研发的芯片,打造一台规模空前的人工智能超级计算机。
DeepSeek专注于开源模型研究,特别侧重数学和编程能力;月之暗面则凭借其类似ChatGPT的聊天机器人Kimi,成功吸引了中国消费者,并因其出色的长文本处理能力而声名鹊起。然而,与OpenAI等美国公司相比,中国AI初创企业的估值仍然相对较低。OpenAI最近的估值已高达1570亿美元,而中国初创企业则面临融资挑战。
激烈的市场竞争也导致AI模型供应商之间爆发价格战。以北京为基地的智谱AI为例,据知情人士透露,该公司已推迟最早在2025年下半年上市的计划,因为投资银行家认为其可能难以获得预期估值。在最新一轮融资中,智谱AI的估值约为30亿美元。值得注意的是,智谱AI于11月底展示了其AI智能体,并于7月推出了一款与OpenAI Sora相似的视频生成模型。
曾在中国一家AI公司负责基础设施的高管霍华德·黄(Howard Huang)将中国的人工智能行业形容为“戴着镣铐跳舞”,他认为专注于擅长的领域是唯一的生存机会,也可能是他们在全球竞争中取胜的关键。
综上所述,中国AI初创企业在芯片限制下取得的进展令人印象深刻,它们通过技术创新和策略调整,积极应对挑战。然而,尖端芯片的短缺、估值相对较低以及激烈的市场竞争,仍然是摆在这些企业面前的巨大挑战。未来,它们能否在全球AI竞争中占据一席之地,仍需时间的检验。
标签: 中国 AI 初创 企业 芯片 限制 逆势 崛起 技术创新
声明:本文内容来源自网络,文字、图片等素材版权属于原作者,平台转载素材出于传递更多信息,文章内容仅供参考与学习,切勿作为商业目的使用。如果侵害了您的合法权益,请您及时与我们联系,我们会在第一时间进行处理!我们尊重版权,也致力于保护版权,站搜网感谢您的分享!