国产大模型，什么时候能搞出 Sora ？

admin

140350
文章

117
评论

2024年3月4日00:48:19评论32 views字数 2633阅读8分46秒阅读模式

来源：技术领导力

全文共 2828 个字，建议阅读5分钟

导读：几天AIGC圈子炸了，OpenAI发布了文生视频模型Sora，给本来就火热的AIGC赛道，又添了一把柴火。Sora模型生成的视频质量和真实度，都达到了前所未有的高度。

360董事长周鸿祎感慨地说，Sora的出现意味着AGI的实现从十年缩短到一两年。那Sora的出现意味着中美两国在AI领域的差距越来越大吗？国产大模型聚焦应用难道错了吗？中国版的Sora，还要多久？下面谈谈我的看法。

Sora发布，多模态大战提速

大模型本质上是世界模型，代表着AI对人类世界的认知。以文字生成为例，大模型不是简单预测下一个最有可能出现的文字是什么，而是基于海量知识预训练的结果，理解人类输入文字的语义，然后给出基于对世界认知的答案。

相对于文字和图片处理来说，视频所包含的信息量更丰富，这就意味着需要耗费更大的算力来训练，工程复杂度也较高。

国产大模型，什么时候能搞出 Sora ？

1）文生视频是大模型的“最后一块拼图”

如果说AIGC是AI技术领域的皇冠，那么文生视频就是皇冠上的宝石。Sora的出现，好比视频领域的GPT-3时刻的到来，这是具有颠覆性的事件，它完成了大模型技术的最后一块拼图，标志着大模型的竞争进入到了比拼多模态的阶段。

2）为什么Sora加速了AGI的实现

如周鸿祎所说：“Sora只是小试牛刀，它展现的不仅仅是一个视频制作的能力，而是大模型对真实世界有了理解和模拟之后，会带来新的成果和突破。有强劲的大模型做底子，基于对人类语言的理解、对人类知识和世界模型的了解，我们距离AIGC的实现将越来越近。”

基于这些理解，不难得出结论：接下来的大模型之战，谁能打赢多模态这场战役，就有可能赢得整个战争。

中美在AI领域的差距，正在加大吗？

业内的观点普遍认为，Sora的出现说明在AI领域，中美的差距正在加大。我却有不同看法，先来聊聊美国的大模型。

1）美国大模型搞到什么程度了？

根据公开数据，到2023年5月，美国10亿级参数规模以上的基础大模型就已突破100 个，也是妥妥的“百模大战”。高盛预测，美国2025年大模型相关投资可达千亿美元，约全球的1/2。从资金投入上看，美国也是遥遥领先的。

除了ChatGPT之外，美国具有代表性的通用大模型公司有：Anthropic、Cohere、Google、Meta等。

美国大模型的行业应用方面，主要集中在金融、医疗、教育等领域。比如：在线教育组织Khan Academy于4月发布的基于GPT-4模型的AI助教Khanmigo，并且已经实现商业化。还有谷歌的Med-PaLM2，它在美国医师执照考试（USMLE）中获得85分以上。

2）国产大模型，现状盘点

据不完全统计，2023年中国约有300多家公司先后发布了大模型。一类是头部科技企业，如：阿里、百度、腾讯、华为等；以及新创立的公司，如：智谱AI、百川智能、MiniMax等；还有传统AI企业，如：科大讯飞、商汤科技等。许多高校研究院，如：清华、复旦、中科院等，也都已经深度布局大模型。

中国的大模型公司很多是从产业端实战出来的，这跟美国从实验室里孵化成熟再推出的做法是有所区别的。比如：阿里、百度、腾讯的大模型应用在了广告推送、图像识别、内容分发等业务场景上，你能感知到广告推送越来越准了，视频和图文推荐越来越好看了，这背后就是大模型的功劳。

3）中美大模型，差距在加大吗？

据《金融时报》报道，中国已在全球前10的大模型研发机构中占据4席，分别是百度、BAAI智源研究院、清华大学以及阿里巴巴研究院。

百度的“文心一言”、阿里巴巴的“通义千问”等都是我国自研的大模型，其性能以及各项测评指标，跟美国大模型可以一较高下。

个人认为，相对来说美国企业更加重视底层研发能力，中国企业更偏框架、行业应用层面的研发。也就是说，以ChatGPT-4、Sora为代表的基础大模型方面，美国具备一定的技术领先优势。但是在大模型的AI应用和行业解决方案方面，中国有着更广阔的市场和丰富的应用场景。

因此，从整体大模型发展来看，其实很难做到Apple to Apple的比较，而大模型很重要的特征是：应用和技术的双轮驱动。也就是说，大模型应用产生的数据反哺模型本身，形成一个正反馈，不断迭代发展，最终倒逼底层技术的突破。从长远来看，中国的基础大模型技术赶超美国只是时间问题。

这不是盲目乐观，只要回顾一下中国互联网发展史就很清晰了：PC时代的电商系统，移动时代的支付、打车、外卖，都经历过这样的技术演进过程。从全世界范围来看，也只有中国才有“12306”全民秒杀火车票、春节十几亿人抢红包这样的场景。中国互联网经过20多年的野蛮生长，场景应用倒逼底层技术突破，时至今日我们打造出世界领先的电商系统、支付系统、分布式技术、数据存储技术。中国的大模型正在经历同样的过程。

中国版的Sora，还需要多久？

这是许多业内人最关心的问题，中国版的Sora，究竟还需要多久？

1）“他们996搞了1年”，我们需要多久？

根据AI研究领域大神谢赛宁透露，他的好友Bill Peebles也就是Sora的领队，整整高强度工作了一年，最终发布了这个惊艳世界的视频模型。

谢赛宁表示，对于Sora这样复杂的系统，人才第一，数据第二，算力第三，其他都没有什么是不可替代的。对于中国科技巨头来说，以上三个条件都是具备的，剩下的也只是时间问题。

我问了几位大厂的朋友，得到的回复是“在搞了”，都处于保密状态，个人感觉应该就是这几个月吧。

2）中国版Sora最大的挑战

比起问“我们什么时候能搞出中国版Sora？”，也许我们更应该问“当中国版Sora出现的时候，我们是否准备好了？” 在不久的将来，如美剧《黑镜》这样的故事情节即将成为现实，如何保护个人信息和隐私不被恶意使用和传播？如何防止某些组织从中非法牟利？都需要有一个成熟完善的监控体系。

结束语

追赶这一波潮流不仅仅在于技术突破，更在于我们对未来的准备。国产大模型的发展不只是技术的竞争，也是对世界认知和文化的较量。

技术进步带来的不仅是便利，也有伦理、法律和社会挑战。在追求技术创新的同时，我们更应思考如何让这些技术服务于社会，如何在科技创新与秩序之间找到平衡。

相信国产大模型会越来越好，更深度地参与和引领这场AI技术革命，成为推动人类文明进步的重要力量。

作者| Mr.K，来源| 技术领导力(ID：jishulingdaoli)

原文始发于微信公众号（谈数据）：国产大模型，什么时候能搞出 Sora ？

免责声明:文章中涉及的程序(方法)可能带有攻击性，仅供安全研究与教学之用，读者将其信息做其他用途，由读者承担全部法律及连带责任，本站不承担任何法律及连带责任；如有问题可邮件联系(建议使用企业邮箱或有效邮箱,避免邮件被拦截，联系方式见首页)，望知悉。

左青龙
微信扫一扫

右白虎
微信扫一扫

国产大模型，什么时候能搞出 Sora ？

开源情报技巧：解构环境犯罪背后的金融网络

美国议员批评英国对苹果的后门命令，并警告网络犯罪风险

TransparentTribe针对阿富汗监狱管理局的鱼叉式钓鱼邮件攻击

关于MCP最值得看的一篇：MCP创造者聊MCP的起源、架构优势和未来

G.O.S.S.I.P 阅读推荐 2025-05-08 IPvSeeYou

以色列NSO集团因攻击WhatsApp用户被判赔偿逾1.67亿美元

打穿系统是风险，那打垮人呢？——年年演练零误报，年年有人没能等到尾款和复盘

美国警告：黑客瞄准油气行业工业控制系统与监控数据采集系统

【戏说我在甲方做安全】聊蜜罐合作，结果甲方被乙方骂了

Panabit VLAN这样玩才高效：从透明网桥到网关模式的实战踩坑指南

发表评论

在线咨询

微信