国产大模型,什么时候能搞出 Sora ?

admin 2024年3月4日00:48:19评论14 views字数 2633阅读8分46秒阅读模式
国产大模型,什么时候能搞出 Sora ?
来源:技术领导力

全文共 2828 个字,建议阅读5分钟

导读:几天AIGC圈子炸了,OpenAI发布了文生视频模型Sora,给本来就火热的AIGC赛道,又添了一把柴火。Sora模型生成的视频质量和真实度,都达到了前所未有的高度。

360董事长周鸿祎感慨地说,Sora的出现意味着AGI的实现从十年缩短到一两年。那Sora的出现意味着中美两国在AI领域的差距越来越大吗?国产大模型聚焦应用难道错了吗?中国版的Sora,还要多久?下面谈谈我的看法。


01

Sora发布,多模态大战提速

大模型本质上是世界模型,代表着AI对人类世界的认知。以文字生成为例,大模型不是简单预测下一个最有可能出现的文字是什么,而是基于海量知识预训练的结果,理解人类输入文字的语义,然后给出基于对世界认知的答案。

相对于文字和图片处理来说,视频所包含的信息量更丰富,这就意味着需要耗费更大的算力来训练,工程复杂度也较高。

国产大模型,什么时候能搞出 Sora ?

1)文生视频是大模型的“最后一块拼图”

如果说AIGC是AI技术领域的皇冠,那么文生视频就是皇冠上的宝石。Sora的出现,好比视频领域的GPT-3时刻的到来,这是具有颠覆性的事件,它完成了大模型技术的最后一块拼图,标志着大模型的竞争进入到了比拼多模态的阶段。

2)为什么Sora加速了AGI的实现

如周鸿祎所说:“Sora只是小试牛刀,它展现的不仅仅是一个视频制作的能力,而是大模型对真实世界有了理解和模拟之后,会带来新的成果和突破。有强劲的大模型做底子,基于对人类语言的理解、对人类知识和世界模型的了解,我们距离AIGC的实现将越来越近。”

基于这些理解,不难得出结论:接下来的大模型之战,谁能打赢多模态这场战役,就有可能赢得整个战争。


02

中美在AI领域的差距,正在加大吗?

业内的观点普遍认为,Sora的出现说明在AI领域,中美的差距正在加大。我却有不同看法,先来聊聊美国的大模型。

1)美国大模型搞到什么程度了?

根据公开数据,到2023年5月,美国10亿级参数规模以上的基础大模型就已突破100 个,也是妥妥的“百模大战”。高盛预测,美国2025年大模型相关投资可达千亿美元,约全球的1/2。从资金投入上看,美国也是遥遥领先的。

除了ChatGPT之外,美国具有代表性的通用大模型公司有:Anthropic、Cohere、Google、Meta等。

美国大模型的行业应用方面,主要集中在金融、医疗、教育等领域。比如:在线教育组织Khan Academy于4月发布的基于GPT-4模型的AI助教Khanmigo,并且已经实现商业化。还有谷歌的Med-PaLM2,它在美国医师执照考试(USMLE)中获得85分以上。

2)国产大模型,现状盘点

据不完全统计,2023年中国约有300多家公司先后发布了大模型。一类是头部科技企业,如:阿里、百度、腾讯、华为等;以及新创立的公司,如:智谱AI、百川智能、MiniMax等;还有传统AI企业,如:科大讯飞、商汤科技等。许多高校研究院,如:清华、复旦、中科院等,也都已经深度布局大模型。

中国的大模型公司很多是从产业端实战出来的,这跟美国从实验室里孵化成熟再推出的做法是有所区别的。比如:阿里、百度、腾讯的大模型应用在了广告推送、图像识别、内容分发等业务场景上,你能感知到广告推送越来越准了,视频和图文推荐越来越好看了,这背后就是大模型的功劳。

3)中美大模型,差距在加大吗?

据《金融时报》报道,中国已在全球前10的大模型研发机构中占据4席,分别是百度、BAAI智源研究院、清华大学以及阿里巴巴研究院。

百度的“文心一言”、阿里巴巴的“通义千问”等都是我国自研的大模型,其性能以及各项测评指标,跟美国大模型可以一较高下。

个人认为,相对来说美国企业更加重视底层研发能力,中国企业更偏框架、行业应用层面的研发。也就是说,以ChatGPT-4、Sora为代表的基础大模型方面,美国具备一定的技术领先优势。但是在大模型的AI应用和行业解决方案方面,中国有着更广阔的市场和丰富的应用场景

因此,从整体大模型发展来看,其实很难做到Apple to Apple的比较,而大模型很重要的特征是:应用和技术的双轮驱动。也就是说,大模型应用产生的数据反哺模型本身,形成一个正反馈,不断迭代发展,最终倒逼底层技术的突破。从长远来看,中国的基础大模型技术赶超美国只是时间问题。

这不是盲目乐观,只要回顾一下中国互联网发展史就很清晰了:PC时代的电商系统,移动时代的支付、打车、外卖,都经历过这样的技术演进过程。从全世界范围来看,也只有中国才有“12306”全民秒杀火车票、春节十几亿人抢红包这样的场景。中国互联网经过20多年的野蛮生长,场景应用倒逼底层技术突破,时至今日我们打造出世界领先的电商系统、支付系统、分布式技术、数据存储技术。中国的大模型正在经历同样的过程。


03

中国版的Sora,还需要多久?

这是许多业内人最关心的问题,中国版的Sora,究竟还需要多久?

1)“他们996搞了1年”,我们需要多久?

根据AI研究领域大神谢赛宁透露,他的好友Bill Peebles也就是Sora的领队,整整高强度工作了一年,最终发布了这个惊艳世界的视频模型。

谢赛宁表示,对于Sora这样复杂的系统,人才第一,数据第二,算力第三,其他都没有什么是不可替代的。对于中国科技巨头来说,以上三个条件都是具备的,剩下的也只是时间问题。

我问了几位大厂的朋友,得到的回复是“在搞了”,都处于保密状态,个人感觉应该就是这几个月吧。

2)中国版Sora最大的挑战

比起问“我们什么时候能搞出中国版Sora?”,也许我们更应该问“当中国版Sora出现的时候,我们是否准备好了?” 在不久的将来,如美剧《黑镜》这样的故事情节即将成为现实,如何保护个人信息和隐私不被恶意使用和传播?如何防止某些组织从中非法牟利?都需要有一个成熟完善的监控体系。


结束语

追赶这一波潮流不仅仅在于技术突破,更在于我们对未来的准备。国产大模型的发展不只是技术的竞争,也是对世界认知和文化的较量。

技术进步带来的不仅是便利,也有伦理、法律和社会挑战。在追求技术创新的同时,我们更应思考如何让这些技术服务于社会,如何在科技创新与秩序之间找到平衡。

相信国产大模型会越来越好,更深度地参与和引领这场AI技术革命,成为推动人类文明进步的重要力量。

作者| Mr.K, 来源| 技术领导力(ID:jishulingdaoli)

原文始发于微信公众号(谈数据):国产大模型,什么时候能搞出 Sora ?

  • 左青龙
  • 微信扫一扫
  • weinxin
  • 右白虎
  • 微信扫一扫
  • weinxin
admin
  • 本文由 发表于 2024年3月4日00:48:19
  • 转载请保留本文链接(CN-SEC中文网:感谢原作者辛苦付出):
                   国产大模型,什么时候能搞出 Sora ?https://cn-sec.com/archives/2543415.html

发表评论

匿名网友 填写信息