从威尔・史密斯鬼畜吃面到「Her」,AI视频时代的到来Zheng Suncong

从威尔・史密斯鬼畜吃面到「Her」,AI视频时代的到来

2 years ago
本期播客将深入探讨AI技术在视频生成领域的突破,以及如何推动我们进入一个全新的视频时代。

Scripts

h

Leo

大家好,欢迎收听本期播客!今天我们将聊聊AI技术如何推动视频生成的发展。从威尔・史密斯的鬼畜视频到如今的高质量影片,AI正在改变我们对视频的理解。

g

张倩

是的,Leo,随着技术的进步,我们可以看到AI视频生成的效果越来越惊艳。比如字节跳动的豆包视频生成模型,它能够生成质量媲美电影的视频,真让人惊叹。

h

Leo

我记得在这之前,AI视频生成的效果常常很卡通化,表情和动作看起来都很不自然。但现在,这些模型能够捕捉到人类的细腻表情和动作,真是跨越了一大步!

g

张倩

没错,不过这背后也面临着一些挑战,比如算力和编解码的问题。我们需要更多的计算资源来处理这些视频数据,这使得训练和推理的成本也大幅上升。

h

Leo

对,算力的需求确实是一个大问题。Sora模型的训练算力需求甚至是GPT-4的4.5倍,推理需求接近400倍,这让很多企业感到压力山大!

g

张倩

而且在编解码方面,传统技术面临着巨大的挑战。视频编码和解码的效率直接影响视频质量和存储需求,这是一个必须解决的问题。

h

Leo

我听说火山引擎在这方面也有不少进展。他们推出了一款视频转码专用芯片,能够显著提高效率,减少成本,这无疑是个好消息。

g

张倩

是的,BVC2智能混合编解码方案在比赛中也取得了优异成绩,这证明了他们在高码率和低码率视频压缩中的优势。

h

Leo

更重要的是,BMF框架在豆包视频生成模型中的应用,它帮助团队解决了很多挑战,特别是在视频数据的预处理上,这是一个非常关键的环节。

g

张倩

没错,BMF框架不仅提高了处理效率,还允许团队迅速迭代开发,这对于模型的训练和优化至关重要。

h

Leo

视频正逐渐成为我们交流的一种新方式,火山引擎也在推出类似「Her」的实时交互解决方案,让用户和AI可以实时对话,这在教育和智能助手领域都有着广泛的应用潜力。

g

张倩

确实,视频的表达方式丰富而生动,正如火山引擎总裁所说,视频正在迅速崛起为人类的第二语言。通过这些技术,我们的交流方式会变得更加多元化。

Participants

L

Leo

播客主持人

张倩

AI专家

Topics

  • AI技术
  • 视频生成
  • 深度学习
  • 编解码技术