未来,“智能”将贯穿视频行业,从创作,到运营,再到交互。
作者|刘景丰
编辑|栗子
自ChatGPT-3.5发布以来,AIGC如同打开了一扇创新之门,各种AI创新产品扑面而来:
能自主绘画创作的Midjourney,能自主修图的GenerativeFill,以及不断涌现的对话大模型……
单单对ChatGPT,也已经有数不清的玩法,比如让它编程、写文章、整理速记、做PPT等等;乃至最近,有人用一段提示词,将ChatGPT-4变成了一个无所不能的AI论文导师。
这些AI应用展现出的各种新奇能力,让人们看到了AI大模型的巨大力量——无论是科技大厂、创业公司,还是各垂直行业的科技公司,都争相涌入AI大模型的研发和应用,以期通过“自我革命”的方式,在接下来的AI大模型时代找到立足之地。
尽管当下人们对AI大模型热情似火,但是各家几乎都聚焦于文本、图片等模态下的AI能力构建,将AI能力应用于视频的少之又少。
6月13日,企业视频头部服务商保利威在「AI·重塑视界」AI战略发布会上,正式推出POLYVAI,将AIGC与视频直播结合,扩展出AI学习助手、智能数字人、智能会议纪要、智能制课、隐形溯源水印等多项AI新能力。
保利威相关负责人表示,AI大模型的能力在于它对内容的理解,以及对内容创作、内容生产带来的变革。这意味着,视频云厂商在提供产品的时候,可以将自己技术的能力、产品的能力,从视频播放延伸到视频的创作和运营上。
由此,直播也从交流传播形态,变成视频内容生产形态。
1.POLYVAI,一场对视频“从下到上”的整体变革很多人都能感受到,我们的工作、生活,已经从过去的文图时代,慢慢进入到视频时代。
尽管相比图文,视频的表现形式更生动,承载的信息更多,但视频的缺点也很明显——受众只能以单向传输方式被动接受信息,且只能按照视频播放速度掌握要点;更重要的是,一条高频质量视频的制作成本极其高昂,对于预算有限的企业或个人而言很难持续投入。
有什么办法可以解决这些难题呢?
答案正是当下最火热的AIGC。
不久前,保利威举办AI战略发布会。智能音视频实验室主任、中山大学博士、保利威首席科学家丁一提到,ChatGPT最显著的特点是拥有更强的语言生成和理解能力。
他称,“保利威从年就开始对AI保持密切