Pika推出新功能:视频与音效无缝融合

今日,Pika实验室宣布一项创新功能,允许用户为其视频内容无缝生成音效。这一新功能名为Sound ,旨在通过AI技术,根据视频内容自动匹配合适的音效,或根据用户描述生成特定声音。

用户现在有两种方式来生成音效:一是提供一句描述声音的,二是让Pika根据视频内容自动生成音效。Pika表示,如果用户对音效感到满意,那是因为其确实出色。

皮卡丘_Pika_pikapika官网入口

为展示新功能,Pika官网已发布多个demo。例如,无需任何,AI能够观看烤培根的视频并配上合适的音效。另一种情况是,用户给出如“超饱和色彩,日落时田野上的烟火”的描述,Pika便能生成与之匹配的声音。

这一新功能的发布,让网友们对Pika的创新能力赞不绝口。有人认为,Pika正在为多模态AI创作收集所有的“无限宝石”。

操作方面,Pika的Sound 功能极其简单。用户只需在生成视频时开启“Sound ”按钮,或在视频生成后单独为其配音。目前,该功能仅对超级合作者和Pro用户开放测试,但Pika表示将很快向所有用户推出。

尽管Pika未公开Sound 背后的原理,但此前类似的配音功能已有先例。英伟达高级科学家Jim Fan曾分析,AI学习准确的视频到音频映射需要对潜在空间中的物理进行建模。这涉及识别物体类别、材料、空间位置,以及环境等。

在多模态AI领域,LeCun认为,如果不让机器从高带宽的感官输入(如视觉)中学习,我们无法达到人类水平的人工智能。这一观点引发了人们的关注和讨论。

和讯自选股写手

风险提示:以上内容仅作为作者或者嘉宾的观点,不代表和讯的任何立场,不构成与和讯相关的任何投资建议。在作出任何投资决定前,投资者应根据自身情况考虑投资产品相关的风险因素,并于需要时咨询专业投资顾问意见。和讯竭力但不能证实上述内容的真实性、准确性和原创性,对此和讯不做任何保证和承诺。