AI革新影视产业：Pika推出革命性音效融合技术，引领多媒体内容创

Pika推出新功能：视频与音效无缝融合

今日，Pika实验室宣布一项创新功能，允许用户为其视频内容无缝生成音效。这一新功能名为Sound ，旨在通过AI技术，根据视频内容自动匹配合适的音效，或根据用户描述生成特定声音。

用户现在有两种方式来生成音效：一是提供一句描述声音的，二是让Pika根据视频内容自动生成音效。Pika表示，如果用户对音效感到满意，那是因为其确实出色。

皮卡丘_Pika_pikapika官网入口

为展示新功能，Pika官网已发布多个demo。例如，无需任何，AI能够观看烤培根的视频并配上合适的音效。另一种情况是，用户给出如“超饱和色彩，日落时田野上的烟火”的描述，Pika便能生成与之匹配的声音。

这一新功能的发布，让网友们对Pika的创新能力赞不绝口。有人认为，Pika正在为多模态AI创作收集所有的“无限宝石”。

操作方面，Pika的Sound 功能极其简单。用户只需在生成视频时开启“Sound ”按钮，或在视频生成后单独为其配音。目前，该功能仅对超级合作者和Pro用户开放测试，但Pika表示将很快向所有用户推出。

尽管Pika未公开Sound 背后的原理，但此前类似的配音功能已有先例。英伟达高级科学家Jim Fan曾分析，AI学习准确的视频到音频映射需要对潜在空间中的物理进行建模。这涉及识别物体类别、材料、空间位置，以及环境等。

在多模态AI领域，LeCun认为，如果不让机器从高带宽的感官输入（如视觉）中学习，我们无法达到人类水平的人工智能。这一观点引发了人们的关注和讨论。

和讯自选股写手

风险提示：以上内容仅作为作者或者嘉宾的观点，不代表和讯的任何立场，不构成与和讯相关的任何投资建议。在作出任何投资决定前，投资者应根据自身情况考虑投资产品相关的风险因素，并于需要时咨询专业投资顾问意见。和讯竭力但不能证实上述内容的真实性、准确性和原创性，对此和讯不做任何保证和承诺。

声明：本站所有文章，如无特殊说明或标注，均为本站原创发布。任何个人或组织，在未征得本站同意时，禁止复制、盗用、采集、发布本站内容到任何网站、书籍等各类媒体平台。如若本站内容侵犯了原著者的合法权益，请联系我们进行处理。