谷歌Veo 3重磅升级:单张图片秒变8秒视频,还能自动配音!
人工智能技术日新月异,视频生成领域更是发展迅速。今天,我们将带您深入了解谷歌最新迭代的AI视频生成模型——Veo 3。它不仅能让您从一张简单的静态图片创作出富有动态的短视频,甚至还能为其配上AI生成的音效和语音,极大地拓宽了创意表达的可能性。
什么是谷歌Veo 3?
Veo 3是谷歌推出的一款视频生成AI模型。它在今年五月的年度I/O开发者大会上首次亮相,一经发布就因其能无缝集成AI生成的视频和音频的能力,吸引了众多AI研究人员和创意专业人士的关注。这是一项技术上非常复杂的成就,预示着AI辅助电影制作的新篇章。Veo 3在模拟真实世界物理效果方面表现出色,并且没有早期AI视频工具中常见的技术故障。
核心新功能:图片生成视频,自带音效
Veo 3的最新升级带来了一项令人兴奋的功能:用户现在可以从一张静态图片生成长达八秒的视频短片。更厉害的是,这些视频还会自动包含AI生成的音频。这意味着您不再需要额外的工具来为视频添加环境音或语音。根据谷歌云最新的文档更新,这项功能目前已作为“预览版”提供。谷歌实验室和Gemini应用程序负责人乔什·伍德沃德(Josh Woodward)此前也在X平台上透露,公司正在为Veo 3开发图片转视频的功能。
Veo 3的实用场景与应用前景
这项新功能为各行各业的创意专业人士提供了巨大的便利,能够节省大量本用于组织实地视频拍摄的时间和资源。它还能为社交媒体及其他渠道提供更多创意素材。
对于内容创作者和网红:
- 例如,一位网红可以上传一张自己的大头照,然后指示模型生成一段她身穿合作品牌产品走T台的短片。
- Veo 3会自动添加环境音,比如人群的喧哗声和她的脚步声。
- 用户甚至可以要求AI生成的形象说几句台词。
对于品牌和广告商:
- 品牌可以向模型提供一张产品图片,并要求生成一段从不同角度展示产品的视频短片。
- 亚马逊也开发了类似的AI工具供广告商使用。
- Meta更是宣称计划自动化整个广告制作流程。
未来展望:
- 谷歌DeepMind首席执行官戴米斯·哈萨比斯(Demis Hassabis)曾暗示,Veo 3未来可能被用于生成视频游戏的虚拟世界。
如何使用Veo 3?
最初,Veo 3只能通过Gemini Ultra和Flow使用。但现在,它已于上月作为公开预览版全面发布。所有谷歌云客户和合作伙伴都可以在Vertex AI Media Studio中访问它。目前,该模型已在159个国家上线。
需要注意的争议和潜在风险 尽管Veo 3功能强大,但它也引发了一些关于AI的担忧和潜在风险。
- 信息误导与社交媒体操纵: Veo 3引发了人们对AI可能加剧在线错误信息传播和在社交媒体上操纵用户的担忧。
- 训练数据来源与版权问题: 另一个关键问题是其训练数据的来源。哈萨比斯曾表示,训练数据可能包含YouTube视频。由于许多AI公司从开放的互联网上抓取文本、图像、音频和视频内容来训练其模型,这导致出版、艺术和电影等行业的创作者提出了版权问题。
- 如果您正在寻找一个在版权方面“更安全”的AI生成视频工具,可以考虑了解一下Moonvalley的Marey,它声称其模型完全基于授权数据进行训练。
总结
谷歌的Veo 3无疑是AI视频生成领域的一大飞跃,它将图片转视频的能力带到了一个全新的高度,并为创意专业人士和品牌提供了前所未有的工具。然而,在使用这项强大技术的同时,我们也必须警惕其潜在的风险,尤其是在信息传播和版权方面。未来,随着AI技术的不断发展,像Veo 3这样的工具无疑将继续改变我们创作和互动的方式。