谷歌Veo 3重磅升级:单张图片秒变8秒视频,还能自动配音!
人工智能技术日新月异,视频生成领域更是发展迅速。今天,我们将带您深入了解谷歌最新迭代的AI视频生成模型—— Veo 3 。它不仅能让您从一张简单的静态图片创作出富有动态的短视频,甚至还能为其配上AI生成的音效和语音,极大地拓宽了创意表达的可能性。 什么是谷歌Veo 3? Veo 3是谷歌推出的一款 视频生成AI模型 。它在今年五月的年度I/O开发者大会上首次亮相,一经发布就因其 能无缝集成AI生成的视频和音频 的能力,吸引了众多AI研究人员和创意专业人士的关注。这是一项技术上非常复杂的成就,预示着AI辅助电影制作的新篇章。Veo 3在 模拟真实世界物理效果 方面表现出色,并且没有早期AI视频工具中常见的技术故障。 核心新功能:图片生成视频,自带音效 Veo 3的最新升级带来了一项令人兴奋的功能:用户现在可以 从一张静态图片生成长达八秒的视频短片 。更厉害的是,这些视频还会 自动包含AI生成的音频 。这意味着您不再需要额外的工具来为视频添加环境音或语音。根据谷歌云最新的文档更新,这项功能目前已作为“预览版”提供。谷歌实验室和Gemini应用程序负责人乔什·伍德沃德(Josh Woodward)此前也在X平台上透露,公司正在为Veo 3开发图片转视频的功能。 Veo 3的实用场景与应用前景 这项新功能为各行各业的创意专业人士提供了巨大的便利,能够 节省大量本用于组织实地视频拍摄的时间和资源 。它还能为社交媒体及其他渠道提供更多创意素材。 对于内容创作者和网红: 例如,一位网红可以上传一张自己的大头照,然后指示模型生成一段她身穿合作品牌产品走T台的短片。 Veo 3会自动添加环境音,比如人群的喧哗声和她的脚步声。 用户甚至可以要求AI生成的形象说几句台词。 对于品牌和广告商: 品牌可以向模型提供一张产品图片,并要求生成一段从不同角度展示产品的视频短片。 亚马逊也开发了类似的AI工具供广告商使用。 Meta更是宣称计划自动化整个广告制作流程。 未来展望: 谷歌DeepMind首席执行官戴米斯·哈萨比斯(Demis Hassabis)曾暗示,Veo 3未来可能被用于 生成视频游戏的虚拟世界 。 如何使用Veo 3? 最初,Veo 3只能通过Gemini Ultra和Flow使用。但现在,它已于上月作为 公开预览版 全面发布。所有谷歌云客户和合作伙伴都可以在 Vertex AI Media Studio 中访问它。目前,该模型已在 159个国家 上线。 需…