腾讯混元开源端到端 AI 模型 Hunyuan-Foley：视频 + 文字 =“电影级”音效

2025-08-28

腾讯混元开源端到端 AI 模型 Hunyuan-Foley：视频 + 文字 =“电影级”音效

IT之家 8 月 28 日消息，腾讯混元今天午间宣布开源端到端视频音效生成模型 Hunyuan-Foley，用户只需输入视频和文字，就能为视频匹配电影级音效。

根据官方介绍，HunyuanVideo-Foley 不仅打破了 AI 生成的视频只能“看”不能“听” 的局限，让无声 AI 视频成为历史，更是真正做到了“看懂画面、读懂文字、配准声音”，带来沉浸式视听体验。这款音效生成工具可广泛应用于短视频创作、电影制作、广告创意和游戏开发等场景。

文字描述：Engine revving loudly and accelerating.

文本描述：Rustling and crunching of leaves and twigs under the fox kit's paws.

混元团队开发了一个全面的数据处理管道，能够自动化标注和过滤收集的音视频数据，构建了约 10 万小时级的高质量 TV2A 数据集，为模型训练提供了强大支撑，使得模型拥有强大的泛化能力，能够在各种复杂的视频条件下生成音画一致、语义对齐的高质量音频，包括音效与背景音乐。生成的音频能够与无声视频相结合，极大提升了视频的真实感和沉浸感。

IT之家附有关链接如下：

体验入口：https://hunyuan.tencent.com/video/zh?tabIndex=0
项目官网：https://szczesnys.github.io/hunyuanvideo-foley/
代码：https://github.com/Tencent-Hunyuan/HunyuanVideo-Foley
技术报告：https://arxiv.org/abs/2508.16930
Hugging Face：https://huggingface.co/tencent/HunyuanVideo-Foley

广告声明：文内含有的对外跳转链接（包括不限于超链接、二维码、口令等形式），用于传递更多信息，节省甄选时间，结果仅供参考，IT之家所有文章均包含本声明。

来源于：https://www.ithome.com/0/878/633.htm 如有侵权请联系我们

腾讯混元开源端到端 AI 模型 Hunyuan-Foley：视频 + 文字 =“电影级”音效

最新发布

全新上汽奥迪A5L Sportback开启预售限时臻享26...

男子发评论被拘后翻案官方调查两年曲折终获清白

安吉丽娜·朱莉×道格·里曼！出演电影《主动出击》

莫迪与普京通话讨论俄乌冲突等问题重申和平解决立场

从 DeepSeek-V3 到 Kimi K2 ，一文看懂 ...

Category

Sports

Travel

Technology

热门

全新上汽奥迪A5L Sportback开...

男子发评论被拘后翻案官方调查两年曲折...

安吉丽娜·朱莉×道格·里曼！出演电影《主...

莫迪与普京通话讨论俄乌冲突等问题重申和...

从 DeepSeek-V3 到 Kimi...

全新上汽奥迪A5L Sportback开...

男子发评论被拘后翻案官方调查两年曲折...

安吉丽娜·朱莉×道格·里曼！出演电影《主...

莫迪与普京通话讨论俄乌冲突等问题重申和...

从 DeepSeek-V3 到 Kimi...

Tags

导航

友情链接

POPULAR NEWS

Ratcliffe to be of nation talent

Ratcliffe to be of nation talent

联系我们: 917345325@qq.com

内容详情

腾讯混元开源端到端 AI 模型 Hunyuan-Foley：视频 + 文字 =“电影级”音效

猜你喜欢

最新发布

Category

Sports

Travel

Technology

热门

Tags

导航

友情链接

POPULAR NEWS

联系我们: 917345325@qq.com