科学家开发DIRFA:输入图片和音频,可生成说话视频
智能科技 2023-11-17 user639632
11 月 17 日消息,来自新加坡南洋理工大学(NTU Singapore)的科研团队近日开发出了 DIRFA 工具,用户给一张图片以及音频内容,可以自动生成 3D 视频,并实现口型和声音的同步协调。

DIRFA 的全称为 DIverse yet Realistic Facial Animations,训练了超过 6000 多人的 100 万个视频片段,音频片段来自一个名为 VoxCeleb2 数据集的开源数据库,并关联面部表情和头部运动。
研究人员表示,DIRFA 可能会在包括医疗保健在内的各个行业和领域带来新的应用,因为它可以实现更复杂和逼真的虚拟助手和聊天机器人,从而改善用户体验。
DIRFA 还可以作为言语或面部残疾人士的强大工具,帮助他们通过富有表现力的头像或数字表示来传达他们的想法和情感,从而增强他们的沟通能力。
【来源:IT之家】
The End
相关阅读
- 快手联合杜海涛打造独家求职直播IP《你的涛来了》,饶雪漫首场空降助力普通人职场圆梦
- 英伟达 RTX 4090 D 显卡发布,售价 12999 元
- 成分党实测!眼霜哪个品牌抗皱效果好?2026眼霜推荐:这两款比大牌更值得入
- 荣耀平板X9将采用旗舰级同款用料:金属一体机身设计
- 软银创始人孙正义:新一轮投资将致力于打造“超级人工智能”
- 2026网购车厘子买几勾的最好比较划算?2j3j4j5j最推荐买几j价格最便宜?
- 微信朋友圈评论新增表情包和图片功能
- 苹果Vision Pro将于2024年1月27日在美国上市
- 中国筹划小行星撞击试验,助力防御技术验证
- AIGC 风潮席卷手机:但在 PC 面前 还是个弟弟