科学家开发DIRFA:输入图片和音频,可生成说话视频
智能科技 2023-11-17 user639632
11 月 17 日消息,来自新加坡南洋理工大学(NTU Singapore)的科研团队近日开发出了 DIRFA 工具,用户给一张图片以及音频内容,可以自动生成 3D 视频,并实现口型和声音的同步协调。
DIRFA 的全称为 DIverse yet Realistic Facial Animations,训练了超过 6000 多人的 100 万个视频片段,音频片段来自一个名为 VoxCeleb2 数据集的开源数据库,并关联面部表情和头部运动。
研究人员表示,DIRFA 可能会在包括医疗保健在内的各个行业和领域带来新的应用,因为它可以实现更复杂和逼真的虚拟助手和聊天机器人,从而改善用户体验。
DIRFA 还可以作为言语或面部残疾人士的强大工具,帮助他们通过富有表现力的头像或数字表示来传达他们的想法和情感,从而增强他们的沟通能力。
【来源:IT之家】
The End
相关阅读
- 拼多多Q1利润放缓背后:“千亿扶持”下电商西进为商家拓单显著
- 通用CEO:尽管2023年电动汽车产量有点令人失望,但已经做出了“实质性改变”
- 美团去年利润增至139亿元,王兴:未来新业务将减少补贴,出海不会疯狂投入
- 比亚迪宣布进入希腊 已拿下欧洲20个国家 开设超250家门店
- 宝马将在德国推出 L3 级自动驾驶系统:可边开车边看视频
- 三星Galaxy S23 FE手机渲染图曝光,显示有4种颜色
- 传谷歌同意向OpenAI竞争对手Anthropic至多投资20亿美元
- 回顾历代38款iPhone手机包装盒 哪款你觉得最经典?
- 经典游戏《上古卷轴5》设计师:B社引擎一直调整更新
- CES 2025见证科技创新新突破:海信洗衣机引领家电美学变革