科学家开发DIRFA:输入图片和音频,可生成说话视频
智能科技 2023-11-172486user639632
11 月 17 日消息,来自新加坡南洋理工大学(NTU Singapore)的科研团队近日开发出了 DIRFA 工具,用户给一张图片以及音频内容,可以自动生成 3D 视频,并实现口型和声音的同步协调。
DIRFA 的全称为 DIverse yet Realistic Facial Animations,训练了超过 6000 多人的 100 万个视频片段,音频片段来自一个名为 VoxCeleb2 数据集的开源数据库,并关联面部表情和头部运动。
研究人员表示,DIRFA 可能会在包括医疗保健在内的各个行业和领域带来新的应用,因为它可以实现更复杂和逼真的虚拟助手和聊天机器人,从而改善用户体验。
DIRFA 还可以作为言语或面部残疾人士的强大工具,帮助他们通过富有表现力的头像或数字表示来传达他们的想法和情感,从而增强他们的沟通能力。
【来源:IT之家】
The End
相关阅读
- 英国将出台《自动驾驶汽车法案》拒绝特斯拉FSD类命名营销
- 特斯拉 CyberOpener 开瓶器国内开售,售价 350 元
- 三星声称明年不会推出400-500美元价位“中端折叠屏手机”
- Zen 4提升最明显,AMD四代移动CPU在Linux平台性能实测
- 大模型国际标准启动,华为云、百度、腾讯、蚂蚁等发起成立IEEE大模型标准工作组
- 荣耀绿洲护眼屏+单反级写真相机 荣耀100系列售价2499元起
- 台积电,三星的3nm实际良率仅有50%左右?
- 美团闪购超80万线下门店开启双11活动
- 美国社交巨头该如何管理?马斯克只需要一部iPhone
- 苹果 iOS 17.1 测试版发布:再远都能用 AirDrop 了