科学家开发DIRFA:输入图片和音频,可生成说话视频
智能科技 2023-11-17 user639632
11 月 17 日消息,来自新加坡南洋理工大学(NTU Singapore)的科研团队近日开发出了 DIRFA 工具,用户给一张图片以及音频内容,可以自动生成 3D 视频,并实现口型和声音的同步协调。
DIRFA 的全称为 DIverse yet Realistic Facial Animations,训练了超过 6000 多人的 100 万个视频片段,音频片段来自一个名为 VoxCeleb2 数据集的开源数据库,并关联面部表情和头部运动。
研究人员表示,DIRFA 可能会在包括医疗保健在内的各个行业和领域带来新的应用,因为它可以实现更复杂和逼真的虚拟助手和聊天机器人,从而改善用户体验。
DIRFA 还可以作为言语或面部残疾人士的强大工具,帮助他们通过富有表现力的头像或数字表示来传达他们的想法和情感,从而增强他们的沟通能力。
【来源:IT之家】
The End
相关阅读
- 小米汽车未来蓝图曝光:2025年双雄并驱,2026年增程新篇
- ChatGPT新功能上线:聊天时可直接选择OneDrive等网盘文件
- 明日10:30锁定新华直播间!看养鲜容声如何"锁住"云南高原鲜
- 连续四年全球第一!丰田2023全年销量达创纪录1120万辆:纯电占比不到1%
- 全新岚图梦想家迎来OTA2.0,用户体验全维升级
- 星舰第四次试飞"箭在弦上" 马斯克透露此次飞行目标
- 机构:2023年中国以外全球电动汽车总销量564.8万辆 增长31.7%
- 一段矛盾重重的错误姻缘,苹果为何与高盛分道扬镳?
- 香港黄金交易所:金荣中国领航全球布局
- 快手X巴黎欧莱雅 500个家乡首次商业化 验证“家乡叙事”商业承载力