科学家开发DIRFA:输入图片和音频,可生成说话视频
智能科技 2023-11-17 user639632
11 月 17 日消息,来自新加坡南洋理工大学(NTU Singapore)的科研团队近日开发出了 DIRFA 工具,用户给一张图片以及音频内容,可以自动生成 3D 视频,并实现口型和声音的同步协调。

DIRFA 的全称为 DIverse yet Realistic Facial Animations,训练了超过 6000 多人的 100 万个视频片段,音频片段来自一个名为 VoxCeleb2 数据集的开源数据库,并关联面部表情和头部运动。
研究人员表示,DIRFA 可能会在包括医疗保健在内的各个行业和领域带来新的应用,因为它可以实现更复杂和逼真的虚拟助手和聊天机器人,从而改善用户体验。
DIRFA 还可以作为言语或面部残疾人士的强大工具,帮助他们通过富有表现力的头像或数字表示来传达他们的想法和情感,从而增强他们的沟通能力。
【来源:IT之家】
The End
相关阅读
- 微星海外推出31.5英寸曲面显示器:2K 180Hz VA面板
- 京东发力具身智能数据采集 赋能万亿机器人产业生态
- 荣耀机器人包揽2026北京机器人马拉松冠亚季军
- ZOL双十一京东直播盛宴启幕:每晚18点热售好物特价来袭
- 因欧洲市场需求低迷,大众宣布推迟建设第四家电动汽车电池工厂
- AI的下一步是“行动”:YoooTek携首款智能硬件AI ONE亮相智能硬件展
- 消息称特斯拉搁置“2.5万美元电动汽车”项目,转而聚焦自动驾驶出租车
- 星期三第三季开拍,薇诺娜·瑞德加盟饰演塔比莎
- 创客匠人万人峰会在厦成功举办,老蒋分享《AI赋能IP创新增长》
- 49元!小米四合一双头分线器开售:四口USB 3.0可同时传输