一种生成说话人三维运动模型的方法、系统及计算机
成果类型:: 发明专利
发布时间: 2022-11-30 09:08:21
现有的自动生成任意人的三维运动模型的方案为:预先建立三维人脸库和三维发 型库,对输入的正面人脸照片进行特征点提取和头发分割,分别生成三维人脸模型与三维 头发模型,然后将人脸模型与头发模型合成。由于只采取了正面的照片作为输入,照片是二 维的,因此,在恢复二维模型时必然失去了很多重要的ί目息,如侧脸的深度ί目息,在这种情 况下恢复出的三维人模型也必然存在与实际人物的误差。而且,头发的模型也采用从头发 数据库里去匹配寻找,而并非直接去恢复,这无疑增加了许多人工合成的因素。由上可知, 现有技术实现任意人的三维运动模型是非全自动,需要人工干预。
本发明实施例是一种融合了三维人头建模技术、三维人头运动模拟 技术、人脸检测技术等众多先进技术的一体化系统。本发明实施例的硬件外设部分为一台 计算机和一个带有深度数据获取功能的彩色摄像头,如Kinect;软件部分主要由四个模块 构成:初始化模块、数据自动采集模块、自动实时建模模块和发音驱动模块。系统启动首先 交由初始化模块,打开带有深度数据获取功能的彩色摄像头,初始化各种参数,然后被测试 人坐于摄像头之前,调整身体和头部姿势,系统的数据自动采集模块会自动进行检测并提 示,当系统提示已检测到目标,就会再次提示,让被测试人缓慢移动头部,从左到右或从右 到左转动,系统会自动记录采集人的彩色数据、深度数据、及头部姿态。采集到足够的人物 的数据之后,数据自动采集模块会将采集的数据交由自动建模模块。自动实时建模模块会 根据采集的数据进行规范化,使用标准模型对其配准,然后完成贴图,生成测试的人三维人 模型。最后自动建模模块将变形后的三维人头模型交由发音驱动模块,生成发音的运动模 拟。
技术合作
发明在建立任意人的三维说话人运动模型的基础上,同时考虑声音向任 意人的转变,对于任意一个人,使得生成此人的三维说话模型不仅具有此人的模样而且具 有与此人一样的声音,从而使得本发明具有个性化人头与个性化声音结合效果。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分步骤是可以 通过程序来指令相关的硬件来完成,所述的程序可以存储于一计算机可读取存储介质中, 所述的存储介质,如R0M/RAM、磁盘、光盘等。