1.一种基于单视角人脸图像的三维人头模型重建方法,其特征在于,具体包括如下步骤:S1,获取将要重建的人物的单视角输入正脸图像,采用姿态估计模型估计输入图像中正脸朝向的相机位姿参数;
S2,根据正脸图像及正脸图像对应的相机位姿参数,采用三维扩散模型估计出人头其他角度下的图像;
S3,采用三维生成对抗网络解码表示人头模型的潜在向量,并将正脸图像、其他角度下的图像与相应的相机参数作为监督迭代优化潜在向量;
S4,基于优化后的潜在向量渲染出任意角度下的三维人头图像,并提取相应的三维人头几何模型。
2.根据权利要求1所述的一种基于单视角人脸图像的三维人头模型重建方法,其特征在于,步骤S1具体包括如下步骤:S1.1,获取将要重建的人物的正面的RGB图像,使用3DDFA模型对输入图像Igt进行裁切处理,对齐图像坐标原点与人脸中心位置;
S1.2,根据图像Igt中面部的朝向,继续采用3DDFA模型E估计出正脸相对于坐标系的齐次矩阵cfront:cfront=E(Igt);
S1.3,在齐次矩阵的基础上加入旋转矩阵R,得到人头任意角度下的相机位姿矩阵,选择与正面相对的后脑部分相机参数cback为人头任意角度下的相机位姿矩阵:cback=R×cfront。
3.根据权利要求1所述的一种基于单视角人脸图像的三维人头模型重建方法,其特征在于,步骤S2具体包括如下步骤:S2.1,在给定k个相机视角{π1,π2,...,πk}和给定图像y的条件下,由RGB图组成联合分布p(z):
1:k
p(z)=pc(x |y);
1:k
其中,pc表示以图像y为条件的三维扩散模型所观察到的RGB图像x 的联合分布;
S2.2,通过学习三维扩散模型f来拟合pc,从而合成在k个相机视角{π1,π2,...,πk}下的
1:k
对应的RGB图像(x ):
1:k
(x )=f(y,π1:k);
1:k
S2.3,将x 表述为扩散模型中的马尔可夫链形式:其中, 表示第T时间步中k个相机视角下的随机高斯噪声,P(·)为三维扩散模型分布,t表示时间步, 表示第t个时间步中k个相机视角下的RGB图像,Πt(·)表示累乘t个时间步。
4.根据权利要求1所述的一种基于单视角人脸图像的三维人头模型重建方法,其特征在于,步骤S3具体包括如下步骤:S3.1,从包含任意高斯噪声的潜在空间中随机采样高斯噪声 将 与输入视角下
1:k
的相机参数c 进行拼接,得到
S3.2,通过映射网络M将 映射为中间潜在向量w;
S3.3,采用三维生成对抗网络G解码中间潜在向量w,得到输入视角下的生成图像S3.4,计算真实图像 与生成图像 的均方误差Lmse与感知损失Lp:其中,1:k为输入图像索引,F(·)为用于提取图像深层特征的VGG16神经网络;
S3.5,计算总损失L:
L=Lp+Lmse。