利索能及
我要发布
收藏
专利号: 2024116798833
申请人: 云伴数字科技(安徽)有限公司
专利类型:发明专利
专利状态:已下证
更新日期:2026-05-14
缴费截止日期: 暂无
联系人

摘要:

权利要求书:

1.用于生成数字人视频的方法,其特征在于,包括以下步骤:

S1.获取用户行为数据,对用户行为数据进行预处理,提取用户偏好、兴趣标签和交互记录,通过深度学习模型生成用户特征向量;

S2.将用户特征向量输入到对抗网络,生成初始的数字人形象,获取用户情感输入数据,通过情感分析模型提取用户情绪状态特性,设定数字人的情感反应,分析用户实时交互数据,获取用户互动匹配度指数;

S3.基于用户互动匹配度指数,通过模糊逻辑控制算法建立反馈机制,调整数字人表情细节、语调和肢体语言,生成个性化数字人形象;

S4.基于用户特征向量、互动匹配度指数,通过自然语言生成模型生成个性化对话内容,并结合分布式渲染生成数字人视频;

所述基于用户互动匹配度指数,通过模糊逻辑控制算法建立反馈机制,调整数字人表情细节、语调和肢体语言的具体过程如下:根据用户互动匹配度指数设置模糊逻辑控制器的输入变量,定义模糊集合和规则库,构建模糊规则,通过模糊推理机制,将输入变量映射到模糊集合中,并进行模糊运算,生成模糊输出,调整数字人表情细节、语调和肢体语言。

2.根据权利要求1所述的用于生成数字人视频的方法,其特征在于:对用户行为数据进行预处理,提取用户偏好、兴趣标签和交互记录的具体过程如下:将用户的历史浏览记录、点击行为和停留时间进行归一化处理,通过聚类算法分析用户行为数据,提取用户的偏好特征和兴趣标签,并记录用户在不同交互场景中的行为频率。

3.根据权利要求2所述的用于生成数字人视频的方法,其特征在于:通过深度学习模型生成用户特征向量的具体过程如下:将预处理后的用户行为数据输入到深度学习模型中,采用多层感知器对用户的偏好特征和兴趣标签进行特征提取,通过激活函数对每一层的输出进行非线性变换,最终通过全连接层生成用户特征向量。

4.根据权利要求3所述的用于生成数字人视频的方法,其特征在于:通过情感分析模型提取用户情绪状态特性,设定数字人的情感反应的具体过程如下:将用户情感输入数据输入到情感分析模型中,通过情感分析模型的长短期记忆网络对用户的文本、语音或面部表情数据进行分析,提取出用户的情绪特征;

基于提取的情绪特征对数字人的情感状态进行分类,并设定相应的情感反应规则,匹配用户情绪状态。

5.根据权利要求4所述的用于生成数字人视频的方法,其特征在于:分析用户实时交互数据,获取用户互动匹配度指数的具体过程如下:获取用户实时交互数据,包括点击行为、浏览时长、反馈响应,形成多维交互数据集,并通过多维数据聚合对不同类型交互数据进行归一化处理;

通过主成分分析对归一化后的数据进行特征提取,生成主要特征向量,构建加权互动匹配度模型,基于历史交互数据分析每种交互行为的重要性,结合协同过滤算法和动态加权机制,赋予不同交互行为以可变权重,实时更新权重值以适应用户当前行为模式;

通过多因素线性回归分析建立综合评分公式,将提取的主要特征和动态权重结合,计算出用户互动匹配度指数,量化用户与数字人之间的交互质量和一致性。

6.根据权利要求5所述的用于生成数字人视频的方法,其特征在于:结合分布式渲染生成数字人视频的具体过程如下:构建数字人模型和场景环境,通过分布式渲染系统将渲染任务划分为多个子任务,并将其分配给不同的计算节点进行并行处理;

在渲染过程中,结合用户的互动匹配度指数,动态调整数字人的表情细节、语调和肢体语言;

每个计算节点根据自身处理能力和当前负载,独立执行渲染任务,并在完成后将渲染结果发送回中央处理单元;

中央处理单元对接收到的渲染结果进行合成,生成数字人视频。

7.用于生成数字人视频的系统,应用权利要求2‑6任意一项所述的用于生成数字人视频的方法,其特征在于,包括以下模块:数据获取模块、形象生成模块、情感调整模块、生成模块;

所述数据获取模块用于获取用户行为数据,对用户行为数据进行预处理,提取用户偏好、兴趣标签和交互记录,通过深度学习模型生成用户特征向量;

所述形象生成模块用于将用户特征向量输入到对抗网络,生成初始的数字人形象,获取用户情感输入数据,通过情感分析模型提取用户情绪状态特性,设定数字人的情感反应,分析用户实时交互数据,获取用户互动匹配度指数;

所述情感调整模块用于基于用户互动匹配度指数,通过模糊逻辑控制算法建立反馈机制,调整数字人表情细节、语调和肢体语言,生成个性化数字人形象;

所述生成模块用于基于用户特征向量、互动匹配度指数,通过自然语言生成模型生成个性化对话内容,并结合分布式渲染生成数字人视频;

所述基于用户互动匹配度指数,通过模糊逻辑控制算法建立反馈机制,调整数字人表情细节、语调和肢体语言的具体过程如下:根据用户互动匹配度指数设置模糊逻辑控制器的输入变量,定义模糊集合和规则库,构建模糊规则,通过模糊推理机制,将输入变量映射到模糊集合中,并进行模糊运算,生成模糊输出,调整数字人表情细节、语调和肢体语言。