1.一种基于短视频视觉内容呈现风格的用户旅游意愿量化方法,其特征在于,包括如下步骤:步骤S1、数据采集与图像预处理:采集旅游类短视频样本并进行图像预处理,构建样本数据集;
步骤S2、关键帧提取和标注:对样本数据集中的短视频数据,通过帧间差分法提取局部极大值,作为每条短视频的关键帧,从关键帧中随机选择部分数据进行标注;
步骤S3、旅游意愿编码:基于样本数据集中短视频的评论信息,随机选择部分数据,通过三级编码方法进行旅游意愿分类,通过关键词匹配法统计样本数据集中所有样本的旅游意愿评论数量;
步骤S4、Inception‑v3模型训练与评估:将预处理后的图像数据划分为训练集、验证集和测试集,调整预训练的Inception‑v3模型,移除顶层,添加全局平均池化层、自定义的全连接层和输出层,在训练过程中使用验证集评估性能,根据性能图表调整Inception‑v3模型参数,通过测试集验证Inception‑v3模型的分类准确性和泛化能力;
步骤S5、图像分类与风格判断:将待分类图像输入步骤S4训练好的Inception‑v3模型,自动提取图像特征并进行分类,每次分类输出一个二元结果,分别表示图像不包含或包含目标元素,基于Inception‑v3模型分类结果,判断图像的视觉呈现风格;
步骤S6、影响量化分析:基于步骤S5得到的图像分类结果和步骤S3得到的视频中旅游意愿评论数量,构建多元线性回归模型,量化分析短视频的视觉呈现风格及对用户旅游意愿的影响。
2.根据权利要求1所述的基于短视频视觉内容呈现风格的用户旅游意愿量化方法,其特征在于,步骤S1中,所述旅游类短视频样本,包括:评论、点赞数、收藏数、分享数、粉丝数量、视频时长和发布时间信息;所述图像预处理,包括:删除重复数据、修正缺失值、去除图文类视频。
3.根据权利要求1所述的基于短视频视觉内容呈现风格的用户旅游意愿量化方法,其特征在于,步骤S2中,所述关键帧提取和标注,包括如下子步骤:S2.1、将样本数据集中的短视频数据逐帧分割为帧序列,计算每一帧与前一帧间的像素差异,识别帧间显变化;
S2.2、采用移动平均法对帧间差异值进行平滑处理,采用局部极大值法在平滑处理后的差异数据中检测关键变化点,提取出视频中的关键帧;
S2.3、按预设比例从关键帧中随机选择部分数据,进行人工标注,形成标准化数据集,加载标准化数据集中的关键帧数据并进行图像数据处理,包括:色彩校正、尺寸调整、对比度增强,并将图像分辨率设置为统一尺寸,保持彩色格式,将图像像素值缩放至0到1之间。
4.根据权利要求3所述的基于短视频视觉内容呈现风格的用户旅游意愿量化方法,其特征在于,步骤S3所述三级编码方法,包括:开放编码、主轴编码、选择性编码;所述旅游意愿分类,包括:表达兴趣和计划、询问旅游地信息、互动行为。
5.根据权利要求4所述的基于短视频视觉内容呈现风格的用户旅游意愿量化方法,其特征在于,步骤S3所述旅游意愿编码,包括如下子步骤:S3.1、基于标注后的样本数据集中短视频的评论信息,随机选择部分数据,筛选出体现旅游意愿的评论,并进行初步编码;
S3.2、通过三级编码方法对旅游意愿评论内容进行类型划分:
S3.2.1、在开放编码阶段,利用软件逐字阅读原始评论信息,进行概念化得到初始概念,采用双重编码方法分别进行标注和编码,对比并统一编码结果后,将初始概念进行分类;
S3.2.2、在主轴编码阶段,对具有相似和相关含义的类别进行逻辑分类和合并,形成超类别;
S3.2.3、在选择性编码阶段,将主轴编码阶段形成的超类汇聚为核心类别,包括:强烈意愿、探索兴趣、具体计划、行动准备、游玩活动、位置查询、联系方式、费用信息、旅游准备、交通路线、寻找同伴和社交活动参与;
S3.2.4、概括用户关于旅游意愿的核心:对短视频评论区中的评论进行整合,对含有旅游意愿的短视频评论进行分类;
S3.3、通过关键词匹配法统计样本数据集中所有样本的旅游意愿评论数量:S3.3.1、基于编码类别的关键词选择:基于步骤S3.2.4对含有旅游意愿的短视频评论的分类结果,选择代表各类别核心内容的若干个关键词;
S3.3.2、关键词匹配:在样本数据集的所有评论中进行关键词匹配,将每一条包含一个或多个关键词的评论都标记为含有旅游意愿的评论;
S3.3.3、统计分析:对单个短视频中包含旅游意愿的评论数量进行统计分析,量化用户对不同旅游目的地的兴趣分布情况,以及用户在表达旅游意愿时的具体关注点和行为模式。
6.根据权利要求5所述的基于短视频视觉内容呈现风格的用户旅游意愿量化方法,其特征在于,步骤S3.2.4中,对含有旅游意愿的短视频评论进行分类,归纳为:表达兴趣和计划类、询问旅游地信息类、互动行为类;
将涉及用户表达对旅游目的地的兴趣或未来旅行打算的评论归类为表达兴趣和计划类;
将寻求旅游目的地位置、费用、攻略信息的评论归类为询问旅游地信息类;
将寻找同伴、参与社交活动、与他人互动的评论归类为互动行为类。
7.根据权利要求5所述的基于短视频视觉内容呈现风格的用户旅游意愿量化方法,其特征在于,步骤S4中,调整预训练的Inception‑v3模型,包括如下子步骤:S4.1、基于预训练的Inception‑v3模型,加载不包含顶层的模型,并将基础层设置为不可训练;
S4.2、添加自定义输出层,包括:全局平均池化层和全连接层,所述全局平均池化层用于将特征图压缩为固定长度的特征向量,所述全连接层用于处理特征向量,并通过一个使用sigmoid激活函数的输出层进行二分类;
S4.3、使用Adam优化器和二元交叉熵损失函数进行编译,使用早停法以防止过拟合;
S4.4、通过数据增强和类别权重调整,增强Inception‑v3模型的泛化能力。
8.根据权利要求7所述的基于短视频视觉内容呈现风格的用户旅游意愿量化方法,其特征在于,步骤S5中,所述Inception‑v3模型基于图像特征进行分类,每次分类输出一个二元结果0或1,分别表示图像不包含或包含目标元素;
所述视觉呈现风格,包括:体验风格和景观风格,若图像的目标元素以人像特写为主,归类为体验风格;若图像的目标元素以风景展示为主,归类为景观风格。
9.根据权利要求8所述的基于短视频视觉内容呈现风格的用户旅游意愿量化方法,其特征在于,步骤S6中,所述多元线性回归模型为广义线性模型泊松回归,多元线性回归模型的变量包括:用户旅游意愿评论数量 ,视频关键帧中以风景为主的图片数量,视频关键帧中以人像为主的图片数量 ,视频时长 为,视频发布到视频采集的时间间隔 ,发布者的粉丝数量 ,视频点赞数量 ,视频评论数量 ,视频分享数量 ,视频收藏数量 ;
广义线性模型泊松回归表示如下:
;
;
;
;
式中, 表示一个包含 和 的向量,β0~β8为回归参数,ε为随机干扰项;
通过多元回归模型分析变量之间的关系,通过回归参数β0~β8分别量化变量对旅游意愿评论数量的影响程度;通过确定回归参数的设置原则,统计显著性,检验判断哪些变量对旅游意愿评论数量有显著影响。
10.根据权利要求9所述的基于短视频视觉内容呈现风格的用户旅游意愿量化方法,其特征在于,在应用多元线性回归模型前,对关键变量 、、 、 进行对数变换和标准化处理,对每个变量加1后取自然对数,再进行中心化和缩放到单位方差,用于减小关键变量数据的偏态和缩放差异。