1.一种基于在线知识社区的智能问答机器人系统,其特征在于:包括:用户信息模组,用户通过现有的联系方式完成基本信息的登录,并通过自然语言阐述出问题进行传输;
数据交互模块,用于接收用户通过自然语言表达的问题并向用户提供所需信息或答案;
智能问答系统,用于实现对自然语言的处理并基于分析后匹配答案进行反馈,具体包括:自然语言处理模块,连接到数据交互模块,将用户的自然语言问题识别提取出词汇特征传输至问题解析与匹配模块进行使用;
问题解析与匹配模块,用于负责解析用户问题,评估用户的积极情感和创造力自我效能感,并在知识库中搜索匹配的信息或答案,并将匹配的信息或答案进行传输;
信息生成与返回模块,接收信息或答案数据,负责生成与用户问题匹配的答案并向数据交互模块返回答案,同时根据用户情感状态提供情感支持;
知识库管理模块,用于获取、整理和更新来自在线知识社区的数据,并存储知识数据至知识库中,用于特征匹配使用;
学习与优化模块,与知识库管理模块连接,负责基于用户反馈和系统使用情况不断优化智能问答机器人系统的性能;
所述自然语言处理模块的具体处理操作为:
A1、将用户表述的自然语言问题采集后,先完成对自然语言问题的文本清洗操作;
A2、再通过对清洗后的自然语言问题进行连词词汇特征的提取,将连词词汇特征标记为N,并基于连词词汇特征N进行分析完成主次排序;
A3、最后将处理得到的具有顺序的连词词汇特征N汇总形成词汇特征数据集M;
所述A2中连词词汇特征N的提取操作为:
a21、设定一个匹配字数可调节的搜寻函数,且标记为F(x);
a22、且搜寻函数沿着自然语言问题的数据顺序移动,通过搜寻函数F(x)从自然语言问题数据的开头开始,并以匹配字数为两个的基础进行特征标识;
a23、并将特征标识的特征词汇与知识库管理模块中的词汇集L进行匹配,且根据匹配结果确定连词词汇特征N;
所述a22‑a23中基于匹配结果确定连词词汇特征N的具体操作步骤为:C1、通过搜寻函数F(x)的特征提取公式完成连词词汇特征的提取操作;
C2、且根据特征提取匹配后存在以下情况:
情况一:特征标识的特征词汇与知识库管理模块中的词汇集L匹配后,词汇集L中具有包含特征词汇的词汇数据或与特征词汇相同的词汇数据;
情况二:特征标识的特征词汇与知识库管理模块中的词汇集L匹配后,词汇集L中没有与特征词汇相同的词汇数据,则在词汇集L中匹配与特征词汇相关的词汇数据;
C3、当满足情况一时,通过增加搜寻函数F(x)的匹配字数,再完成C1‑C2的操作,直至不满足情况一时,以当前匹配字数下搜寻函数F(x)的前一次搜寻函数F(x)的词汇数据作为连词词汇特征N,此时初始的搜寻函数F(x)操作结束,以连词词汇特征N的后一个字为起点开始新的搜寻函数F(x)进行匹配操作,并重复C1‑C3的操作;
当满足情况二时,则直接确定当前匹配字数下搜寻函数F(x)的词汇数据作为连词词汇特征N,并以自然语言问题数据的开头为起点的搜寻函数F(x)结束,以连词词汇特征N的后一个字为起点开始新的搜寻函数F(x)进行匹配操作,并重复C1‑C3的操作;
所述搜寻函数F(x)的特征提取公式为:
;
其中,(1‑n)和(n)均为搜寻函数F(x)的权重,且满足情况一时,(1‑n)的权重减少,(n)权重增加,反之,满足情况二时,(1‑n)的权重增加,(n)权重减少,x为词汇集L中的词汇特征,N为连词词汇特征,y为词汇集L中与连词词汇特征相关的词汇特征,m为在满足条件下增加的词汇特征,且当搜寻函数F(x)满足 条件时,继续增加词汇特征搜寻,直至满足 时,则判定结果为(x+m‑1),而上一次搜寻函数F(x)所标记的词汇数据作为连词词汇特征N;
所述问题解析与匹配模块对于用户问题解析的步骤为:
B1、在完成连词词汇特征N的确定后,将词汇特征数据集M引入至问题解析与匹配模块;
B2、此时通过词汇特征数据集M中的词汇范围逐一筛选,先确定问题阐述的方向,再确定与阐述方向相关的具体事项词汇特征,最后确定关于事项表达的感情词汇特征,将结合的词汇特征引入至知识库管理模块中更新优化;
所述B2结合的词汇特征与知识库管理模块的优化操作为:b21、先完成阐述方向的匹配操作,再结合阐述方向和相关的具体事项匹配常规的信息答复;
b22、此时引入带有情感标签的文本数据作为优化数据,对阐述方向和相关的具体事项匹配常规的信息答复进行情感语句的填补;
b23、完成情感语句特征填补操作后,通过引入关于事项表达的感情词汇特征与知识库中情感标签的文本数据进行匹配,完成对答复语句的填补完善操作。
2.根据权利要求1所述的一种基于在线知识社区的智能问答机器人系统,其特征在于:所述知识库管理模块中的知识来源多种渠道,包括用户生成的内容、专家的回复以及发表的文章、结构化数据库;
所述知识库管理模块通过局域网与在线知识社区通信,定期检查和更新知识库,并且更新和优化基于用户自然语言表达问题上所反馈的信息和答案。
3.根据权利要求1所述的一种基于在线知识社区的智能问答机器人系统,其特征在于:所述A1中自然语言问题的文本清洗操作为:
a11、去除特殊字符:通过特定字符集将自然语言问题分为多段,并删除文本中的标点符号、特殊符号;
a12、去除停用词:根据停用词列表,删除文本中常见但对于语句含义无影响的词汇;
a13、去除空格和换行符:通过字符串替换操作,将多余的空格、换行符统一处理;
a14、大小写标准化:将所有文本转换为统一的大小写格式。
4.根据权利要求1所述的一种基于在线知识社区的智能问答机器人系统,其特征在于:所述信息生成与返回模块的具体操作步骤为:
D1、将问题解析与匹配模块中答复的数据结果生成并通过数据交互模块发送给用户信息模组查看;
D2、根据用户的反馈情况作出操作:
若用户满意不继续追问作出评价后结束对话;
若用户继续追问,则重复A1‑A3的操作和B1‑B3的操作,并根据用户的积极情感和创造力自我效能感状态,给予认知和情感支持。