利索能及
我要发布
收藏
专利号: 2020110029054
申请人: 北京百灵互联科技有限公司
专利类型:发明专利
专利状态:已下证
更新日期:2025-12-08
缴费截止日期: 暂无
联系人

摘要:

权利要求书:

1.一种人工智能辅助写作系统,包括写作系统,其特征在于,所述写作系统包含有信息处理模块、词向量语义模块、句向量语义模块和句向量矩阵模块,所述词向量语义模块包含有CBOW模型神经网络训练模块,所述信息处理模块包含有信息收集模块、文本框输入模块和文本框输出模块,所述句向量语义模块包含有句向量组合算法,所述句向量矩阵模块包含有语义矩阵联想算法,具体包括如下步骤:A.经由信息处理模块采集大量文学作品,经过分段后,将文字转换为字符串,形成文字段落库;

B.将步骤A所采集的文字段落通过词向量语义模块处理,首先将文字段落分词,随后依次将单词经过CBOW模型神经网络训练模块处理得到各个单词的词向量,再把各个词向量进行组合,形成词组向量;

C.使步骤B中的词组向量库整体置入句向量语义模块中,并通过句向量组合算法将词向量输出为句向量,使文字段落的句子主要经由句向量表达;

D.将步骤A所生成文字段落库中的每个段落,都经过步骤B、C后,得到每个文字段落的句子特征向量,句子的特征句向量采用浮点数类型表达,再将所有句子特征向量合并,形成文学作品矩阵库;

E.使用者通过信息处理模块的文本框输入模块输入目标文本,在文本转换为字符串后,经由步骤B和步骤C形成目标句向量;

F.将目标句向量和步骤D的文学作品矩阵库经由句向量矩阵模块的语义矩阵联想算法进行处理,得出相似句向量集合,并输出至信息处理模块的文本框输出模块中,且按相似率升序排列。

2.根据权利要求1所述的一种人工智能辅助写作系统,其特征在于,所述信息处理模块包含有网络爬虫技术或网络API平台外接端口,主要用于提取文学作品信息。

3.根据权利要求1所述的一种人工智能辅助写作系统,其特征在于,所述CBOW模型神经网络训练模块主要基于word2vec词袋算法模型下使用,CBOW模型神经网络训练模块的训练过程是通过在大量文学句子中抽取一些文学句子作为训练数据,对每一条句子抽出词组W(t),经由上下文单词w(t-2),w(t-1),w(t+1),w(t+2)预测W(t),训练后的CBOW模型神经网络训练模块可以使单词字符串词量化,包含如下步骤:(1)将当前词的上下文词语的独热编码输入到输入层,其独热编码维度为1*V,并设立矩阵W1,且W1的维度为V*N,V为词典中包含的词组总数,N为自定义维度;

(2)使上下文词语和同一矩阵W1相乘,得到上下文词语的各自向量1*N,并将1*N向量整体取平均为一个向量1*N,最后将平均向量1*N和矩阵W2相乘,变为1*V,其中W2的维度为N*V;

(3)将1*V向量归一化后取出每个词的概率向量,将概率值最大的数对应的词作为预测词W(t),随后使预测词W(t)和真实预期词W(t)计算误差,做反向传播梯度下降调整W1和W2的矩阵值,最终得到的W1矩阵值即是文学句子的词向量库。

4.根据权利要求2所述的一种人工智能辅助写作系统,其特征在于,所述句向量组合算法基于CBOW模型神经网络训练模块下计算,通过CBOW模型神经网络训练模块所得到的词向量形成句向量,具体做法是:根据所得出的词向量设目标句子A中包含n个词,每个词都用词向量库中的m维词向量表示,则句子A包含的词向量集合为X(X1,X2……Xn),其中每个词向量可以表示为:

X1=[X11,X12……X1m]X2=[X21,X22……X2m]……

Xn=[Xn1,Xn2……Xnm]设句子A的语义特征向量为Avec,则Avec的算法为:Avec=[(X11+X21+……+Xn1)/n,(X12+X22+……+Xn2)/n,……,(X1m+X2m+……+Xnm)/n],为简化表示设:

Y1=(X11+X21+……+Xn1)/nY2=(X12+X22+……+Xn2)/n……

Ym=(X1m+X2m+……+Xnm)/n则句子A的语义特征向量Avec=[Y1,Y2,……,Yn],得出句向量Avec,其中Y的数据类型为浮点数,因此在对采集多个句向量后,设句子总数为S,根据句向量所得出的浮点类型矩阵则表示为:

所输出的此种矩阵合并后即为文学作品矩阵库G。

5.根据权利要求4所述的一种人工智能辅助写作系统,其特征在于,所述语义联想算法主要将目标文本和文学作品矩阵库结合计算,且包括有欧几里得距离公式,包含如下步骤:将步骤E中使用者所输入的目标文本设为X文本,则X文本的n维特征向量经步骤B和步骤C得出为X(X1,X2……Xn),此处的X集合特指目标文本X文本的集合,与上述的词库向量X具有实质上的区别,以下所描述的X则皆为X文本的概念,设对比句为Y(Y1,Y2,……,Yn),则多维的对应公式为:

X文本与多个句子特征向量之间的距离,可以把X文本与程序存储的数百万句子特征向量依次计算距离,即为句子之间的相似度,最后将相似的句子进行排序即可。

6.根据权利要求5所述的一种人工智能辅助写作系统,其特征在于,所述语义联想算法包含有算法简化流程,其步骤如下:首先定义m行的变换矩阵 将m行变换矩阵和对应的句向量X文本相乘,可得出:

随后使所有已经记忆的句子特征向量合并为一个矩阵G,则矩阵G为记录了m行,n列的矩阵,即算法记忆了m个句子,每个句子特征向量为n;

D=X’-G,其中X’即是使用者所输入的X文本,为一行n列的矩阵,经变换矩阵C转换为m行n列的矩阵X’,将X’和矩阵G相减后即可得到X文本的句向量和文学作品矩阵库中所有句子向量的差得出矩阵D;

E=D⊙D,

其中运算符“⊙”是哈达玛积,它是一种矩阵运算,若A=(aij)和B=(bij)是两个同阶矩阵,若cij=aij×bij,则称矩阵C=(cij)为A和B的哈达玛积,或称基本积,因此在公式中E为矩阵D和自身做哈达玛积,即对矩阵D中所有元素求平方;

最后则有F=ET*C,其中ET为转置后的E,C为变换矩阵,所得出的F即是m行一列的矩阵,矩阵内的数值即是X文本和各个句子的相似度,在升序排列后即可得出和X文本最相近的句子列表,而原本的欧式公式因为并没有开方,因此最终公式为:

7.根据权利要求1所述的一种人工智能辅助写作系统,其特征在于,所述语义矩阵联想算法主要设置于GPU上进行运算。