1.一种人机交互中基于标准问创建扩展问的方法,其特征在于,标准问和扩展问用于人工智能语义识别系统中,包括:基于所述标准问所属的数据范围从所述人工智能语义识别系统的内部数据源或外部数据源采集数据;
以所采集数据为对象执行与所述标准问的问句相似度计算以获得相似问句集;以及对所述相似问句集执行主语修改以获得所述标准问的扩展问;
所述基于所述标准问所属的数据范围从内部数据源或外部数据源采集数据包括:若所述标准问属于内部数据,则从所述内部数据源调用所有内部数据,以及若所述标准问属于外部数据,则通过所述外部数据源进行搜索爬取;
对通过所述外部数据源爬取到的所采集数据进行整理以过滤无用数据,所述执行问句相似度计算是以整理后的所采集数据为对象来执行的。
2.如权利要求1所述的方法,其特征在于,若所述标准问所属领域的词库在所述人工智能语义识别系统的知识库中已存在,则所属标准问为内部数据,否则为外部数据。
3.如权利要求2所述的方法,其特征在于,所述内部数据源为所述人工智能语义识别系统的知识库中已存在的关于所述标准问的所属领域的词库,以及所述外部数据源包括与所述标准问的所属领域相关的第三方数据库。
4.如权利要求1所述的方法,其特征在于,所述问句相似度计算是基于文本聚类分析、LDA分析、或序列分析中的任一者来执行的。
5.如权利要求1所述的方法,其特征在于,所述相似问句集是与所述标准问的相似度超过预定阈值的问句的集合。
6.如权利要求1所述的方法,其特征在于,还包括至少部分地基于人工选择对所述相似问句集执行筛选以过滤无用数据,所述问句主语修改是对调整后的所述相似问句集来执行的。
7.如权利要求1所述的方法,其特征在于,对所述相似问句集执行主语修改是至少部分地基于人工选择来执行的。
8.一种人机交互中基于标准问创建扩展问的装置,其特征在于,标准问和扩展问用于人工智能语义识别系统中,包括:数据采集单元,用于基于标准问所属的数据范围从所述人工智能语义识别系统的内部数据源或外部数据源采集数据;
问句相似度计算单元,用于以所采集数据为对象执行与所述标准问的问句相似度计算以获得相似问句集;以及主语修改单元,用于对所述相似问句集执行主语修改以获得所述标准问的扩展问;所述数据采集单元包括:调用单元,以用于响应于所述标准问属于内部数据,从所述内部数据源调用所有内部数据;以及爬取单元,以用于响应于所述标准问属于外部数据,通过所述外部数据源进行搜索爬取;
整理单元,以用于对通过所述外部数据源爬取到的所采集数据进行整理以过滤无用数据。
9.如权利要求8所述的装置,其特征在于,所述内部数据源为所述人工智能语义识别系统的知识库中已存在的关于所述标准问的所属领域的词库,以及所述外部数据源包括与所述标准问的所属领域相关的第三方数据库。
10.如权利要求8所述的装置,其特征在于,所述主语修改单元至少部分地基于人工选择对所述相似问句集执行主语修改。