利索能及
我要发布
收藏
专利号: 2012105534129
申请人: 中国科学院深圳先进技术研究院
专利类型:发明专利
专利状态:已下证
更新日期:2024-12-09
缴费截止日期: 暂无
联系人

摘要:

权利要求书:

1.一种区域影响分析系统,包括:

数据规划模块,用于确定分析目标,规划获取的数据对象,根据所述数据对象建立数据源站点列表;

数据获取模块,用于利用数据获取算法从所述数据源站点列表中的站点中获取数据对象;

数据处理模块,用于对所述数据对象进行预处理后将其格式化为标准文件,其中标准化文件包括:*.edb文件、*.vdb文件以及*.net文件;

节点位置聚类模块,用于根据所述标准文件中的*.vdb文件中节点的经纬度信息对节点位置输出空间聚类:节点位置聚类模块首先随机选择K个节点作为中心节点进行聚类,而后,更新聚类信息和中心聚类节点信息,如果中心聚类节点发生变化,则根据新的中心聚类节点进行重新聚类,直到中心聚类节点不再发生变化,则输出K个空间聚类结果;

标记模块,用于读入社会网络图结构,并根据所述社会网络图结构以及所述标准文件的*.net文件标记社区结构信息到节点:标记模块利用Newman定义的ΔQ和Q,计算出所有节点对之间的ΔQ和整个图G的Q值,判断ΔQ是否大于1,如果大于1,则选择最大的ΔQ进行节点合并工作,同时更新ΔQ和Q的值;如果ΔQ小于1则循环停止;选择Q值最大的时候所进行的合并记录,根据历史记录,循环到Q值最大时,从而得到最终的社区结构,然后根据所述标准文件的*.net文件标记社区结构信息到节点;

分析模块,用于定义节点之间的传播概率,并根据选定的传播概率参数计算阈值函数θ,并根据阈值函数θ循环空间聚类节点集,并输出源点集、影响点集、知道点集以及空节点集;

运算模块,用于根据通覆率公式:(|源点集|+|影响点集|+|知道点集|)/|空间聚类点集|计算出每个空间聚类的覆盖率,并根据|影响点集|/|源点集|得到每个空间聚类的影响力。

2.如权利要求1所述的区域影响分析系统,其特征在于,所述数据处理模块用于去除所述数据对象中的噪音数据。

3.如权利要求2所述的区域影响分析系统,其特征在于,所述数据处理模块对数据对象中的对边信息格式化,生成*.edb文件,对节点信息格式化,生成*.vdb,对关系信息格式化,生成*.net。

4.如权利要求1所述的区域影响分析系统,其特征在于,所述源点集为信息发源地节点的集合,所述影响点集为在传播过程中被激活的节点集合,所述知道点集为传播过程中未被激活但是获取到的传播概率不为零的节点集合,空节点集为传播过程中未被激活且获取到的传播概率为零的节点集合。

5.如权利要求4所述的区域影响分析系统,其特征在于,所述分析模块还用于通过计算节点获取的传播概率值,并与所述阈值函数θ比较,若大于零小于θ,则该节点存入到知道点集,若大于θ,则该节点存入到影响点集,若等于0,则该节点存入到空节点集。

6.一种区域影响分析方法,包括:

确定分析目标,规划获取的数据对象,根据所述数据对象建立数据源站点列表;

利用数据获取算法从所述数据源站点列表中的站点中获取数据对象;

对所述数据对象进行预处理后将其格式化为标准文件,其中,标准化文件包括:*.edb文件、*.vdb文件以及*.net文件;

根据所述标准文件*.vdb文件中节点的经纬度信息对节点位置输出空间聚类:首先随机选择K个节点作为中心节点进行聚类,而后,更新聚类信息和中心聚类节点信息,如果中心聚类节点发生变化,则根据新的中心聚类节点进行重新聚类,直到中心聚类节点不再发生变化,则输出K个空间聚类结果;

读入社会网络图结构,并根据所述社会网络图结构以及所述标准文件中的*.net文件标记社区结构信息到节点:利用Newman定义的ΔQ和Q,计算出所有节点对之间的ΔQ和整个图G的Q值,判断ΔQ是否大于1,如果大于1,则选择最大的ΔQ进行节点合并工作,同时更新ΔQ和Q的值;如果ΔQ小于1则循环停止;选择Q值最大的时候所进行的合并记录,根据历史记录,循环到Q值最大时,从而得到最终的社区结构,然后根据所述标准文件的*.net文件标记社区结构信息到节点;

定义节点之间的传播概率,并根据选定的传播概率参数计算阈值函数θ;

根据阈值函数θ循环空间聚类节点集,并输出源点集、影响点集、知道点集以及空节点集;

根据通覆率公式:(|源点集|+|影响点集|+|知道点集|)/|空间聚类点集|计算出每个空间聚类的覆盖率,并根据|影响点集|/|源点集|得到每个空间聚类的影响力。

7.如权利要求6所述的区域影响分析方法,其特征在于,“对所述数据对象进行预处理后将其格式化为标准文件”的步骤包括:对数据对象中的对边信息格式化,生成*.edb文件,对节点信息格式化,生成*.vdb,对关系信息格式化,生成*.net。

8.如权利要求6所述的区域影响分析方法,其特征在于,所述源点集为发源地节点信息的集合,所述影响点集为在传播过程中被激活的节点集合,所述知道点集为传播过程中未被激活但是获取到的传播概率不为零的节点集合,空节点集为传播过程中未被激活且获取到的传播概率为零的节点集合。

9.如权利要求8所述的区域影响分析方法,其特征在于,“根据阈值函数θ循环空间聚类节点集,并输出源点集、影响点集、知道点集以及空节点集”的步骤包括:激活所述空间聚类节点集作为被激活节点,存入到源点集中;

计算节点获取的传播概率值,并与θ比较;

若所述传播概率值大于零,小于θ,则该节点存入到知道点集;

若所述传播概率值大于θ,则该节点存入到影响点集;

若所述传播概率值等于0,则该节点存入到空节点集。

10.如权利要求9所述的区域影响分析方法,其特征在于,激活节点的步骤包括:若节点从其邻居节点获取到的传播概率之和大于所述阈值函数θ,则激活所述节点。