利索能及
我要发布
收藏
专利号: 2017112808446
申请人: 河海大学
专利类型:发明专利
专利状态:已下证
更新日期:2026-06-16
缴费截止日期: 暂无
联系人

摘要:

权利要求书:

1.一种基于多标签的室内人群聚类方法,其特征在于:通过AP设备采集每一秒钟进入区域内的MAC地址,针对每个MAC地址,根据其当日的所有状态数据计算出对应的多类标签数值;任意选取一个MAC地址,计算它与其他MAC地址的加权余弦距离,如果加权余弦距离小于预定义阈值K即归为一类,如果该区域内半数以上的MAC地址与待比较的MAC地址相似,那么也归为一类,最后得到多个不同的群体;

包括以下步骤:

步骤1:通过AP设备探测当前区域内拥有Wi‑Fi模块的移动终端设备的MAC地址、信号强度RSSI和采集时间;

步骤2:AP设备将采集到的数据发送给服务器,服务器程序将每个MAC地址在当日是否处于区域内的状态序列按照时间升序进行存储;

步骤3:针对每个MAC地址,根据其状态序列得到停留该区域时间最长的一个时段的访问时间;

步骤4:针对每个MAC地址,根据其状态序列得到每次驻留该区域的平均时间;

步骤5:针对每个MAC地址,根据其状态序列得到回访周期的平均值;

步骤6:规定预定义阈值K,任选一个MAC地址与其他所有MAC地址对应的多类标签数值依次计算加权余弦距离,重复选择所有的MAC地址进行上述计算,使所有的MAC地址之间都有一个加权余弦距离;

步骤7:根据预定义阈值K和加权余弦距离对所有MAC地址进行群体划分。

2.如权利要求1所述的基于多标签的室内人群聚类方法,其特征在于:步骤1中AP设备采集到区域内所有的移动终端的MAC地址和RSSI值,每隔一秒采集一次然后发送到服务器中。

3.如权利要求1所述的基于多标签的室内人群聚类方法,其特征在于:步骤2中服务器程序根据RSSI的强弱判断该移动终端的是否在区域内,如果在区域内则状态为1,不在区域内状态为0,如果采集不到数据也为0,然后将状态序列进行存储。

4.如权利要求1所述的基于多标签的室内人群聚类方法,其特征在于:步骤3中针对每个MAC地址计算其停留该区域时间最长的一个时段的访问时间,在状态序列中,取出连续的由“1”组成的最长序列的起始时间即为停留该区域时间最长的一个时段的访问时间。

5.如权利要求1所述的基于多标签的室内人群聚类方法,其特征在于:步骤4中针对每个MAC地址计算其每次驻留该区域的平均时间,在状态序列中,过滤掉小于30秒的访问时间,其余访问时长取平均值得到每次驻留该区域的平均时间。

6.如权利要求1所述的基于多标签的室内人群聚类方法,其特征在于:步骤5中针对每个MAC地址计算其回访周期的平均值,在状态序列中,获取状态为连续0的序列的时长,去掉第一个连续0序列和最后一个连续0序列,剩余的0序列取平均值得到回访周期的平均值。

7.如权利要求1所述的基于多标签的室内人群聚类方法,其特征在于:步骤6中,手动设置预定义阈值K,根据具体场景进行调整,加权余弦距离权重A、B、C也为人工设定,每个MAC地址对应的停留该区域时间最长的一个时段的访问时间、每次驻留该区域的平均时间、回访周期的平均值的数值分别为a、b、c,使用一个二维数组d[N][N],N表示所有MAC地址的数量,d[i][j]表示第i个MAC地址与第j个MAC地址的加权余弦距离。

8.如权利要求7所述的基于多标签的室内人群聚类方法,其特征在于:步骤7中,根据预定义阈值K和二维数组d[N][N]划分不同的群体,具体包括如下步骤:步骤S1:i设置为0,j设置为1; I群体表示第i个MAC地址属于的群体;

步骤S2:x为I群体中所有MAC地址的下标,循环判断d[x][j]是否超过半数小于预定义阈值K,如果是,则进入步骤S3,否则进入步骤S4;

步骤S3:将第i个MAC地址、第j个MAC地址归为一个群体,第j个MAC地址标记为已归类;

步骤S4:j设置为下一个未归类的下标;

步骤S5:重复步骤S2‑S4直到j等于N;

步骤S6: y为未归类的所有MAC地址的下标,遍历所有y,再次判断第y个MAC地址是否属于I群体,如果是进入步骤S7,否则进入步骤S8;

步骤S7:将第y个MAC地址与第i个MAC地址归为一个群体,第y个MAC地址标记为已归类;

步骤S8:y设为下一个未归类的下标;

步骤S9:重复步骤S6‑S8直到第一次遍历完未归类的下标;

步骤S10:设置i为第一个未归类的下标;

步骤S11:设置j为第二个未归类的下标;

步骤S12:重复步骤S2‑S9,直到所有的数值计算完成,或者只留下一个未归类的下标。