1.一种网页数据的收集方法,其特征在于,所述方法包括:接收统一资源定位符URL地址的写入指令,并写入对应的URL地址;
显示所述URL地址对应的网页以及网页对应的源代码;
根据显示的网页抓取对应的源代码,以实现网页数据的收集。
2.根据权利要求1所述的方法,其特征在于,在所述显示所述URL地址对应的网页以及网页对应的源代码之前,包括:判断所述URL地址对应的网页是否需要登录信息;
在所述URL地址对应的网页需要登录信息时,将预先获取的登录信息写入所述URL地址对应的网页的相应位置,以登录所述URL地址对应的网页。
3.根据权利要求1或2所述的方法,其特征在于,所述根据显示的网页抓取对应的源代码,以实现网页数据的收集,具体包括:检测当前鼠标在网页的位置的停留时长;
在当前鼠标在网页的位置的停留时长超过预设的时长时,抓取所述当前鼠标在网页的位置对应的源代码,以实现网页数据的收集。
4.根据权利要求1或2所述的方法,其特征在于,所述根据显示的网页抓取对应的源代码,以实现网页数据的收集,具体包括:检测当前鼠标在网页的位置;
接收源代码抓取指令,根据所述源代码抓取指令抓取当前鼠标在网页的位置对应的源代码。
5.根据权利要求1或2所述的方法,其特征在于,在所述根据显示的网页抓取对应的源代码,以实现网页数据的收集之后,包括:判断显示的网页对应的网站是否存在多个网页;
在显示的网页对应的网站存在多个网页时,发出翻页指令,以显示翻页后对应的网页;
根据翻页后对应的网页抓取对应的源代码,以实现网页数据的收集。
6.一种网页数据的收集系统,其特征在于,所述系统包括:URL地址的写入指令接收单元,用于接收统一资源定位符URL地址的写入指令,并写入对应的URL地址;
网页显示单元,用于显示所述URL地址对应的网页以及网页对应的源代码;
网页数据收集单元,用于根据显示的网页抓取对应的源代码,以实现网页数据的收集。
7.根据权利要求6所述的系统,其特征在于,所述系统包括:登录信息判断单元,用于判断所述URL地址对应的网页是否需要登录信息;
登录信息写入单元,用于在所述URL地址对应的网页需要登录信息时,将预先获取的登录信息写入所述URL地址对应的网页的相应位置,以登录所述URL地址对应的网页。
8.根据权利要求6或7所述的系统,其特征在于,所述网页数据收集单元包括:停留时长检测模块,用于检测当前鼠标在网页的位置的停留时长;
源代码抓取模块,用于在当前鼠标在网页的位置的停留时长超过预设的时长时,抓取所述当前鼠标在网页的位置对应的源代码,以实现网页数据的收集。
9.根据权利要求6或7所述的系统,其特征在于,所述网页数据收集单元包括:鼠标位置检测模块,用于检测当前鼠标在网页的位置;
源代码抓取指令接收模块,用于接收源代码抓取指令,根据所述源代码抓取指令抓取当前鼠标在网页的位置对应的源代码。
10.根据权利要求6或7所述的系统,其特征在于,所述系统包括:多个网页判断单元,用于判断显示的网页对应的网站是否存在多个网页;
翻页指令发出单元,用于在显示的网页对应的网站存在多个网页时,发出翻页指令,以显示翻页后对应的网页;
翻页后的网页数据抓取单元,用于根据翻页后对应的网页抓取对应的源代码,以实现网页数据的收集。