1.一种网络训练方法,包括:
从至少一个训练主机分别接收状态动作样本数据,所述状态动作样本数据至少包括操作状态数据以及相应的动作控制数据;
使用所述状态动作样本数据,训练用于操作控制的目标神经网络;
将经过训练的目标神经网络分别发送给所述至少一个训练主机,以使得所述至少一个训练主机根据所述目标神经网络生成新的状态动作样本数据。
2.一种网络训练方法,包括:
通过本地的目标神经网络,获取操作状态数据的动作控制数据;
向中央训练服务器发送包括所述操作状态数据和相应的动作控制数据的状态动作样本数据;
从中央训练服务器接收经过训练的目标神经网络;
将接收到的目标神经网络设置为本地的目标神经网络,以根据本地的目标神经网络采集新的状态动作样本数据。
3.一种操作控制方法,包括:
获取操作状态数据;
通过如权利要求1所述方法训练得到的目标神经网络,获取所述操作状态数据的动作控制数据;
根据所述动作控制数据,执行相应的控制操作。
4.一种网络训练装置,包括:
样本接收模块,用于从至少一个训练主机分别接收状态动作样本数据,所述状态动作样本数据至少包括操作状态数据以及相应的动作控制数据;
网络训练模块,用于使用所述样本接收模块接收的状态动作样本数据,训练用于操作控制的目标神经网络;
网络发送模块,用于将经过所述网络训练模块训练的目标神经网络分别发送给所述至少一个训练主机,以使得所述至少一个训练主机根据所述目标神经网络生成新的状态动作样本数据。
5.一种网络训练装置,包括:
动作控制数据获取模块,用于通过本地的目标神经网络,获取操作状态数据的动作控制数据;
样本发送模块,用于向中央训练服务器发送包括所述操作状态数据和相应的动作控制数据的状态动作样本数据;
网络接收模块,用于从中央训练服务器接收经过训练的目标神经网络;
网络设置模块,用于将接收到的目标神经网络设置为本地的目标神经网络,以根据本地的目标神经网络采集新的状态动作样本数据。
6.一种操作控制装置,包括:
操作状态数据获取模块,用于获取操作状态数据;
动作控制数据获取模块,用于通过如权利要求1所述方法训练得到的目标神经网络,获取所述操作状态数据的动作控制数据;
控制执行模块,用于根据所述动作控制数据,执行相应的控制操作。
7.一种电子设备,包括:处理器、存储器、通信元件和通信总线,所述处理器、所述存储器和所述通信元件通过所述通信总线完成相互间的通信;
所述存储器用于存放至少一可执行指令,所述可执行指令使所述处理器执行如权利要求1所述的网络训练方法相应的操作。
8.一种电子设备,包括:处理器、存储器、通信元件和通信总线,所述处理器、所述存储器和所述通信元件通过所述通信总线完成相互间的通信;
所述存储器用于存放至少一可执行指令,所述可执行指令使所述处理器执行如权利要求2所述的网络训练方法相应的操作。
9.一种电子设备,包括:处理器、存储器、通信元件和通信总线,所述处理器、所述存储器和所述通信元件通过所述通信总线完成相互间的通信;
所述存储器用于存放至少一可执行指令,所述可执行指令使所述处理器执行如权利要求3所述的操作控制方法相应的操作。
10.一种计算机可读存储介质,其上存储有计算机程序指令,其中,所述程序指令被处理器执行时实现权利要求1所述的网络训练方法的步骤。