darknet/rnn__layer_8c_source.html

 #include "rnn_layer.h"
 #include "connected_layer.h"
 #include "utils.h"
 #include "cuda.h"
 #include "blas.h"
 #include "gemm.h"

 #include <math.h>
 #include <stdio.h>
 #include <stdlib.h>
 #include <string.h>

 static void increment_layer(layer *l, int steps)
 {
     int num = l->outputs*l->batch*steps;
     l->output += num;
     l->delta += num;
     l->x += num;
     l->x_norm += num;

 #ifdef GPU
     l->output_gpu += num;
     l->delta_gpu += num;
     l->x_gpu += num;
     l->x_norm_gpu += num;
 #endif
 }

 layer make_rnn_layer(int batch, int inputs, int outputs, int steps, ACTIVATION activation, int batch_normalize, int adam)
 {
     fprintf(stderr, "RNN Layer: %d inputs, %d outputs\n", inputs, outputs);
     batch = batch / steps;
     layer l = {0};
     l.batch = batch;
     l.type = RNN;
     l.steps = steps;
     l.inputs = inputs;

     l.state = calloc(batch*outputs, sizeof(float));
     l.prev_state = calloc(batch*outputs, sizeof(float));

     l.input_layer = malloc(sizeof(layer));
     fprintf(stderr, "\t\t");
     *(l.input_layer) = make_connected_layer(batch*steps, inputs, outputs, activation, batch_normalize, adam);
     l.input_layer->batch = batch;

     l.self_layer = malloc(sizeof(layer));
     fprintf(stderr, "\t\t");
     *(l.self_layer) = make_connected_layer(batch*steps, outputs, outputs, activation, batch_normalize, adam);
     l.self_layer->batch = batch;

     l.output_layer = malloc(sizeof(layer));
     fprintf(stderr, "\t\t");
     *(l.output_layer) = make_connected_layer(batch*steps, outputs, outputs, activation, batch_normalize, adam);
     l.output_layer->batch = batch;

     l.outputs = outputs;
     l.output = l.output_layer->output;
     l.delta = l.output_layer->delta;

     l.forward = forward_rnn_layer;
     l.backward = backward_rnn_layer;
     l.update = update_rnn_layer;
 #ifdef GPU
     l.forward_gpu = forward_rnn_layer_gpu;
     l.backward_gpu = backward_rnn_layer_gpu;
     l.update_gpu = update_rnn_layer_gpu;
     l.state_gpu = cuda_make_array(0, batch*outputs);
     l.prev_state_gpu = cuda_make_array(0, batch*outputs);
     l.output_gpu = l.output_layer->output_gpu;
     l.delta_gpu = l.output_layer->delta_gpu;
 #ifdef CUDNN
     cudnnSetTensor4dDescriptor(l.input_layer->dstTensorDesc, CUDNN_TENSOR_NCHW, CUDNN_DATA_FLOAT, batch, l.input_layer->out_c, l.input_layer->out_h, l.input_layer->out_w);
     cudnnSetTensor4dDescriptor(l.self_layer->dstTensorDesc, CUDNN_TENSOR_NCHW, CUDNN_DATA_FLOAT, batch, l.self_layer->out_c, l.self_layer->out_h, l.self_layer->out_w);
     cudnnSetTensor4dDescriptor(l.output_layer->dstTensorDesc, CUDNN_TENSOR_NCHW, CUDNN_DATA_FLOAT, batch, l.output_layer->out_c, l.output_layer->out_h, l.output_layer->out_w);
 #endif
 #endif

     return l;
 }

 void update_rnn_layer(layer l, update_args a)
 {
     update_connected_layer(*(l.input_layer),  a);
     update_connected_layer(*(l.self_layer),   a);
     update_connected_layer(*(l.output_layer), a);
 }

 void forward_rnn_layer(layer l, network net)
 {
     network s = net;
     s.train = net.train;
     int i;
     layer input_layer = *(l.input_layer);
     layer self_layer = *(l.self_layer);
     layer output_layer = *(l.output_layer);

     fill_cpu(l.outputs * l.batch * l.steps, 0, output_layer.delta, 1);
     fill_cpu(l.outputs * l.batch * l.steps, 0, self_layer.delta, 1);
     fill_cpu(l.outputs * l.batch * l.steps, 0, input_layer.delta, 1);
     if(net.train) fill_cpu(l.outputs * l.batch, 0, l.state, 1);

     for (i = 0; i < l.steps; ++i) {
         s.input = net.input;
         forward_connected_layer(input_layer, s);

         s.input = l.state;
         forward_connected_layer(self_layer, s);

         float *old_state = l.state;
         if(net.train) l.state += l.outputs*l.batch;
         if(l.shortcut){
             copy_cpu(l.outputs * l.batch, old_state, 1, l.state, 1);
         }else{
             fill_cpu(l.outputs * l.batch, 0, l.state, 1);
         }
         axpy_cpu(l.outputs * l.batch, 1, input_layer.output, 1, l.state, 1);
         axpy_cpu(l.outputs * l.batch, 1, self_layer.output, 1, l.state, 1);

         s.input = l.state;
         forward_connected_layer(output_layer, s);

         net.input += l.inputs*l.batch;
         increment_layer(&input_layer, 1);
         increment_layer(&self_layer, 1);
         increment_layer(&output_layer, 1);
     }
 }

 void backward_rnn_layer(layer l, network net)
 {
     network s = net;
     s.train = net.train;
     int i;
     layer input_layer = *(l.input_layer);
     layer self_layer = *(l.self_layer);
     layer output_layer = *(l.output_layer);

     increment_layer(&input_layer, l.steps-1);
     increment_layer(&self_layer, l.steps-1);
     increment_layer(&output_layer, l.steps-1);

     l.state += l.outputs*l.batch*l.steps;
     for (i = l.steps-1; i >= 0; --i) {
         copy_cpu(l.outputs * l.batch, input_layer.output, 1, l.state, 1);
         axpy_cpu(l.outputs * l.batch, 1, self_layer.output, 1, l.state, 1);

         s.input = l.state;
         s.delta = self_layer.delta;
         backward_connected_layer(output_layer, s);

         l.state -= l.outputs*l.batch;
         /*
            if(i > 0){
            copy_cpu(l.outputs * l.batch, input_layer.output - l.outputs*l.batch, 1, l.state, 1);
            axpy_cpu(l.outputs * l.batch, 1, self_layer.output - l.outputs*l.batch, 1, l.state, 1);
            }else{
            fill_cpu(l.outputs * l.batch, 0, l.state, 1);
            }
          */

         s.input = l.state;
         s.delta = self_layer.delta - l.outputs*l.batch;
         if (i == 0) s.delta = 0;
         backward_connected_layer(self_layer, s);

         copy_cpu(l.outputs*l.batch, self_layer.delta, 1, input_layer.delta, 1);
         if (i > 0 && l.shortcut) axpy_cpu(l.outputs*l.batch, 1, self_layer.delta, 1, self_layer.delta - l.outputs*l.batch, 1);
         s.input = net.input + i*l.inputs*l.batch;
         if(net.delta) s.delta = net.delta + i*l.inputs*l.batch;
         else s.delta = 0;
         backward_connected_layer(input_layer, s);

         increment_layer(&input_layer, -1);
         increment_layer(&self_layer, -1);
         increment_layer(&output_layer, -1);
     }
 }

 #ifdef GPU

 void pull_rnn_layer(layer l)
 {
     pull_connected_layer(*(l.input_layer));
     pull_connected_layer(*(l.self_layer));
     pull_connected_layer(*(l.output_layer));
 }

 void push_rnn_layer(layer l)
 {
     push_connected_layer(*(l.input_layer));
     push_connected_layer(*(l.self_layer));
     push_connected_layer(*(l.output_layer));
 }

 void update_rnn_layer_gpu(layer l, update_args a)
 {
     update_connected_layer_gpu(*(l.input_layer),  a);
     update_connected_layer_gpu(*(l.self_layer),   a);
     update_connected_layer_gpu(*(l.output_layer), a);
 }

 void forward_rnn_layer_gpu(layer l, network net)
 {
     network s = {0};
     s.train = net.train;
     int i;
     layer input_layer = *(l.input_layer);
     layer self_layer = *(l.self_layer);
     layer output_layer = *(l.output_layer);

     fill_gpu(l.outputs * l.batch * l.steps, 0, output_layer.delta_gpu, 1);
     fill_gpu(l.outputs * l.batch * l.steps, 0, self_layer.delta_gpu, 1);
     fill_gpu(l.outputs * l.batch * l.steps, 0, input_layer.delta_gpu, 1);

     if(net.train) {
         fill_gpu(l.outputs * l.batch * l.steps, 0, l.delta_gpu, 1);
         copy_gpu(l.outputs*l.batch, l.state_gpu, 1, l.prev_state_gpu, 1);
     }

     for (i = 0; i < l.steps; ++i) {
         s.input_gpu = net.input_gpu;
         forward_connected_layer_gpu(input_layer, s);

         s.input_gpu = l.state_gpu;
         forward_connected_layer_gpu(self_layer, s);

         fill_gpu(l.outputs * l.batch, 0, l.state_gpu, 1);
         axpy_gpu(l.outputs * l.batch, 1, input_layer.output_gpu, 1, l.state_gpu, 1);
         axpy_gpu(l.outputs * l.batch, 1, self_layer.output_gpu, 1, l.state_gpu, 1);

         s.input_gpu = l.state_gpu;
         forward_connected_layer_gpu(output_layer, s);

         net.input_gpu += l.inputs*l.batch;
         increment_layer(&input_layer, 1);
         increment_layer(&self_layer, 1);
         increment_layer(&output_layer, 1);
     }
 }

 void backward_rnn_layer_gpu(layer l, network net)
 {
     network s = {0};
     s.train = net.train;
     int i;
     layer input_layer = *(l.input_layer);
     layer self_layer = *(l.self_layer);
     layer output_layer = *(l.output_layer);
     increment_layer(&input_layer,  l.steps - 1);
     increment_layer(&self_layer,   l.steps - 1);
     increment_layer(&output_layer, l.steps - 1);
     float *last_input = input_layer.output_gpu;
     float *last_self = self_layer.output_gpu;
     for (i = l.steps-1; i >= 0; --i) {
         fill_gpu(l.outputs * l.batch, 0, l.state_gpu, 1);
         axpy_gpu(l.outputs * l.batch, 1, input_layer.output_gpu, 1, l.state_gpu, 1);
         axpy_gpu(l.outputs * l.batch, 1, self_layer.output_gpu, 1, l.state_gpu, 1);

         s.input_gpu = l.state_gpu;
         s.delta_gpu = self_layer.delta_gpu;
         backward_connected_layer_gpu(output_layer, s);

         if(i != 0) {
             fill_gpu(l.outputs * l.batch, 0, l.state_gpu, 1);
             axpy_gpu(l.outputs * l.batch, 1, input_layer.output_gpu - l.outputs*l.batch, 1, l.state_gpu, 1);
             axpy_gpu(l.outputs * l.batch, 1, self_layer.output_gpu - l.outputs*l.batch, 1, l.state_gpu, 1);
         }else {
             copy_gpu(l.outputs*l.batch, l.prev_state_gpu, 1, l.state_gpu, 1);
         }

         copy_gpu(l.outputs*l.batch, self_layer.delta_gpu, 1, input_layer.delta_gpu, 1);

         s.input_gpu = l.state_gpu;
         s.delta_gpu = (i > 0) ? self_layer.delta_gpu - l.outputs*l.batch : 0;
         if (i == 0) s.delta_gpu = 0;
         backward_connected_layer_gpu(self_layer, s);

         s.input_gpu = net.input_gpu + i*l.inputs*l.batch;
         if(net.delta_gpu) s.delta_gpu = net.delta_gpu + i*l.inputs*l.batch;
         else s.delta_gpu = 0;
         backward_connected_layer_gpu(input_layer, s);

         increment_layer(&input_layer,  -1);
         increment_layer(&self_layer,   -1);
         increment_layer(&output_layer, -1);
     }
     fill_gpu(l.outputs * l.batch, 0, l.state_gpu, 1);
     axpy_gpu(l.outputs * l.batch, 1, last_input, 1, l.state_gpu, 1);
     axpy_gpu(l.outputs * l.batch, 1, last_self, 1, l.state_gpu, 1);
 }
 #endif
layer::steps
int steps
Definition: darknet.h:157

update_connected_layer
void update_connected_layer(layer l, update_args a)
Definition: connected_layer.c:132

ACTIVATION
ACTIVATION
Definition: darknet.h:56

layer::output_layer
struct layer * output_layer
Definition: darknet.h:297

blas.h

make_rnn_layer
layer make_rnn_layer(int batch, int inputs, int outputs, int steps, ACTIVATION activation, int batch_normalize, int adam)
Definition: rnn_layer.c:29

layer::update
void(* update)(struct layer, update_args)
Definition: darknet.h:125

layer::forward_gpu
void(* forward_gpu)(struct layer, struct network)
Definition: darknet.h:126

layer::backward_gpu
void(* backward_gpu)(struct layer, struct network)
Definition: darknet.h:127

layer::x
float * x
Definition: darknet.h:261

axpy_gpu
void axpy_gpu(int N, float ALPHA, float *X, int INCX, float *Y, int INCY)
Definition: blas_kernels.cu:585

layer::update_gpu
void(* update_gpu)(struct layer, update_args)
Definition: darknet.h:128

update_rnn_layer
void update_rnn_layer(layer l, update_args a)
Definition: rnn_layer.c:82

layer::forward
void(* forward)(struct layer, struct network)
Definition: darknet.h:123

layer::out_w
int out_w
Definition: darknet.h:141

network::delta
float * delta
Definition: darknet.h:486

layer::out_c
int out_c
Definition: darknet.h:141

utils.h

fill_gpu
void fill_gpu(int N, float ALPHA, float *X, int INCX)
Definition: blas_kernels.cu:705

network
Definition: darknet.h:434

forward_connected_layer
void forward_connected_layer(layer l, network net)
Definition: connected_layer.c:151

update_args
Definition: darknet.h:101

fill_cpu
void fill_cpu(int N, float ALPHA, float *X, int INCX)
Definition: blas.c:190

layer::state
float * state
Definition: darknet.h:223

network::train
int train
Definition: darknet.h:488

layer::shortcut
int shortcut
Definition: darknet.h:130

forward_rnn_layer
void forward_rnn_layer(layer l, network net)
Definition: rnn_layer.c:89

layer::delta
float * delta
Definition: darknet.h:245

layer::out_h
int out_h
Definition: darknet.h:141

RNN
Definition: darknet.h:80

layer::inputs
int inputs
Definition: darknet.h:134

axpy_cpu
void axpy_cpu(int N, float ALPHA, float *X, int INCX, float *Y, int INCY)
Definition: blas.c:178

layer::backward
void(* backward)(struct layer, struct network)
Definition: darknet.h:124

layer::x_norm
float * x_norm
Definition: darknet.h:262

layer::batch
int batch
Definition: darknet.h:131

rnn_layer.h

layer::output
float * output
Definition: darknet.h:246

layer::input_layer
struct layer * input_layer
Definition: darknet.h:295

backward_rnn_layer
void backward_rnn_layer(layer l, network net)
Definition: rnn_layer.c:130

copy_gpu
void copy_gpu(int N, float *X, int INCX, float *Y, int INCY)
Definition: blas_kernels.cu:602

connected_layer.h

cuda.h

copy_cpu
void copy_cpu(int N, float *X, int INCX, float *Y, int INCY)
Definition: blas.c:226

detector-scipy-opencv.net
net
Definition: detector-scipy-opencv.py:39

make_connected_layer
layer make_connected_layer(int batch, int inputs, int outputs, ACTIVATION activation, int batch_normalize, int adam)
Definition: connected_layer.c:14

layer::type
LAYER_TYPE type
Definition: darknet.h:120

network::input
float * input
Definition: darknet.h:484

layer::prev_state
float * prev_state
Definition: darknet.h:224

gemm.h

layer::outputs
int outputs
Definition: darknet.h:135

backward_connected_layer
void backward_connected_layer(layer l, network net)
Definition: connected_layer.c:169

layer::self_layer
struct layer * self_layer
Definition: darknet.h:296

layer
Definition: darknet.h:119