SparseConvNet/plankton.cpp at master · SpiderMonkey1975/SparseConvNet · GitHub

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
73
74
75
76
77
78
79
80
81
82
83
84
85
86
#include "SparseConvNet.h"
#include "SpatiallySparseDatasetOpenCV.h"

int epoch=0;
int cudaDevice=-1; // PCI bus ID: -1 for default GPU
int batchSize=50; // Increase/decrease according to GPU memory

Picture* OpenCVPicture::distort(RNG& rng, batchType type) {
  OpenCVPicture* pic=new OpenCVPicture(*this);
  // pic->loadDataWithoutScaling(-1);
  float
    c00=1, c01=0,  //2x2 identity matrix---starting point for calculating affine distortion matrix
    c10=0, c11=1;
  float r, alpha, beta;
  if (type==TRAINBATCH) {
    r=rng.uniform(-0.1,0.1);
    alpha=rng.uniform(0,2*3.1415926535);
    beta=rng.uniform(-0.2,0.2)+alpha;
  } else {
    r=0;
    alpha=rng.uniform(0,2*3.1415926535);
    beta=alpha;
  }
  c00=(1+r)*cos(alpha); c01=(1+r)*sin(alpha);
  c10=-(1-r)*sin(beta); c11=(1-r)*cos(beta);
  if (rng.randint(2)==0) {c00*=-1; c01*=-1;}//Horizontal flip
  pic->affineTransform(c00, c01, c10, c11);
  pic->jiggle(rng,300);
  return pic;
}


int f(int i) {
  return 32*(i+1);
}

class FractionalSparseConvNet : public SparseConvNet {
public:
  FractionalSparseConvNet(int nInputFeatures, int nClasses, int cudaDevice) : SparseConvNet(2,nInputFeatures, nClasses, cudaDevice) {
    int l=12;
    float p=0.0f;
    const float fmpShrink=1.414;
    for (int i=0;i<l;i++) {
      addLeNetLayerPOFMP(f(i),2,1,2,fmpShrink,VLEAKYRELU,p*std::max(i-4,0)/(l-3));
    }
    addLeNetLayerPOFMP(f(l),2,1,1,1,VLEAKYRELU,p*std::max(l-4,0)/(l-3));
    addTerminalPoolingLayer(32);
    addLeNetLayerPOFMP(f(l+1),1,1,1,1,VLEAKYRELU,p*std::max(l-3,0)/(l-3));
    addSoftmaxLayer();
  }
};


int main() {
  std::string baseName="weights/plankton";

  OpenCVLabeledDataSet trainSet("Data/kagglePlankton/classList","Data/kagglePlankton/train","*.jpg",TRAINBATCH,255,true,-1);
  trainSet.summary();
  OpenCVLabeledDataSet cheekyExtraTrainSet("Data/kagglePlankton/classList","Data/kagglePlankton/testPrivate","*.jpg",TRAINBATCH,255,true,-1);  //Use the "private test set" as extra training data.
  cheekyExtraTrainSet.summary();
  OpenCVLabeledDataSet valSet("Data/kagglePlankton/classList","Data/kagglePlankton/testPublic","*.jpg",TESTBATCH,255,true,-1);
  valSet.summary();

  FractionalSparseConvNet cnn(trainSet.nFeatures,trainSet.nClasses,cudaDevice);

  if (epoch>0) {
    cnn.loadWeights(baseName,epoch);
    cnn.processDatasetRepeatTest(valSet, batchSize/2, 12);
  }
  for (epoch++;;epoch++) {
    std::cout <<"epoch: " << epoch << std::endl;
    float lr=0.003*exp(-0.1*epoch);
    for (int i=0;i<3;++i) {
      cnn.processDataset(trainSet, batchSize,lr,0.999);
      cnn.saveWeights(baseName,epoch);
      cnn.processDataset(cheekyExtraTrainSet, batchSize,lr,0.999);
      cnn.saveWeights(baseName,epoch);
    }
    cnn.processDatasetRepeatTest(valSet, batchSize, 1);
  }

  // For unlabelled data (but there is overlap between this "test" data and our expanded training set!!!)
  // OpenCVUnlabeledDataSet testSet("Data/kagglePlankton/classList","Data/kagglePlankton/test","*.jpg",255,true,-1);
  // testSet.summary();
  // cnn.processDatasetRepeatTest(testSet, batchSize/2, 24,"plankton.predictions",testSet.header);
}