[Debug] Trying to understand why does not converge

d21d7df4 · Yandi · c1356bff · d21d7df4 · d21d7df4 · d21d7df4
Commit d21d7df4 authored 2 years ago by Yandi
--- a/main.py
+++ b/main.py
@@ -107,7 +107,7 @@ if __name__ == "__main__":
        print(" Validation : Loss : {:.4f}".format(val_loss))
-    create_submission.create_submission(network, None)
+    create_submission.create_submission(network, None, device)
    """
    logdir = generate_unique_logpath(top_logdir, "linear")
    print("Logging to {}".format(logdir))

--- a/model.py
+++ b/model.py
@@ -11,11 +11,28 @@ class LinearRegression(nn.Module):
        super(LinearRegression, self).__init__()
        self.input_size = input_size
        self.bias = cfg["LinearRegression"]["Bias"]
-        self.regressor = nn.Linear(input_size, 1, self.bias)
+        self.hidden_size = int(cfg["LinearRegression"]["HiddenSize"])
-        self.activate = nn.ReLU()
+        self.regressor = nn.Sequential(
+        nn.Linear(input_size,self.hidden_size,self.bias),
+        nn.ReLU(),
+        nn.Linear(self.hidden_size, self.hidden_size, self.bias),
+        nn.ReLU(),
+        nn.Linear(self.hidden_size,self.hidden_size,self.bias),
+        nn.ReLU(),
+        nn.Linear(self.hidden_size,self.hidden_size,self.bias),
+        nn.ReLU(),
+        nn.Linear(self.hidden_size,self.hidden_size,self.bias),
+        nn.ReLU(),
+        nn.Linear(self.hidden_size,self.hidden_size,self.bias),
+        nn.ReLU(),
+        nn.Linear(self.hidden_size,self.hidden_size, self.bias),
+        nn.ReLU(),
+        nn.Linear(self.hidden_size,1, self.bias),
+        nn.ReLU()
+    )
    def forward(self, x):
-        y = self.regressor(x).view((x.shape[0],-1))
+        return self.regressor(x) 
-        return self.activate(y)
 def build_model(cfg, input_size):    
    return eval(f"{cfg['Model']['Name']}(cfg, input_size)")

--- a/train.py
+++ b/train.py
@@ -41,14 +41,14 @@ def train(model, loader, f_loss, optimizer, device):
        Y = list(model.parameters())[0].grad.cpu().tolist()
-        gradients.append(np.mean(Y))
+        #gradients.append(np.mean(Y))
-        tar.append(np.mean(outputs.cpu().tolist()))
+        #tar.append(np.mean(outputs.cpu().tolist()))
-        out.append(np.mean(targets.cpu().tolist()))
+        #out.append(np.mean(targets.cpu().tolist()))
        optimizer.step()
-    visualize_gradients(gradients)
+    #visualize_gradients(gradients)
-    visualize_gradients(tar)
+    #visualize_gradients(tar)
-    visualize_gradients(out)
+    #visualize_gradients(out)
 def visualize_gradients(gradients):
    print(gradients)