code refactoring

AkiRusProd · AkiRusProd · commit 95b1fd5e95a6 · 2024-07-17T16:51:12.000+03:00
diff --git a/neunet/autograd.py b/neunet/autograd.py
diff --git a/neunet/nn/activations.py b/neunet/nn/activations.py
@@ -8,10 +8,10 @@ class _SigmoidTensor(Tensor):  # Static sigmoid tensor for backpropagation
     def __init__(self, data, args, op, device):
         super().__init__(data, args, op, device=device)
 
-        def _backward(x: Tensor, f_x, grad):
+        def grad_fn(x: Tensor, f_x, grad):
             x._apply_grad(grad * f_x * (1 - f_x))
 
-        self._backward = _backward
+        self.grad_fn = grad_fn
 
 
 class Sigmoid(Module):  # Static sigmoid computation
@@ -42,10 +42,10 @@ class _ReLUTensor(Tensor):  # Static ReLU tensor for backpropagation
     def __init__(self, data, args, op, device):
         super().__init__(data, args, op, device=device)
 
-        def _backward(t: Tensor, f_x, grad):
+        def grad_fn(t: Tensor, f_x, grad):
             t._apply_grad(grad * (f_x > 0))
 
-        self._backward = _backward
+        self.grad_fn = grad_fn
 
 
 class ReLU(Module):  # Static ReLU computation
@@ -75,12 +75,12 @@ class _LeakyReLUTensor(Tensor):  # Static LeakyReLU tensor for backpropagation
     def __init__(self, data, args, op, device):
         super().__init__(data, args, op, device=device)
 
-        def _backward(t: Tensor, f_x, alpha, grad):
+        def grad_fn(t: Tensor, f_x, alpha, grad):
             t._apply_grad(
                 grad * t.xp.where(f_x <= 0, alpha, 1).astype(grad.dtype)
             )
 
-        self._backward = _backward
+        self.grad_fn = grad_fn
 
 class LeakyReLU(Module):  # Static LeakyReLU computation
     def __init__(self, alpha=0.01):
@@ -109,10 +109,10 @@ class _TanhTensor(Tensor):  # Static Tanh tensor for backpropagation
     def __init__(self, data, args, op, device):
         super().__init__(data, args, op, device=device)
 
-        def _backward(t: Tensor, f_x, grad):
+        def grad_fn(t: Tensor, f_x, grad):
             t._apply_grad(grad * (1 - f_x ** 2))
 
-        self._backward = _backward
+        self.grad_fn = grad_fn
 
 
 class Tanh(Module):  # Static Tanh computation
@@ -142,11 +142,11 @@ class _SoftplusTensor(Tensor):  # Static Softplus tensor for backpropagation
     def __init__(self, data, args, op, device):
         super().__init__(data, args, op, device=device)
 
-        def _backward(t: Tensor, grad):
+        def grad_fn(t: Tensor, grad):
             x = t.data
             t._apply_grad(grad * (1 / (1 + t.xp.exp(-x))))
 
-        self._backward = _backward
+        self.grad_fn = grad_fn
 
 
 class Softplus(Module):  # Static Softplus computation
@@ -176,11 +176,11 @@ class _SoftsignTensor(Tensor):  # Static Softsign tensor for backpropagation
     def __init__(self, data, args, op, device):
         super().__init__(data, args, op, device=device)
 
-        def _backward(t: Tensor, grad):
+        def grad_fn(t: Tensor, grad):
             x = t.data
             t._apply_grad(grad * (1 / (1 + t.xp.abs(x)) ** 2))
 
-        self._backward = _backward
+        self.grad_fn = grad_fn
 
 
 class Softsign(Module):  # Static Softsign computation
@@ -210,13 +210,13 @@ class _SwishTensorTensor(Tensor):  # Static Swish tensor for backpropagation
     def __init__(self, data, args, op, device):
         super().__init__(data, args, op, device=device)
 
-        def _backward(t: Tensor, f_x, beta, grad):
+        def grad_fn(t: Tensor, f_x, beta, grad):
             x = t.data
             sigmoid = lambda x: 1 / (1 + t.xp.exp(-x))
 
             t._apply_grad(grad * (beta * f_x + sigmoid(beta * x) * (1 - beta * f_x)))
 
-        self._backward = _backward
+        self.grad_fn = grad_fn
 
 
 class Swish(Module):  # Static Swish computation
@@ -252,7 +252,7 @@ class _MishTensor(Tensor):  # Static Mish tensor for backpropagation
     def __init__(self, data, args, op, device):
         super().__init__(data, args, op, device=device)
 
-        def _backward(t: Tensor, grad):
+        def grad_fn(t: Tensor, grad):
             xp = t.xp
             x = t.data
 
@@ -264,7 +264,7 @@ def _backward(t: Tensor, grad):
 
             t._apply_grad(grad_x)
 
-        self._backward = _backward
+        self.grad_fn = grad_fn
 
 
 class Mish(Module):  # Static Mish computation
@@ -295,15 +295,15 @@ class _TanhExpTensor(Tensor):  # Static TanhExp tensor for backpropagation
     def __init__(self, data, args, op, device):
         super().__init__(data, args, op, device=device)
 
-        def _backward(t: Tensor, grad):
+        def grad_fn(t: Tensor, grad):
             xp = t.xp
             x = t.data
 
             grad_x = grad * (xp.tanh(xp.exp(x)) - x * xp.exp(x) * (xp.power(xp.tanh(xp.exp(x)), 2) - 1))
 
             t._apply_grad(grad_x)
 
-        self._backward = _backward
+        self.grad_fn = grad_fn
 
 class TanhExp(Module):  # Static TanhExp computation
     def __init__(self):
@@ -333,13 +333,13 @@ class _ELUTensor(Tensor):  # Static ELU tensor for backpropagation
     def __init__(self, data, args, op, device):
         super().__init__(data, args, op, device=device)
 
-        def _backward(t: Tensor, f_x, alpha, grad):
+        def grad_fn(t: Tensor, f_x, alpha, grad):
             x = t.data
             grad_x = grad * (t.xp.where(x <= 0, alpha + f_x, 1).astype(grad.dtype))
 
             t._apply_grad(grad_x)
 
-        self._backward = _backward
+        self.grad_fn = grad_fn
 
 
 class ELU(Module):  # Static ELU computation
@@ -359,13 +359,13 @@ class _SELUTensor(Tensor):  # Static SELU tensor for backpropagation
     def __init__(self, data, args, op, device):
         super().__init__(data, args, op, device=device)
 
-        def _backward(t: Tensor, alpha, lmbda, grad):
+        def grad_fn(t: Tensor, alpha, lmbda, grad):
             x = t.data
             grad_x = grad * (lmbda * t.xp.where(x > 0, 1, alpha * t.xp.exp(x)).astype(grad.dtype))
 
             t._apply_grad(grad_x)
 
-        self._backward = _backward
+        self.grad_fn = grad_fn
 
 
 class SELU(Module):  # Static SELU computation
@@ -388,7 +388,7 @@ class _GELUTensor(Tensor):  # Static GELU tensor for backpropagation
     def __init__(self, data, args, op, device):
         super().__init__(data, args, op, device=device)
 
-        def _backward(t: Tensor, grad):
+        def grad_fn(t: Tensor, grad):
             xp = t.xp
             x = t.data
             # sech = lambda z: 2 / (np.exp(z) + np.exp(-z))
@@ -403,7 +403,7 @@ def _backward(t: Tensor, grad):
 
             t._apply_grad(grad_x)
 
-        self._backward = _backward
+        self.grad_fn = grad_fn
 
 
 class GELU(Module):  # Static GELU computation
@@ -439,9 +439,9 @@ def __call__(self, x):
 #     def __init__(self, data, args, op, device):
 #         super().__init__(data, args, op, device=device)
 
-        # self._backward = self.__backward
+        # self.grad_fn = self._grad_fn
 
-#     def __backward(self):
+#     def _grad_fn(self):
 #         x = self.args[0].data
 #         # f_x = self.args[1]
 #         f_x = self.data
@@ -478,7 +478,7 @@ class _LogSoftmax(Tensor):  # Static LogSoftmax tensor for backpropagation
     def __init__(self, data, args, op, device):
         super().__init__(data, args, op, device=device)
 
-        def _backward(t: Tensor, f_x, axis, grad):
+        def grad_fn(t: Tensor, f_x, axis, grad):
             x = t.data
             batch_size = x.shape[0]
             softmax = f_x
@@ -489,7 +489,7 @@ def _backward(t: Tensor, f_x, axis, grad):
 
             t._apply_grad(grad_x)
 
-        self._backward = _backward
+        self.grad_fn = grad_fn
 
 
 class LogSoftmax(Module):  
diff --git a/neunet/nn/layers/avgpool2d.py b/neunet/nn/layers/avgpool2d.py
@@ -11,7 +11,7 @@ class _AvgPool2dTensor(Tensor):
     def __init__(self, data, args, op, device):
         super().__init__(data, args, op, device=device)
 
-        def _backward(
+        def grad_fn(
                 X: Tensor,
                 kernel_size,
                 stride,
@@ -45,7 +45,7 @@ def _backward(
 
             X._apply_grad(grad_X)
 
-        self._backward = _backward
+        self.grad_fn = grad_fn
 
 class AvgPool2d(Module):
     def __init__(self, kernel_size: Union[int, tuple[int, int]], stride: Optional[Union[int, tuple[int, int]]] = None, padding: Union[int, tuple[int, int]] = 0):
diff --git a/neunet/nn/layers/batchnorm1d.py b/neunet/nn/layers/batchnorm1d.py
@@ -12,7 +12,7 @@ class _BatchNorm1dTensor(Tensor):  # tensor for static backpropagation
     def __init__(self, data, args, op, device):
         super().__init__(data, args, op, device=device)
 
-        def _backward(X: Tensor, weight: Tensor, bias: Tensor, X_centered, stddev_inv, affine, grad):
+        def grad_fn(X: Tensor, weight: Tensor, bias: Tensor, X_centered, stddev_inv, affine, grad):
             X_hat = X_centered * stddev_inv
             batch_size = X.data.shape[0]
 
@@ -38,7 +38,7 @@ def _backward(X: Tensor, weight: Tensor, bias: Tensor, X_centered, stddev_inv, a
                 weight._apply_grad(grad_weight)
                 bias._apply_grad(grad_bias)
 
-        self._backward = _backward
+        self.grad_fn = grad_fn
 
 
 class BatchNorm1d(Module):  # layer with static backpropagation
diff --git a/neunet/nn/layers/batchnorm2d.py b/neunet/nn/layers/batchnorm2d.py
@@ -12,7 +12,7 @@ class _BatchNorm2dTensor(Tensor):  # tensor for static backpropagation
     def __init__(self, data, args, op, device):
         super().__init__(data, args, op, device=device)
 
-        def _backward(X: Tensor, weight: Tensor, bias: Tensor, X_centered, stddev_inv, affine, grad):
+        def grad_fn(X: Tensor, weight: Tensor, bias: Tensor, X_centered, stddev_inv, affine, grad):
             batch_size = X.data.shape[0] * X.data.shape[2] * X.data.shape[3]
 
             axis = (0, 2, 3)
@@ -49,7 +49,7 @@ def _backward(X: Tensor, weight: Tensor, bias: Tensor, X_centered, stddev_inv, a
                 weight._apply_grad(grad_weight)
                 bias._apply_grad(grad_bias)
 
-        self._backward = _backward
+        self.grad_fn = grad_fn
 
 
 class BatchNorm2d(Module):  # layer with static backpropagation
diff --git a/neunet/nn/layers/bidirectional.py b/neunet/nn/layers/bidirectional.py
@@ -11,7 +11,7 @@ class _BidirectionalTensor(Tensor):
     def __init__(self, data, args, op, device):
         super().__init__(data, args, op, device=device)
 
-        def _backward(D_O: Tensor, R_O: Tensor, merge_mode, grad):
+        def grad_fn(D_O: Tensor, R_O: Tensor, merge_mode, grad):
 
             if merge_mode == "concat":
                 direct_grad, reverse_grad = D_O.xp.split(grad, 2, axis=-1)
@@ -25,7 +25,7 @@ def _backward(D_O: Tensor, R_O: Tensor, merge_mode, grad):
             D_O._apply_grad(direct_grad)
             R_O._apply_grad(reverse_grad)
 
-        self._backward = _backward
+        self.grad_fn = grad_fn
 
 
 class Bidirectional(Module):
diff --git a/neunet/nn/layers/conv2d.py b/neunet/nn/layers/conv2d.py
@@ -13,7 +13,7 @@ class _Conv2dTensor(Tensor):  # tensor for static backpropagation
     def __init__(self, data, args, op, device):
         super().__init__(data, args, op, device=device)
 
-        def _backward(
+        def grad_fn(
                 X: Tensor,
                 weight: Tensor,
                 bias: Tensor,
@@ -114,7 +114,7 @@ def _backward(
             if bias is not None:
                 bias._apply_grad(grad_bias)
 
-        self._backward = _backward
+        self.grad_fn = grad_fn
 
 class Conv2d(Module):  # layer with static backpropagation
     """
diff --git a/neunet/nn/layers/convtranspose2d.py b/neunet/nn/layers/convtranspose2d.py
@@ -33,7 +33,7 @@ def prepare_grad(grad, padding, stride, dilated_kernel_size, output_padding):
 
             return unstrided_grad
 
-        def _backward(
+        def grad_fn(
                 X: Tensor,
                 weight: Tensor,
                 bias: Tensor,
@@ -107,7 +107,7 @@ def _backward(
             if bias is not None:
                 bias._apply_grad(grad_bias)
 
-        self._backward = _backward
+        self.grad_fn = grad_fn
 
 
 
diff --git a/neunet/nn/layers/dropout.py b/neunet/nn/layers/dropout.py
@@ -6,10 +6,10 @@ class _DropoutTensor(Tensor):  # tensor for static backpropagation
     def __init__(self, data, args, op, device):
         super().__init__(data, args, op, device=device)
 
-        def _backward(X: Tensor, mask, grad):
+        def grad_fn(X: Tensor, mask, grad):
             X._apply_grad(grad * mask)
 
-        self._backward = _backward
+        self.grad_fn = grad_fn
 
 
 
diff --git a/neunet/nn/layers/embedding.py b/neunet/nn/layers/embedding.py
@@ -10,14 +10,14 @@ class _EmbeddingTensor(Tensor):  # tensor for static backpropagation
     def __init__(self, data, args, op, device):
         super().__init__(data, args, op, device=device)
 
-        def _backward(X: np.ndarray, weight: Tensor, grad):
+        def grad_fn(X: np.ndarray, weight: Tensor, grad):
             axis = list(range(len(X.shape)))
             axis[-1], axis[-2] = axis[-2], axis[-1]
 
             weight_grad = weight.xp.matmul(X.transpose(*axis), grad)
             weight._apply_grad(weight_grad)
 
-        self._backward = _backward
+        self.grad_fn = grad_fn
 
 
 class Embedding(Module):
diff --git a/neunet/nn/layers/gru.py b/neunet/nn/layers/gru.py
@@ -13,7 +13,7 @@ class _GRUTensor(Tensor):
     def __init__(self, data, args, op, device):
         super().__init__(data, args, op, device=device)
 
-        def _backward(
+        def grad_fn(
                 X: Tensor,
                 weight_z: Tensor,
                 weight_r: Tensor,
@@ -121,7 +121,7 @@ def _backward(
                 bias_r._apply_grad(grad_bias_r)
                 bias_h._apply_grad(grad_bias_h)
 
-        self._backward = _backward
+        self.grad_fn = grad_fn
 
 
 class GRU(Module):
diff --git a/neunet/nn/layers/layernorm.py b/neunet/nn/layers/layernorm.py
@@ -45,7 +45,7 @@ class _LayerNormTensor(Tensor):  # tensor for static backpropagation
     def __init__(self, data, args, op, device):
         super().__init__(data, args, op, device=device)
 
-        def _backward(X: Tensor, weight: Tensor, bias: Tensor, X_centered, stddev_inv, axis, elementwise_affine, grad):
+        def grad_fn(X: Tensor, weight: Tensor, bias: Tensor, X_centered, stddev_inv, axis, elementwise_affine, grad):
             # _axis = list(axis) if isinstance(axis, tuple) else axis
             X_hat = X_centered * stddev_inv
 
@@ -89,7 +89,7 @@ def _backward(X: Tensor, weight: Tensor, bias: Tensor, X_centered, stddev_inv, a
                 weight._apply_grad(grad_weight)
                 bias._apply_grad(grad_bias)
 
-        self._backward = _backward
+        self.grad_fn = grad_fn
 
 
 class LayerNorm(Module):  # layer with static backpropagation
diff --git a/neunet/nn/layers/linear.py b/neunet/nn/layers/linear.py
diff --git a/neunet/nn/layers/lstm.py b/neunet/nn/layers/lstm.py
diff --git a/neunet/nn/layers/maxpool2d.py b/neunet/nn/layers/maxpool2d.py
diff --git a/neunet/nn/layers/rnn.py b/neunet/nn/layers/rnn.py