Apply suggestions from code review

ravinkohli · nabenabe0928 · web-flow · commit dc01cd3b9b66 · 2021-10-12T10:26:50.000+02:00
Co-authored-by: nabenabe0928 &lt;47781922+nabenabe0928@users.noreply.github.com&gt;
diff --git a/autoPyTorch/pipeline/components/setup/network_backbone/utils.py b/autoPyTorch/pipeline/components/setup/network_backbone/utils.py
@@ -100,7 +100,7 @@ def shake_get_alpha_beta(
     """
     The methods used in this function have been introduced in 'ShakeShake Regularisation'
     https://arxiv.org/abs/1705.07485. The names have been taken from the paper as well.
-    Currently, this function supports `even-even`, `shake-even` and `shake-shake`
+    Currently, this function supports `even-even`, `shake-even`, `shake-shake` and `M3`.
     """
     if not is_training:
         result = (torch.FloatTensor([0.5]), torch.FloatTensor([0.5]))
diff --git a/test/test_data/test_feature_validator.py b/test/test_data/test_feature_validator.py
@@ -317,14 +317,23 @@ def test_featurevalidator_get_columns_to_encode():
     assert feature_types == ['numerical', 'numerical', 'categorical', 'categorical']
 
 
-def test_featurevalidator_remove_nan_catcolumns():
+def feature_validator_remove_nan_catcolumns(df_train: pd.DataFrame, df_test: pd.DataFrame,
+                                            ans_train: np.ndarray, ans_test: np.ndarray) -> None:
+    validator = TabularFeatureValidator()
+    validator.fit(df_train)
+    transformed_df_train = validator.transform(df_train)
+    transformed_df_test = validator.transform(df_test)
+
+    assert np.array_equal(transformed_df_train, ans_train)
+    assert np.array_equal(transformed_df_test, ans_test)
+
+
+def test_feature_validator_remove_nan_catcolumns():
     """
     Make sure categorical columns that have only nan values are removed.
     """
-    # First case, there exist null columns in the train set
-    # and the same columns are not all null for the test set.
-    validator = TabularFeatureValidator()
-
+    # First case, there exist null columns (B and C) in the train set
+    # and a same column (C) are not all null for the test set.
     df_train = pd.DataFrame(
         [
             {'A': 1, 'B': np.nan, 'C': np.nan},
@@ -333,6 +342,7 @@ def test_featurevalidator_remove_nan_catcolumns():
         ],
         dtype='category',
     )
+    ans_train = np.array([[0, 1], [1, 0], [0, 1]], dtype=np.float64)
     df_test = pd.DataFrame(
         [
             {'A': np.nan, 'B': np.nan, 'C': 5},
@@ -341,18 +351,11 @@ def test_featurevalidator_remove_nan_catcolumns():
         ],
         dtype='category',
     )
+    ans_test = np.array([[1, 0], [1, 0], [0, 1]], dtype=np.float64)
+    feature_validator_remove_nan_catcolumns(df_train, df_test, ans_train, ans_test)
 
-    validator.fit(df_train)
-    transformed_df_train = validator.transform(df_train)
-    transformed_df_test = validator.transform(df_test)
-
-    assert np.array_equal(transformed_df_train, np.array([[0, 1], [1, 0], [0, 1]], dtype=float))
-    assert np.array_equal(transformed_df_test, np.array([[1, 0], [1, 0], [0, 1]], dtype=float))
-
-    # Second case, there exist null columns in the training set and the same
-    # are null in the test set.
-    validator = TabularFeatureValidator()
-
+    # Second case, there exist null columns (B and C) in the training set and
+    # the same columns (B and C) are null in the test set.
     df_train = pd.DataFrame(
         [
             {'A': 1, 'B': np.nan, 'C': np.nan},
@@ -361,6 +364,7 @@ def test_featurevalidator_remove_nan_catcolumns():
         ],
         dtype='category',
     )
+    ans_train = np.array([[0, 1], [1, 0], [0, 1]], dtype=np.float64)
     df_test = pd.DataFrame(
         [
             {'A': np.nan, 'B': np.nan, 'C': np.nan},
@@ -369,40 +373,28 @@ def test_featurevalidator_remove_nan_catcolumns():
         ],
         dtype='category',
     )
+    ans_test = np.array([[1, 0], [1, 0], [0, 1]], dtype=np.float64)
+    feature_validator_remove_nan_catcolumns(df_train, df_test, ans_train, ans_test)
 
-    validator.fit(df_train)
-    transformed_df_train = validator.transform(df_train)
-    transformed_df_test = validator.transform(df_test)
-
-    assert np.array_equal(transformed_df_train, np.array([[0, 1], [1, 0], [0, 1]], dtype=float))
-    assert np.array_equal(transformed_df_test, np.array([[1, 0], [1, 0], [0, 1]], dtype=float))
-
-    # Third case, there exist no null columns in the training set and a
-    # few null columns exist in the test set.
-    validator = TabularFeatureValidator()
-
+    # Third case, there exist no null columns in the training set and
+    # null columns exist in the test set.
     df_train = pd.DataFrame(
         [
             {'A': 1, 'B': 1},
             {'A': 2, 'B': 2}
         ],
         dtype='category',
     )
+    ans_train = np.array([[1, 0, 1, 0], [0, 1, 0, 1]], dtype=np.float64)
     df_test = pd.DataFrame(
         [
             {'A': np.nan, 'B': np.nan},
             {'A': np.nan, 'B': np.nan}
         ],
         dtype='category',
     )
-
-    validator.fit(df_train)
-    transformed_df_train = validator.transform(df_train)
-    transformed_df_test = validator.transform(df_test)
-
-    assert np.array_equal(transformed_df_train, np.array([[1, 0, 1, 0], [0, 1, 0, 1]], dtype=float))
-    assert np.array_equal(transformed_df_test, np.array([[0, 0, 0, 0], [0, 0, 0, 0]], dtype=float))
-
+    ans_test = np.array([[0, 0, 0, 0], [0, 0, 0, 0]], dtype=np.float64)
+    feature_validator_remove_nan_catcolumns(df_train, df_test, ans_train, ans_test)
 
 def test_features_unsupported_calls_are_raised():
     """