From 855551226e2ac78539ceee83e7a7f22ca880aed2 Mon Sep 17 00:00:00 2001
From: AhnDW <zsef123@gmail.com>
Date: Thu, 12 Aug 2021 03:07:22 +0000
Subject: [PATCH 1/4] Add instance norm

Signed-off-by: AhnDW <zsef123@gmail.com>
---
 .../conversion/converters/impl/batch_norm.cpp | 206 +++++++++++++-----
 tests/core/conversion/converters/BUILD        |   5 +
 .../converters/test_instance_norm.cpp         |  86 ++++++++
 3 files changed, 245 insertions(+), 52 deletions(-)
 create mode 100644 tests/core/conversion/converters/test_instance_norm.cpp

diff --git a/core/conversion/converters/impl/batch_norm.cpp b/core/conversion/converters/impl/batch_norm.cpp
index fc19cb282e..8cd95fbd54 100644
--- a/core/conversion/converters/impl/batch_norm.cpp
+++ b/core/conversion/converters/impl/batch_norm.cpp
@@ -10,61 +10,163 @@ namespace converters {
 namespace impl {
 namespace {
 
-auto batch_norm_registrations TRTORCH_UNUSED = RegisterNodeConversionPatterns().pattern({
-    R"SIG(aten::batch_norm(Tensor input, Tensor? gamma, Tensor? beta,
+void _batch_norm(
+    ConversionCtx* ctx,
+    const torch::jit::Node* n,
+    nvinfer1::ITensor* input,
+    const nvinfer1::Dims32& orig_shape,
+    const torch::Tensor& gamma,
+    const torch::Tensor& beta,
+    const torch::Tensor& mean,
+    const torch::Tensor& var,
+    const float eps) {
+  auto scale = gamma / torch::sqrt(var + eps);
+  auto bias = beta - mean * scale;
+  LOG_DEBUG("_batch_norm Tensor Scale : " << scale.sizes());
+  LOG_DEBUG("_batch_norm Tensor bias : " << bias.sizes());
+
+  auto scale_weights = Weights(ctx, scale);
+  auto bias_weights = Weights(ctx, bias);
+
+  auto power = Weights(ctx, at::ones_like(scale));
+  auto bn =
+      ctx->net->addScaleNd(*input, nvinfer1::ScaleMode::kCHANNEL, bias_weights.data, scale_weights.data, power.data, 1);
+  bn->setName(util::node_info(n).c_str());
+
+  // Un-pad bn output if needed
+  auto out_tensor = addUnpadding(ctx, n, bn->getOutput(0), orig_shape.nbDims);
+  ctx->AssociateValueAndTensor(n->outputs()[0], out_tensor);
+}
+
+auto batch_norm_registrations TRTORCH_UNUSED =
+    RegisterNodeConversionPatterns()
+        .pattern({
+            R"SIG(aten::batch_norm(Tensor input, Tensor? gamma, Tensor? beta,
                             Tensor? mean, Tensor? var,
                             bool training, float momentum, float eps, bool cudnn_enabled) -> (Tensor))SIG",
-    [](ConversionCtx* ctx, const torch::jit::Node* n, args& args) -> bool {
-      auto input = args[0].ITensor(); // assumes non-static input Tensor
-      auto orig_shape = input->getDimensions();
-      auto shape = util::toVec(orig_shape);
-      auto tensor_type = util::TRTDataTypeToScalarType(input->getType());
-      auto options = torch::TensorOptions().dtype(tensor_type);
-
-      torch::Tensor gamma, beta, mean, var;
-
-      if (ctx->input_is_dynamic) {
-        gamma = args[1].unwrapToTensor();
-        beta = args[2].unwrapToTensor();
-        mean = args[3].unwrapToTensor();
-        var = args[4].unwrapToTensor();
-      } else {
-        gamma = args[1].unwrapToTensor(at::full({shape}, 1, {options}));
-        beta = args[2].unwrapToTensor(at::full({shape}, 1, {options}));
-        mean = args[3].unwrapToTensor(at::full({shape}, 0, {options}));
-        var = args[4].unwrapToTensor(at::full({shape}, 0, {options}));
-      }
-
-      auto eps = args[7].unwrapToDouble(1e-5f);
-
-      LOG_DEBUG("momentum disregarded");
-      LOG_DEBUG("training disregarded");
-      LOG_DEBUG("cudnn disregarded");
-      TRTORCH_CHECK(orig_shape.nbDims > 2, "Unable to create batch normalization layer from node: " << *n);
-
-      // Expand spatial dims from 1D to 2D if needed
-      bool expandDims = (orig_shape.nbDims < 4);
-
-      if (expandDims) {
-        input = addPadding(ctx, n, input, 4);
-      }
-
-      auto scale = gamma / torch::sqrt(var + eps);
-      auto bias = beta - mean * scale;
-
-      auto scale_weights = Weights(ctx, scale);
-      auto bias_weights = Weights(ctx, bias);
-
-      auto power = Weights(ctx, at::ones_like(scale));
-      auto bn = ctx->net->addScaleNd(
-          *input, nvinfer1::ScaleMode::kCHANNEL, bias_weights.data, scale_weights.data, power.data, 1);
-      bn->setName(util::node_info(n).c_str());
-      // Un-pad bn output if needed
-      auto out_tensor = addUnpadding(ctx, n, bn->getOutput(0), orig_shape.nbDims);
-      ctx->AssociateValueAndTensor(n->outputs()[0], out_tensor);
-      return true;
-    }});
+            [](ConversionCtx* ctx, const torch::jit::Node* n, args& args) -> bool {
+              auto input = args[0].ITensor(); // assumes non-static input Tensor
+              auto orig_shape = input->getDimensions();
+              auto shape = util::toVec(orig_shape);
+              auto tensor_type = util::TRTDataTypeToScalarType(input->getType());
+              auto options = torch::TensorOptions().dtype(tensor_type);
+
+              torch::Tensor gamma, beta, mean, var;
+
+              if (ctx->input_is_dynamic) {
+                gamma = args[1].unwrapToTensor();
+                beta = args[2].unwrapToTensor();
+                mean = args[3].unwrapToTensor();
+                var = args[4].unwrapToTensor();
+              } else {
+                gamma = args[1].unwrapToTensor(at::full({shape}, 1, {options}));
+                beta = args[2].unwrapToTensor(at::full({shape}, 1, {options}));
+                mean = args[3].unwrapToTensor(at::full({shape}, 0, {options}));
+                var = args[4].unwrapToTensor(at::full({shape}, 0, {options}));
+              }
+
+              auto eps = static_cast<float>(args[7].unwrapToDouble(1e-5f));
+
+              LOG_DEBUG("momentum disregarded");
+              LOG_DEBUG("training disregarded");
+              LOG_DEBUG("cudnn disregarded");
+              TRTORCH_CHECK(orig_shape.nbDims > 2, "Unable to create batch normalization layer from node: " << *n);
+
+              // Expand spatial dims from 1D to 2D if needed
+              bool expandDims = (orig_shape.nbDims < 4);
+              if (expandDims) {
+                input = addPadding(ctx, n, input, 4);
+              }
+
+              _batch_norm(ctx, n, input, orig_shape, gamma, beta, mean, var, eps);
+
+              return true;
+            }})
+        .pattern({
+            R"SIG(aten::instance_norm(Tensor input, Tensor? weight, Tensor? bias,
+                              Tensor? running_mean, Tensor? running_var,
+                              bool use_input_stats, float momentum, float eps,
+                              bool cudnn_enabled) -> (Tensor))SIG",
+            [](ConversionCtx* ctx, const torch::jit::Node* n, args& args) -> bool {
+              auto input = args[0].ITensorOrFreeze(ctx);
+              auto orig_shape = input->getDimensions();
+              auto shape = util::toVec(orig_shape);
+              auto tensor_type = util::TRTDataTypeToScalarType(input->getType());
+              auto options = torch::TensorOptions().dtype(tensor_type);
+
+              LOG_DEBUG("Input :" << orig_shape << "/" << input->getType());
+              // affine=True
+              LOG_DEBUG("Args[1] weight : " << args[1].isIValue() << " / " << args[1].IValue()->isNone());
+              LOG_DEBUG("Args[2] bias : " << args[2].isIValue() << " / " << args[2].IValue()->isNone());
+              // track_running_stats=True
+              LOG_DEBUG("Args[3] running_mean : " << args[3].isIValue() << " / " << args[3].IValue()->isNone());
+              LOG_DEBUG("Args[4] running_var : " << args[4].isIValue() << " / " << args[4].IValue()->isNone());
+              
+              LOG_DEBUG("use_input_stats, momemtum, cudnn_enabled disregarded");
+              LOG_DEBUG("ctx->input_is_dynamic : " << ctx->input_is_dynamic);
+              
+              // Expand spatial dims from 1D to 2D if needed
+              bool expandDims = (orig_shape.nbDims < 4);
+              if (expandDims) {
+                input = addPadding(ctx, n, input, 4);
+              }
+
+              auto eps = static_cast<float>(args[7].unwrapToDouble(1e-5f));
+
+              auto scales = args[1].unwrapToTensor(at::ones(shape[1], options)).cpu().contiguous();
+              auto bias = args[2].unwrapToTensor(at::zeros(shape[1], options)).cpu().contiguous();
+              LOG_DEBUG("Scales : " <<    );
+              LOG_DEBUG("bias : " << bias);
+              
+              // track_running_stats=True
+              if (!args[3].IValue()->isNone() || !args[4].IValue()->isNone()) {
+                auto running_mean = args[3].unwrapToTensor().cpu().contiguous();
+                auto running_var = args[4].unwrapToTensor().cpu().contiguous();
+                _batch_norm(ctx, n, input, orig_shape, scales, bias, running_mean, running_var, eps);
+                return true;
+              }
+
+              const int relu = 0;
+              const float alpha = 0;
+              LOG_DEBUG("Set parameter `relu` and `alpha` to 0");
+              /*
+              https://docs.nvidia.com/deeplearning/tensorrt/api/c_api/namespacenvinfer1.html
+              https://github.com/NVIDIA/TensorRT/tree/8.0.1/plugin/instanceNormalizationPlugin
+              Type	      Parameter	  Description
+              float	      epsilon	    A small number to prevent being divided by zero during normalization.
+              Weights *	  scale	      A pointer to weights which contains information about scale factors for
+                                      normalization. The definition of Weights can be found in the NvInfer.h header. 
+              Weights *	  bias        A pointer to weights which contains information about the bias values for
+                                      normalization. The definition of Weights can be found in the NvInfer.h header.
+              int	        relu	      A value used to enable leaky relu activation
+              float	      alpha	      A small negative slope for the leaky relu activation
+              */
+              std::vector<nvinfer1::PluginField> f;
+              f.emplace_back(nvinfer1::PluginField("epsilon", &eps, nvinfer1::PluginFieldType::kFLOAT32, 1));
+              f.emplace_back(nvinfer1::PluginField(
+                  "scales", scales.data_ptr<float>(), nvinfer1::PluginFieldType::kFLOAT32, scales.numel()));
+              f.emplace_back(nvinfer1::PluginField(
+                  "bias", bias.data_ptr<float>(), nvinfer1::PluginFieldType::kFLOAT32, bias.numel()));
+              f.emplace_back(nvinfer1::PluginField("relu", &relu, nvinfer1::PluginFieldType::kINT32, 1));
+              f.emplace_back(nvinfer1::PluginField("alpha", &alpha, nvinfer1::PluginFieldType::kFLOAT32, 1));
+
+              nvinfer1::PluginFieldCollection fc;
+              fc.nbFields = f.size();
+              fc.fields = f.data();
+
+              auto creator = getPluginRegistry()->getPluginCreator("InstanceNormalization_TRT", "1", "");
+              auto instance_norm_plugin = creator->createPlugin("instance_norm", &fc);
+
+              TRTORCH_CHECK(
+                  instance_norm_plugin, "Unable to create instance_norm plugin from TensorRT plugin registry" << *n);
+
+              auto new_layer =
+                  ctx->net->addPluginV2(reinterpret_cast<nvinfer1::ITensor* const*>(&input), 1, *instance_norm_plugin);
 
+              new_layer->setName(util::node_info(n).c_str());
+              auto out_tensor = ctx->AssociateValueAndTensor(n->outputs()[0], new_layer->getOutput(0));
+              return true;
+            }});
 } // namespace
 } // namespace impl
 } // namespace converters
diff --git a/tests/core/conversion/converters/BUILD b/tests/core/conversion/converters/BUILD
index df02242ef8..d29a206bfe 100644
--- a/tests/core/conversion/converters/BUILD
+++ b/tests/core/conversion/converters/BUILD
@@ -15,6 +15,10 @@ converter_test(
     name = "test_batch_norm",
 )
 
+converter_test(
+    name = "test_instance_norm",
+)
+
 converter_test(
     name = "test_clone",
 )
@@ -120,6 +124,7 @@ test_suite(
     tests = [
         ":test_activation",
         ":test_batch_norm",
+        ":test_instance_norm",
         ":test_clone",
         ":test_concat",
         ":test_constant_pad",
diff --git a/tests/core/conversion/converters/test_instance_norm.cpp b/tests/core/conversion/converters/test_instance_norm.cpp
new file mode 100644
index 0000000000..742636c9c8
--- /dev/null
+++ b/tests/core/conversion/converters/test_instance_norm.cpp
@@ -0,0 +1,86 @@
+#include <string>
+#include "core/compiler.h"
+#include "gtest/gtest.h"
+#include "tests/util/util.h"
+#include "torch/csrc/jit/ir/irparser.h"
+
+// Tensor instance_norm(
+//     const Tensor& input,
+//     const c10::optional<Tensor>& weight_opt /* optional */,
+//     const c10::optional<Tensor>& bias_opt /* optional */,
+//     const c10::optional<Tensor>& running_mean_opt /* optional */,
+//     const c10::optional<Tensor>& running_var_opt /* optional */,
+//     bool use_input_stats, double momentum, double eps, bool cudnn_enabled) 
+inline constexpr auto graph = R"IR(
+      graph(%0 : Tensor,
+            %1 : Tensor?,
+            %2 : Tensor?,
+            %3 : Tensor?,
+            %4 : Tensor?,
+            %5 : bool):
+        %9 : bool = prim::Constant[value=0]()
+        %6 : float = prim::Constant[value=0.10000000000000001]()
+        %7 : float = prim::Constant[value=1.0000000000000001e-05]()
+        %8 : Tensor = aten::instance_norm(%0, %1, %2, %3, %4, %5, %6, %7, %9)
+        return (%8)
+)IR";
+
+TEST(Converters, ATenInstanceNormConvertsCorrectly) {
+  auto g = std::make_shared<torch::jit::Graph>();
+  torch::jit::parseIR(graph, g.get());
+
+  auto in = at::randint(1, 10, {1, 5, 5, 5}, {at::kCUDA});
+  torch::jit::IValue weight, bias, mean, var; // NoneType
+  bool use_input_stats = true;
+
+  auto params = trtorch::core::conversion::get_named_params(g->inputs(), {weight, bias, mean, var, use_input_stats});
+  auto jit_results = trtorch::tests::util::RunGraph(g, params, {in});
+
+  params = trtorch::core::conversion::get_named_params(g->inputs(), {weight, bias, mean, var, use_input_stats});
+  auto trt_results = trtorch::tests::util::RunGraphEngine(g, params, {in});
+
+  ASSERT_TRUE(trtorch::tests::util::almostEqual(jit_results[0], trt_results[0].reshape_as(jit_results[0]), 2e-6));
+}
+
+TEST(Converters, ATenInstanceNormAffineConvertsCorrectly) {
+  auto g = std::make_shared<torch::jit::Graph>();
+  torch::jit::parseIR(graph, g.get());
+
+  auto in = at::randint(1, 10, {1, 5, 5, 5}, {at::kCUDA});
+
+  auto weight = at::randn({in.size(1)}).to(at::kCUDA);
+  auto bias = at::randn({in.size(1)}).to(at::kCUDA);
+
+  torch::jit::IValue mean, var; // NoneType
+  bool use_input_stats = true;
+
+  auto params = trtorch::core::conversion::get_named_params(g->inputs(), {weight, bias, mean, var, use_input_stats});
+  auto jit_results = trtorch::tests::util::RunGraph(g, params, {in});
+
+  params = trtorch::core::conversion::get_named_params(g->inputs(), {weight, bias, mean, var, use_input_stats});
+  auto trt_results = trtorch::tests::util::RunGraphEngine(g, params, {in});
+
+  ASSERT_TRUE(trtorch::tests::util::almostEqual(jit_results[0], trt_results[0].reshape_as(jit_results[0]), 2e-6));
+}
+
+
+TEST(Converters, ATenInstanceNormRunningStatsConvertsCorrectly) {
+  auto g = std::make_shared<torch::jit::Graph>();
+  torch::jit::parseIR(graph, g.get());
+
+  auto in = at::randint(1, 10, {1, 5, 5, 5}, {at::kCUDA});
+
+  torch::jit::IValue weight, bias; // NoneType
+
+  auto mean = at::randn({in.size(1)}).to(at::kCUDA);
+  auto var = at::randn({in.size(1)}).to(at::kCUDA);
+  bool use_input_stats = false;
+
+  auto params = trtorch::core::conversion::get_named_params(g->inputs(), {weight, bias, mean, var, use_input_stats});
+  auto jit_results = trtorch::tests::util::RunGraph(g, params, {in});
+
+  params = trtorch::core::conversion::get_named_params(g->inputs(), {weight, bias, mean, var, use_input_stats});
+  auto trt_results = trtorch::tests::util::RunGraphEngine(g, params, {in});
+
+  ASSERT_TRUE(trtorch::tests::util::almostEqual(jit_results[0], trt_results[0].reshape_as(jit_results[0]), 2e-6));
+}

From 31d3b9021feb2cdd08a52227a8e96d579f88437f Mon Sep 17 00:00:00 2001
From: AhnDW <zsef123@gmail.com>
Date: Wed, 18 Aug 2021 06:05:05 +0000
Subject: [PATCH 2/4] fix typo

Signed-off-by: AhnDW <zsef123@gmail.com>
---
 core/conversion/converters/impl/batch_norm.cpp | 2 --
 1 file changed, 2 deletions(-)

diff --git a/core/conversion/converters/impl/batch_norm.cpp b/core/conversion/converters/impl/batch_norm.cpp
index 8cd95fbd54..4b5dc830b5 100644
--- a/core/conversion/converters/impl/batch_norm.cpp
+++ b/core/conversion/converters/impl/batch_norm.cpp
@@ -115,8 +115,6 @@ auto batch_norm_registrations TRTORCH_UNUSED =
 
               auto scales = args[1].unwrapToTensor(at::ones(shape[1], options)).cpu().contiguous();
               auto bias = args[2].unwrapToTensor(at::zeros(shape[1], options)).cpu().contiguous();
-              LOG_DEBUG("Scales : " <<    );
-              LOG_DEBUG("bias : " << bias);
               
               // track_running_stats=True
               if (!args[3].IValue()->isNone() || !args[4].IValue()->isNone()) {

From d861f4ad75d89d595e363386fda6a866550d2180 Mon Sep 17 00:00:00 2001
From: AhnDW <zsef123@gmail.com>
Date: Thu, 19 Aug 2021 17:38:06 +0000
Subject: [PATCH 3/4] Fix test cases

Signed-off-by: AhnDW <zsef123@gmail.com>
---
 .../conversion/converters/impl/batch_norm.cpp |  9 +--
 .../converters/test_instance_norm.cpp         | 75 +++++++++++--------
 2 files changed, 49 insertions(+), 35 deletions(-)

diff --git a/core/conversion/converters/impl/batch_norm.cpp b/core/conversion/converters/impl/batch_norm.cpp
index 4b5dc830b5..5ef4098500 100644
--- a/core/conversion/converters/impl/batch_norm.cpp
+++ b/core/conversion/converters/impl/batch_norm.cpp
@@ -101,7 +101,6 @@ auto batch_norm_registrations TRTORCH_UNUSED =
               // track_running_stats=True
               LOG_DEBUG("Args[3] running_mean : " << args[3].isIValue() << " / " << args[3].IValue()->isNone());
               LOG_DEBUG("Args[4] running_var : " << args[4].isIValue() << " / " << args[4].IValue()->isNone());
-              
               LOG_DEBUG("use_input_stats, momemtum, cudnn_enabled disregarded");
               LOG_DEBUG("ctx->input_is_dynamic : " << ctx->input_is_dynamic);
               
@@ -112,15 +111,15 @@ auto batch_norm_registrations TRTORCH_UNUSED =
               }
 
               auto eps = static_cast<float>(args[7].unwrapToDouble(1e-5f));
-
+              
               auto scales = args[1].unwrapToTensor(at::ones(shape[1], options)).cpu().contiguous();
               auto bias = args[2].unwrapToTensor(at::zeros(shape[1], options)).cpu().contiguous();
               
               // track_running_stats=True
               if (!args[3].IValue()->isNone() || !args[4].IValue()->isNone()) {
-                auto running_mean = args[3].unwrapToTensor().cpu().contiguous();
-                auto running_var = args[4].unwrapToTensor().cpu().contiguous();
-                _batch_norm(ctx, n, input, orig_shape, scales, bias, running_mean, running_var, eps);
+                auto running_mean = args[3].unwrapToTensor();
+                auto running_var = args[4].unwrapToTensor();
+                _batch_norm(ctx, n, input, orig_shape, scales.to(running_mean.options()), bias.to(running_mean.options()), running_mean, running_var, eps);
                 return true;
               }
 
diff --git a/tests/core/conversion/converters/test_instance_norm.cpp b/tests/core/conversion/converters/test_instance_norm.cpp
index 742636c9c8..2c2bd549f4 100644
--- a/tests/core/conversion/converters/test_instance_norm.cpp
+++ b/tests/core/conversion/converters/test_instance_norm.cpp
@@ -11,33 +11,41 @@
 //     const c10::optional<Tensor>& running_mean_opt /* optional */,
 //     const c10::optional<Tensor>& running_var_opt /* optional */,
 //     bool use_input_stats, double momentum, double eps, bool cudnn_enabled) 
-inline constexpr auto graph = R"IR(
-      graph(%0 : Tensor,
-            %1 : Tensor?,
-            %2 : Tensor?,
-            %3 : Tensor?,
-            %4 : Tensor?,
-            %5 : bool):
-        %9 : bool = prim::Constant[value=0]()
-        %6 : float = prim::Constant[value=0.10000000000000001]()
-        %7 : float = prim::Constant[value=1.0000000000000001e-05]()
-        %8 : Tensor = aten::instance_norm(%0, %1, %2, %3, %4, %5, %6, %7, %9)
-        return (%8)
+constexpr auto graph = R"IR(
+      graph(%input.1 : Tensor,
+            %weight.1 : Tensor?,
+            %bias.1 : Tensor?,
+            %running_mean.1 : Tensor?,
+            %running_var.1 : Tensor?,
+            %use_input_stats.1 : bool):
+        %cudnn_enabled.1 : bool = prim::Constant[value=1]()
+        %momentum.1 : float = prim::Constant[value=0.10000000000000001]()
+        %eps.1 : float = prim::Constant[value=1.0000000000000001e-05]()
+        %4 : Tensor = aten::instance_norm(%input.1,
+          %weight.1, %bias.1,
+          %running_mean.1, %running_var.1,
+          %use_input_stats.1, %momentum.1, %eps.1, %cudnn_enabled.1)
+        return (%4)
 )IR";
 
+
 TEST(Converters, ATenInstanceNormConvertsCorrectly) {
   auto g = std::make_shared<torch::jit::Graph>();
   torch::jit::parseIR(graph, g.get());
 
   auto in = at::randint(1, 10, {1, 5, 5, 5}, {at::kCUDA});
   torch::jit::IValue weight, bias, mean, var; // NoneType
-  bool use_input_stats = true;
+  // https://github.com/pytorch/pytorch/blob/79693bb86a3f601a5c0d3da52d99acec95bb48c1/torch/nn/modules/instancenorm.py#L59
+  const bool use_input_stats = true; 
+  
+  auto trt_in = at::clone(in);
+  torch::jit::IValue trt_weight, trt_bias, trt_mean, trt_var;
 
   auto params = trtorch::core::conversion::get_named_params(g->inputs(), {weight, bias, mean, var, use_input_stats});
   auto jit_results = trtorch::tests::util::RunGraph(g, params, {in});
 
-  params = trtorch::core::conversion::get_named_params(g->inputs(), {weight, bias, mean, var, use_input_stats});
-  auto trt_results = trtorch::tests::util::RunGraphEngine(g, params, {in});
+  params = trtorch::core::conversion::get_named_params(g->inputs(), {trt_weight, trt_bias, trt_mean, trt_var, use_input_stats});
+  auto trt_results = trtorch::tests::util::RunGraphEngine(g, params, {trt_in});
 
   ASSERT_TRUE(trtorch::tests::util::almostEqual(jit_results[0], trt_results[0].reshape_as(jit_results[0]), 2e-6));
 }
@@ -50,37 +58,44 @@ TEST(Converters, ATenInstanceNormAffineConvertsCorrectly) {
 
   auto weight = at::randn({in.size(1)}).to(at::kCUDA);
   auto bias = at::randn({in.size(1)}).to(at::kCUDA);
+    
+  torch::jit::IValue mean, var; // NoneType  
+  const bool use_input_stats = true;
 
-  torch::jit::IValue mean, var; // NoneType
-  bool use_input_stats = true;
+  auto trt_in = at::clone(in);
+  auto trt_weight = at::clone(weight);
+  auto trt_bias = at::clone(bias);
+  torch::jit::IValue trt_mean, trt_var;
 
   auto params = trtorch::core::conversion::get_named_params(g->inputs(), {weight, bias, mean, var, use_input_stats});
   auto jit_results = trtorch::tests::util::RunGraph(g, params, {in});
 
-  params = trtorch::core::conversion::get_named_params(g->inputs(), {weight, bias, mean, var, use_input_stats});
-  auto trt_results = trtorch::tests::util::RunGraphEngine(g, params, {in});
+  params = trtorch::core::conversion::get_named_params(g->inputs(), {trt_weight, trt_bias, trt_mean, trt_var, use_input_stats});
+  auto trt_results = trtorch::tests::util::RunGraphEngine(g, params, {trt_in});
 
   ASSERT_TRUE(trtorch::tests::util::almostEqual(jit_results[0], trt_results[0].reshape_as(jit_results[0]), 2e-6));
 }
 
-
 TEST(Converters, ATenInstanceNormRunningStatsConvertsCorrectly) {
   auto g = std::make_shared<torch::jit::Graph>();
   torch::jit::parseIR(graph, g.get());
 
-  auto in = at::randint(1, 10, {1, 5, 5, 5}, {at::kCUDA});
-
-  torch::jit::IValue weight, bias; // NoneType
-
-  auto mean = at::randn({in.size(1)}).to(at::kCUDA);
-  auto var = at::randn({in.size(1)}).to(at::kCUDA);
-  bool use_input_stats = false;
+  auto in = at::randn({1, 5, 5, 5}, {at::kCUDA});
+  
+  torch::jit::IValue weight, bias;
+  auto mean = at::zeros({in.size(1)}, {at::kCUDA});
+  auto var = at::ones({in.size(1)}, {at::kCUDA});
+  const bool use_input_stats = false;
+  
+  auto trt_in = at::clone(in);
+  torch::jit::IValue trt_weight, trt_bias;
+  auto trt_mean = at::clone(mean);
+  auto trt_var = at::clone(var);
 
   auto params = trtorch::core::conversion::get_named_params(g->inputs(), {weight, bias, mean, var, use_input_stats});
   auto jit_results = trtorch::tests::util::RunGraph(g, params, {in});
 
-  params = trtorch::core::conversion::get_named_params(g->inputs(), {weight, bias, mean, var, use_input_stats});
-  auto trt_results = trtorch::tests::util::RunGraphEngine(g, params, {in});
-
+  params = trtorch::core::conversion::get_named_params(g->inputs(), {trt_weight, trt_bias, trt_mean, trt_var, use_input_stats});
+  auto trt_results = trtorch::tests::util::RunGraphEngine(g, params, {trt_in});
   ASSERT_TRUE(trtorch::tests::util::almostEqual(jit_results[0], trt_results[0].reshape_as(jit_results[0]), 2e-6));
 }

From 027217b3e7614d2b5ad6c66329ab7c62f7d7c48f Mon Sep 17 00:00:00 2001
From: Naren Dasan <naren@narendasan.com>
Date: Fri, 20 Aug 2021 14:04:29 -0700
Subject: [PATCH 4/4] refactor: Apply linting

Signed-off-by: Naren Dasan <naren@narendasan.com>
Signed-off-by: Naren Dasan <narens@nvidia.com>
---
 .../conversion/converters/impl/batch_norm.cpp | 21 ++++++++++++----
 .../converters/test_instance_norm.cpp         | 24 ++++++++++---------
 2 files changed, 29 insertions(+), 16 deletions(-)

diff --git a/core/conversion/converters/impl/batch_norm.cpp b/core/conversion/converters/impl/batch_norm.cpp
index 5ef4098500..252f51dae0 100644
--- a/core/conversion/converters/impl/batch_norm.cpp
+++ b/core/conversion/converters/impl/batch_norm.cpp
@@ -36,6 +36,7 @@ void _batch_norm(
   // Un-pad bn output if needed
   auto out_tensor = addUnpadding(ctx, n, bn->getOutput(0), orig_shape.nbDims);
   ctx->AssociateValueAndTensor(n->outputs()[0], out_tensor);
+  LOG_DEBUG("Output tensor shape: " << out_tensor->getDimensions());
 }
 
 auto batch_norm_registrations TRTORCH_UNUSED =
@@ -103,7 +104,7 @@ auto batch_norm_registrations TRTORCH_UNUSED =
               LOG_DEBUG("Args[4] running_var : " << args[4].isIValue() << " / " << args[4].IValue()->isNone());
               LOG_DEBUG("use_input_stats, momemtum, cudnn_enabled disregarded");
               LOG_DEBUG("ctx->input_is_dynamic : " << ctx->input_is_dynamic);
-              
+
               // Expand spatial dims from 1D to 2D if needed
               bool expandDims = (orig_shape.nbDims < 4);
               if (expandDims) {
@@ -111,15 +112,24 @@ auto batch_norm_registrations TRTORCH_UNUSED =
               }
 
               auto eps = static_cast<float>(args[7].unwrapToDouble(1e-5f));
-              
+
               auto scales = args[1].unwrapToTensor(at::ones(shape[1], options)).cpu().contiguous();
               auto bias = args[2].unwrapToTensor(at::zeros(shape[1], options)).cpu().contiguous();
-              
+
               // track_running_stats=True
               if (!args[3].IValue()->isNone() || !args[4].IValue()->isNone()) {
                 auto running_mean = args[3].unwrapToTensor();
                 auto running_var = args[4].unwrapToTensor();
-                _batch_norm(ctx, n, input, orig_shape, scales.to(running_mean.options()), bias.to(running_mean.options()), running_mean, running_var, eps);
+                _batch_norm(
+                    ctx,
+                    n,
+                    input,
+                    orig_shape,
+                    scales.to(running_mean.options()),
+                    bias.to(running_mean.options()),
+                    running_mean,
+                    running_var,
+                    eps);
                 return true;
               }
 
@@ -132,7 +142,7 @@ auto batch_norm_registrations TRTORCH_UNUSED =
               Type	      Parameter	  Description
               float	      epsilon	    A small number to prevent being divided by zero during normalization.
               Weights *	  scale	      A pointer to weights which contains information about scale factors for
-                                      normalization. The definition of Weights can be found in the NvInfer.h header. 
+                                      normalization. The definition of Weights can be found in the NvInfer.h header.
               Weights *	  bias        A pointer to weights which contains information about the bias values for
                                       normalization. The definition of Weights can be found in the NvInfer.h header.
               int	        relu	      A value used to enable leaky relu activation
@@ -162,6 +172,7 @@ auto batch_norm_registrations TRTORCH_UNUSED =
 
               new_layer->setName(util::node_info(n).c_str());
               auto out_tensor = ctx->AssociateValueAndTensor(n->outputs()[0], new_layer->getOutput(0));
+              LOG_DEBUG("Output tensor shape: " << out_tensor->getDimensions());
               return true;
             }});
 } // namespace
diff --git a/tests/core/conversion/converters/test_instance_norm.cpp b/tests/core/conversion/converters/test_instance_norm.cpp
index 2c2bd549f4..1df8d45d66 100644
--- a/tests/core/conversion/converters/test_instance_norm.cpp
+++ b/tests/core/conversion/converters/test_instance_norm.cpp
@@ -10,7 +10,7 @@
 //     const c10::optional<Tensor>& bias_opt /* optional */,
 //     const c10::optional<Tensor>& running_mean_opt /* optional */,
 //     const c10::optional<Tensor>& running_var_opt /* optional */,
-//     bool use_input_stats, double momentum, double eps, bool cudnn_enabled) 
+//     bool use_input_stats, double momentum, double eps, bool cudnn_enabled)
 constexpr auto graph = R"IR(
       graph(%input.1 : Tensor,
             %weight.1 : Tensor?,
@@ -28,7 +28,6 @@ constexpr auto graph = R"IR(
         return (%4)
 )IR";
 
-
 TEST(Converters, ATenInstanceNormConvertsCorrectly) {
   auto g = std::make_shared<torch::jit::Graph>();
   torch::jit::parseIR(graph, g.get());
@@ -36,15 +35,16 @@ TEST(Converters, ATenInstanceNormConvertsCorrectly) {
   auto in = at::randint(1, 10, {1, 5, 5, 5}, {at::kCUDA});
   torch::jit::IValue weight, bias, mean, var; // NoneType
   // https://github.com/pytorch/pytorch/blob/79693bb86a3f601a5c0d3da52d99acec95bb48c1/torch/nn/modules/instancenorm.py#L59
-  const bool use_input_stats = true; 
-  
+  const bool use_input_stats = true;
+
   auto trt_in = at::clone(in);
   torch::jit::IValue trt_weight, trt_bias, trt_mean, trt_var;
 
   auto params = trtorch::core::conversion::get_named_params(g->inputs(), {weight, bias, mean, var, use_input_stats});
   auto jit_results = trtorch::tests::util::RunGraph(g, params, {in});
 
-  params = trtorch::core::conversion::get_named_params(g->inputs(), {trt_weight, trt_bias, trt_mean, trt_var, use_input_stats});
+  params = trtorch::core::conversion::get_named_params(
+      g->inputs(), {trt_weight, trt_bias, trt_mean, trt_var, use_input_stats});
   auto trt_results = trtorch::tests::util::RunGraphEngine(g, params, {trt_in});
 
   ASSERT_TRUE(trtorch::tests::util::almostEqual(jit_results[0], trt_results[0].reshape_as(jit_results[0]), 2e-6));
@@ -58,8 +58,8 @@ TEST(Converters, ATenInstanceNormAffineConvertsCorrectly) {
 
   auto weight = at::randn({in.size(1)}).to(at::kCUDA);
   auto bias = at::randn({in.size(1)}).to(at::kCUDA);
-    
-  torch::jit::IValue mean, var; // NoneType  
+
+  torch::jit::IValue mean, var; // NoneType
   const bool use_input_stats = true;
 
   auto trt_in = at::clone(in);
@@ -70,7 +70,8 @@ TEST(Converters, ATenInstanceNormAffineConvertsCorrectly) {
   auto params = trtorch::core::conversion::get_named_params(g->inputs(), {weight, bias, mean, var, use_input_stats});
   auto jit_results = trtorch::tests::util::RunGraph(g, params, {in});
 
-  params = trtorch::core::conversion::get_named_params(g->inputs(), {trt_weight, trt_bias, trt_mean, trt_var, use_input_stats});
+  params = trtorch::core::conversion::get_named_params(
+      g->inputs(), {trt_weight, trt_bias, trt_mean, trt_var, use_input_stats});
   auto trt_results = trtorch::tests::util::RunGraphEngine(g, params, {trt_in});
 
   ASSERT_TRUE(trtorch::tests::util::almostEqual(jit_results[0], trt_results[0].reshape_as(jit_results[0]), 2e-6));
@@ -81,12 +82,12 @@ TEST(Converters, ATenInstanceNormRunningStatsConvertsCorrectly) {
   torch::jit::parseIR(graph, g.get());
 
   auto in = at::randn({1, 5, 5, 5}, {at::kCUDA});
-  
+
   torch::jit::IValue weight, bias;
   auto mean = at::zeros({in.size(1)}, {at::kCUDA});
   auto var = at::ones({in.size(1)}, {at::kCUDA});
   const bool use_input_stats = false;
-  
+
   auto trt_in = at::clone(in);
   torch::jit::IValue trt_weight, trt_bias;
   auto trt_mean = at::clone(mean);
@@ -95,7 +96,8 @@ TEST(Converters, ATenInstanceNormRunningStatsConvertsCorrectly) {
   auto params = trtorch::core::conversion::get_named_params(g->inputs(), {weight, bias, mean, var, use_input_stats});
   auto jit_results = trtorch::tests::util::RunGraph(g, params, {in});
 
-  params = trtorch::core::conversion::get_named_params(g->inputs(), {trt_weight, trt_bias, trt_mean, trt_var, use_input_stats});
+  params = trtorch::core::conversion::get_named_params(
+      g->inputs(), {trt_weight, trt_bias, trt_mean, trt_var, use_input_stats});
   auto trt_results = trtorch::tests::util::RunGraphEngine(g, params, {trt_in});
   ASSERT_TRUE(trtorch::tests::util::almostEqual(jit_results[0], trt_results[0].reshape_as(jit_results[0]), 2e-6));
 }