feat: [collection] support output type of list and tuple

inocsin · inocsin · commit ccee7f5aaf64 · 2022-03-17T19:43:47.000+08:00
Signed-off-by: inocsin &lt;vcheungyi@163.com&gt;
diff --git a/core/conversion/conversion.cpp b/core/conversion/conversion.cpp
@@ -481,7 +481,7 @@ std::string ConvertBlockToEngine(
 std::unordered_map<c10::OperatorName, std::string> GetUnsupportedOpsInBlock(const torch::jit::Block* b) {
   std::unordered_map<c10::OperatorName, std::string> unsupported_ops;
   for (const auto n : b->nodes()) {
-    if (n->kind() != torch::jit::prim::Loop && n->kind() != torch::jit::prim::If && !OpSupported(n)) {
+    if (n->kind() != torch::jit::prim::Loop && n->kind() != torch::jit::prim::If && !OpSupported(n) && n->kind() != torch::jit::prim::TupleConstruct) {
       auto schema = n->maybeSchema();
       TORCHTRT_CHECK(
           schema,
diff --git a/tests/cpp/test_collection.cpp b/tests/cpp/test_collection.cpp
@@ -6,6 +6,52 @@
 #include "torch_tensorrt/torch_tensorrt.h"
 
 
+TEST(CppAPITests, TestCollectionNormalInput) {
+
+  std::string path =
+  "/root/Torch-TensorRT/normal_model.ts";
+  torch::Tensor in0 = torch::randn({1, 3, 512, 512}, torch::kCUDA).to(torch::kHalf);
+  std::vector<at::Tensor> inputs;
+  inputs.push_back(in0);
+  inputs.push_back(in0);
+
+  torch::jit::Module mod;
+  try {
+    // Deserialize the ScriptModule from a file using torch::jit::load().
+    mod = torch::jit::load(path);
+  } catch (const c10::Error& e) {
+    std::cerr << "error loading the model\n";
+  }
+  mod.eval();
+  mod.to(torch::kCUDA);
+  
+
+  std::vector<torch::jit::IValue> inputs_;
+
+  for (auto in : inputs) {
+    inputs_.push_back(torch::jit::IValue(in.clone()));
+  }
+
+  auto out = mod.forward(inputs_);
+  LOG_DEBUG("Finish torchscirpt forward");
+
+  std::vector<torch_tensorrt::Input> input_range;
+  input_range.push_back({in0.sizes(), torch::kF16});
+  input_range.push_back({in0.sizes(), torch::kF16});
+  torch_tensorrt::ts::CompileSpec compile_settings(input_range);
+  compile_settings.require_full_compilation = true;
+  compile_settings.min_block_size = 1;
+
+  // // FP16 execution
+  compile_settings.enabled_precisions = {torch::kHalf};
+  // // Compile module
+  auto trt_mod = torch_tensorrt::torchscript::compile(mod, compile_settings);
+  LOG_DEBUG("Finish compile");
+  auto trt_out = trt_mod.forward(inputs_);
+
+  ASSERT_TRUE(torch_tensorrt::tests::util::almostEqual(out.toTensor(), trt_out.toTensor(), 1e-5));
+}
+
 TEST(CppAPITests, TestCollectionTupleInput) {
 
   std::string path =
@@ -81,14 +127,13 @@ TEST(CppAPITests, TestCollectionTupleInput) {
 }
 
 
-TEST(CppAPITests, TestCollectionNormalInput) {
+TEST(CppAPITests, TestCollectionListInput) {
 
   std::string path =
-  "/root/Torch-TensorRT/normal_model.ts";
+  "/root/Torch-TensorRT/list_input.ts";
   torch::Tensor in0 = torch::randn({1, 3, 512, 512}, torch::kCUDA).to(torch::kHalf);
   std::vector<at::Tensor> inputs;
   inputs.push_back(in0);
-  inputs.push_back(in0);
 
   torch::jit::Module mod;
   try {
@@ -107,32 +152,136 @@ TEST(CppAPITests, TestCollectionNormalInput) {
     inputs_.push_back(torch::jit::IValue(in.clone()));
   }
 
-  auto out = mod.forward(inputs_);
+  std::vector<torch::jit::IValue> complex_inputs;
+  auto input_list = c10::impl::GenericList(c10::TensorType::get());
+  input_list.push_back(inputs_[0]);
+  input_list.push_back(inputs_[0]);
+
+  torch::jit::IValue input_list_ivalue = torch::jit::IValue(input_list);
+
+  complex_inputs.push_back(input_list_ivalue);
+
+
+  auto out = mod.forward(complex_inputs);
   LOG_DEBUG("Finish torchscirpt forward");
 
-  std::vector<torch_tensorrt::Input> input_range;
-  input_range.push_back({in0.sizes(), torch::kF16});
-  input_range.push_back({in0.sizes(), torch::kF16});
-  torch_tensorrt::ts::CompileSpec compile_settings(input_range);
-  compile_settings.require_full_compilation = true;
+
+  // auto input_shape = torch_tensorrt::Input(in0.sizes(), torch_tensorrt::DataType::kUnknown);
+  auto input_shape = torch_tensorrt::Input(in0.sizes(), torch_tensorrt::DataType::kHalf);
+
+  auto input_shape_ivalue = torch::jit::IValue(std::move(c10::make_intrusive<torch_tensorrt::Input>(input_shape)));
+
+
+  c10::TypePtr elementType = input_shape_ivalue.type();
+  auto list = c10::impl::GenericList(elementType);
+  list.push_back(input_shape_ivalue);
+  list.push_back(input_shape_ivalue);
+
+
+  torch::jit::IValue complex_input_shape(list);
+  std::tuple<torch::jit::IValue> input_tuple2(complex_input_shape);
+  torch::jit::IValue complex_input_shape2(input_tuple2);
+
+  auto compile_settings = torch_tensorrt::ts::CompileSpec(complex_input_shape2);
+  compile_settings.require_full_compilation = false;
   compile_settings.min_block_size = 1;
+  compile_settings.torch_executed_ops.push_back("aten::__getitem__");
 
   // // FP16 execution
   compile_settings.enabled_precisions = {torch::kHalf};
   // // Compile module
   auto trt_mod = torch_tensorrt::torchscript::compile(mod, compile_settings);
   LOG_DEBUG("Finish compile");
-  auto trt_out = trt_mod.forward(inputs_);
+  auto trt_out = trt_mod.forward(complex_inputs);
+  // auto trt_out = trt_mod.forward(complex_inputs_list);
 
+  // std::cout << out.toTensor() << std::endl;
   ASSERT_TRUE(torch_tensorrt::tests::util::almostEqual(out.toTensor(), trt_out.toTensor(), 1e-5));
 }
 
 
+TEST(CppAPITests, TestCollectionTupleInputOutput) {
 
-TEST(CppAPITests, TestCollectionListInput) {
+  std::string path =
+  "/root/Torch-TensorRT/tuple_input_output.ts";
+  // torch::Tensor in0 = torch::randn({1, 3, 512, 512}, torch::kCUDA).to(torch::kFloat);
+  torch::Tensor in0 = torch::randn({1, 3, 512, 512}, torch::kCUDA).to(torch::kHalf);
+  // std::vector<at::Tensor> inputs;
+  // inputs.push_back(in0);
+
+  torch::jit::Module mod;
+  try {
+    // Deserialize the ScriptModule from a file using torch::jit::load().
+    mod = torch::jit::load(path);
+  } catch (const c10::Error& e) {
+    std::cerr << "error loading the model\n";
+  }
+  mod.eval();
+  mod.to(torch::kCUDA);
+
+
+  // std::vector<torch::jit::IValue> inputs_;
+
+  // for (auto in : inputs) {
+  //   inputs_.push_back(torch::jit::IValue(in.clone()));
+  // }
+
+
+  std::vector<torch::jit::IValue> complex_inputs, complex_inputs_list;
+  // std::vector<torch::jit::IValue> tuple;
+  std::tuple<torch::jit::IValue, torch::jit::IValue> input_tuple(in0, in0);
+  // auto input_list = c10::impl::GenericList(c10::TensorType::get());
+  // input_list.push_back(inputs_[0]);
+  // input_list.push_back(inputs_[0]);
+
+  // torch::jit::IValue input_list_ivalue = torch::jit::IValue(input_list);
+
+  complex_inputs.push_back(input_tuple);
+
+  auto out = mod.forward(complex_inputs);
+  LOG_DEBUG("Finish torchscirpt forward");
+
+  // auto input_shape = torch_tensorrt::Input(in0.sizes(), torch_tensorrt::DataType::kUnknown);
+  auto input_shape = torch_tensorrt::Input(in0.sizes(), torch_tensorrt::DataType::kHalf);
+
+  auto input_shape_ivalue = torch::jit::IValue(std::move(c10::make_intrusive<torch_tensorrt::Input>(input_shape)));
+
+
+  // c10::TypePtr elementType = input_shape_ivalue.type();
+  // auto list = c10::impl::GenericList(elementType);
+  // list.push_back(input_shape_ivalue);
+  // list.push_back(input_shape_ivalue);
+
+  std::tuple<torch::jit::IValue, torch::jit::IValue> input_shape_tuple(input_shape_ivalue, input_shape_ivalue);
+
+  torch::jit::IValue complex_input_shape(input_shape_tuple);
+  std::tuple<torch::jit::IValue> input_tuple2(complex_input_shape);
+  torch::jit::IValue complex_input_shape2(input_tuple2);
+  // torch::jit::IValue complex_input_shape(list);
+
+  auto compile_settings = torch_tensorrt::ts::CompileSpec(complex_input_shape2);
+  compile_settings.require_full_compilation = false;
+  compile_settings.min_block_size = 1;
+
+  // compile_settings.torch_executed_ops.push_back("prim::TupleConstruct");
+
+  // // FP16 execution
+  compile_settings.enabled_precisions = {torch::kHalf};
+  // // Compile module
+  auto trt_mod = torch_tensorrt::torchscript::compile(mod, compile_settings);
+  LOG_DEBUG("Finish compile");
+  auto trt_out = trt_mod.forward(complex_inputs);
+  // std::cout << out.toTensor() << std::endl;
+
+  ASSERT_TRUE(torch_tensorrt::tests::util::almostEqual(out.toTuple()->elements()[0].toTensor(), trt_out.toTuple()->elements()[0].toTensor(), 1e-5));
+  ASSERT_TRUE(torch_tensorrt::tests::util::almostEqual(out.toTuple()->elements()[1].toTensor(), trt_out.toTuple()->elements()[1].toTensor(), 1e-5));
+}
+
+
+TEST(CppAPITests, TestCollectionListInputOutput) {
 
   std::string path =
-  "/root/Torch-TensorRT/list_input.ts";
+  "/root/Torch-TensorRT/list_input_output.ts";
   torch::Tensor in0 = torch::randn({1, 3, 512, 512}, torch::kCUDA).to(torch::kHalf);
   std::vector<at::Tensor> inputs;
   inputs.push_back(in0);
@@ -187,7 +336,10 @@ TEST(CppAPITests, TestCollectionListInput) {
   auto compile_settings = torch_tensorrt::ts::CompileSpec(complex_input_shape2);
   compile_settings.require_full_compilation = false;
   compile_settings.min_block_size = 1;
+
+  // Need to skip the conversion of __getitem__ and ListConstruct
   compile_settings.torch_executed_ops.push_back("aten::__getitem__");
+  compile_settings.torch_executed_ops.push_back("prim::ListConstruct");
 
   // // FP16 execution
   compile_settings.enabled_precisions = {torch::kHalf};
@@ -198,5 +350,7 @@ TEST(CppAPITests, TestCollectionListInput) {
   // auto trt_out = trt_mod.forward(complex_inputs_list);
 
   // std::cout << out.toTensor() << std::endl;
-  ASSERT_TRUE(torch_tensorrt::tests::util::almostEqual(out.toTensor(), trt_out.toTensor(), 1e-5));
+  
+  ASSERT_TRUE(torch_tensorrt::tests::util::almostEqual(out.toList().vec()[0].toTensor(), trt_out.toList().vec()[0].toTensor(), 1e-5));
+  ASSERT_TRUE(torch_tensorrt::tests::util::almostEqual(out.toList().vec()[1].toTensor(), trt_out.toList().vec()[1].toTensor(), 1e-5));
 }
diff --git a/tests/py/test_collection.py b/tests/py/test_collection.py
@@ -59,6 +59,25 @@ def forward(self, z: List[torch.Tensor]):
         r = z[0] + z[1]
         return r
 
+class TupleInputOutput(nn.Module):
+    def __init__(self):
+        super(TupleInputOutput, self).__init__()
+
+    def forward(self, z: Tuple[torch.Tensor, torch.Tensor]):
+        r1 = z[0] + z[1]
+        r2 = z[0] - z[1]
+        r = (r1, r2)
+        return r
+
+class ListInputOutput(nn.Module):
+    def __init__(self):
+        super(ListInputOutput, self).__init__()
+
+    def forward(self, z: List[torch.Tensor]):
+        r1 = z[0] + z[1]
+        r2 = z[0] - z[1]
+        r = [r1, r2]
+        return r
 
 input_data = torch.randn((16, 3, 32, 32))
 input_data = input_data.float().to("cuda")
@@ -82,4 +101,18 @@ def forward(self, z: List[torch.Tensor]):
 print(list_input_ts.graph)
 result = list_input_ts([input_data, input_data])
 list_input_ts.to("cuda").eval()
-torch.jit.save(list_input_ts, "./list_input.ts")
+torch.jit.save(list_input_ts, "./list_input.ts")
+
+tuple_input = TupleInputOutput()
+tuple_input_ts = torch.jit.script(tuple_input)
+print(tuple_input_ts.graph)
+result = tuple_input_ts((input_data, input_data))
+tuple_input_ts.to("cuda").eval()
+torch.jit.save(tuple_input_ts, "./tuple_input_output.ts")
+
+list_input = ListInputOutput()
+list_input_ts = torch.jit.script(list_input)
+print(list_input_ts.graph)
+result = list_input_ts([input_data, input_data])
+list_input_ts.to("cuda").eval()
+torch.jit.save(list_input_ts, "./list_input_output.ts")