ldmx-sw/ONNXRuntime_8cxx_source.html

#include "Tools/ONNXRuntime.h"


#include <algorithm>

#include <cassert>

#include <exception>

#include <functional>

#include <iostream>

#include <numeric>


namespace ldmx::Ort {


using namespace ::Ort;


#if ORT_API_VERSION == 2

// version used when first integrated onnx into ldmx-sw

// and version downloaded by cmake infrastructure

// only support x86_64 architectures

std::string get_input_name(std::unique_ptr<Session>& s, size_t i,

                           AllocatorWithDefaultOptions a) {

  return s->GetInputName(i, a);

}

std::string get_output_name(std::unique_ptr<Session>& s, size_t i,

                            AllocatorWithDefaultOptions a) {

  return s->GetOutputName(i, a);

}

#else

// latest version with prebuilds for both x86_64 and arm64

// architectures but contains a slight API change

std::string get_input_name(std::unique_ptr<Session>& s, size_t i,

                           AllocatorWithDefaultOptions a) {

  return s->GetInputNameAllocated(i, a).get();

}

std::string get_output_name(std::unique_ptr<Session>& s, size_t i,

                            AllocatorWithDefaultOptions a) {

  return s->GetOutputNameAllocated(i, a).get();

}

#if ORT_API_VERSION != 15

#pragma warning( \

    "Untested ONNX version, not certain of API, assuming API version 15.")

#endif

#endif


Env ONNXRuntime::env_(ORT_LOGGING_LEVEL_WARNING, "");


ONNXRuntime::ONNXRuntime(const std::string& model_path,

                         const SessionOptions* session_options) {

  // create session

  if (session_options) {

    session_.reset(new Session(env_, model_path.c_str(), *session_options));

  } else {

    SessionOptions sess_opts;

    sess_opts.SetIntraOpNumThreads(1);

    session_.reset(new Session(env_, model_path.c_str(), sess_opts));

  }

  AllocatorWithDefaultOptions allocator;


  // get input names and shapes

  size_t num_input_nodes = session_->GetInputCount();

  input_node_strings_.resize(num_input_nodes);

  input_node_names_.resize(num_input_nodes);

  input_node_dims_.clear();


  for (size_t i = 0; i < num_input_nodes; i++) {

    // get input node names

    std::string input_name(get_input_name(session_, i, allocator));

    input_node_strings_[i] = input_name;

    input_node_names_[i] = input_node_strings_[i].c_str();


    // get input shapes

    auto type_info = session_->GetInputTypeInfo(i);

    auto tensor_info = type_info.GetTensorTypeAndShapeInfo();

    size_t num_dims = tensor_info.GetDimensionsCount();

    input_node_dims_[input_name].resize(num_dims);

    const auto input_shape = tensor_info.GetShape();

    std::copy(input_shape.begin(), input_shape.end(),

              input_node_dims_[input_name].begin());


    // set the batch size to 1 by default

    input_node_dims_[input_name].at(0) = 1;

  }


  size_t num_output_nodes = session_->GetOutputCount();

  output_node_strings_.resize(num_output_nodes);

  output_node_names_.resize(num_output_nodes);

  output_node_dims_.clear();


  for (size_t i = 0; i < num_output_nodes; i++) {

    // get output node names

    std::string output_name(get_output_name(session_, i, allocator));

    output_node_strings_[i] = output_name;

    output_node_names_[i] = output_node_strings_[i].c_str();


    // get output node types

    auto type_info = session_->GetOutputTypeInfo(i);

    auto tensor_info = type_info.GetTensorTypeAndShapeInfo();

    size_t num_dims = tensor_info.GetDimensionsCount();

    output_node_dims_[output_name].resize(num_dims);

    const auto output_shape = tensor_info.GetShape();

    std::copy(output_shape.begin(), output_shape.end(),

              output_node_dims_[output_name].begin());


    // the 0th dim depends on the batch size

    output_node_dims_[output_name].at(0) = -1;

  }

}


ONNXRuntime::~ONNXRuntime() {}


FloatArrays ONNXRuntime::run(const std::vector<std::string>& input_names,

                             FloatArrays& input_values,

                             const std::vector<std::string>& output_names,

                             int64_t batch_size) const {

  assert(input_names.size() == input_values.size());

  assert(batch_size > 0);


  // create input tensor objects from data values

  std::vector<Value> input_tensors;

  auto memory_info =

      MemoryInfo::CreateCpu(OrtArenaAllocator, OrtMemTypeDefault);

  for (const auto& name : input_node_strings_) {

    auto iter = std::find(input_names.begin(), input_names.end(), name);

    if (iter == input_names.end()) {

      throw std::runtime_error("Input " + name + " is not provided!");

    }

    auto value = input_values.begin() + (iter - input_names.begin());

    auto input_dims = input_node_dims_.at(name);

    input_dims[0] = batch_size;

    auto expected_len = std::accumulate(input_dims.begin(), input_dims.end(), 1,

                                        std::multiplies<int64_t>());

    if (expected_len != (int64_t)value->size()) {

      throw std::runtime_error("Input array " + name + " has a wrong size of " +

                               std::to_string(value->size()) + ", expected " +

                               std::to_string(expected_len));

    }

    auto input_tensor =

        Value::CreateTensor<float>(memory_info, value->data(), value->size(),

                                   input_dims.data(), input_dims.size());

    assert(input_tensor.IsTensor());

    input_tensors.emplace_back(std::move(input_tensor));

  }


  // set output node names; will get all outputs if `output_names` is not

  // provided

  std::vector<const char*> run_output_node_names;

  if (output_names.empty()) {

    run_output_node_names = output_node_names_;

  } else {

    for (const auto& name : output_names) {

      run_output_node_names.push_back(name.c_str());

    }

  }


  // run

  auto output_tensors =

      session_->Run(RunOptions{nullptr}, input_node_names_.data(),

                    input_tensors.data(), input_tensors.size(),

                    run_output_node_names.data(), run_output_node_names.size());


  // convert output to floats

  FloatArrays outputs;

  for (auto& output_tensor : output_tensors) {

    assert(output_tensor.IsTensor());


    // get output shape

    auto tensor_info = output_tensor.GetTensorTypeAndShapeInfo();

    auto length = tensor_info.GetElementCount();


    auto floatarr = output_tensor.GetTensorMutableData<float>();

    outputs.emplace_back(floatarr, floatarr + length);

  }

  assert(outputs.size() == run_output_node_names.size());


  return outputs;

}

FloatArrays ONNXRuntime::run(const std::vector<std::string>& input_names, {…}


const std::vector<std::string>& ONNXRuntime::getOutputNames() const {

  if (session_) {

    return output_node_strings_;

  } else {

    throw std::runtime_error("ONNXRuntime session is not initialized!");

  }

}

const std::vector<std::string>& ONNXRuntime::getOutputNames() const  {…}


const std::vector<int64_t>& ONNXRuntime::getOutputShape(

    const std::string& output_name) const {

  auto iter = output_node_dims_.find(output_name);

  if (iter == output_node_dims_.end()) {

    throw std::runtime_error("Output name " + output_name + " is invalid!");

  } else {

    return iter->second;

  }

}

const std::vector<int64_t>& ONNXRuntime::getOutputShape( {…}


} /* namespace ldmx::Ort */

ldmx::Ort::ONNXRuntime::run
FloatArrays run(const std::vector< std::string > &input_names, FloatArrays &input_values, const std::vector< std::string > &output_names={}, int64_t batch_size=1) const
Run model inference and get outputs.
Definition ONNXRuntime.cxx:110

ldmx::Ort::ONNXRuntime::ONNXRuntime
ONNXRuntime(const std::string &model_path, const ::Ort::SessionOptions *session_options=nullptr)
Class constructor.

ldmx::Ort::ONNXRuntime::getOutputShape
const std::vector< int64_t > & getOutputShape(const std::string &output_name) const
Get the shape of a output node.
Definition ONNXRuntime.cxx:185

ldmx::Ort::ONNXRuntime::getOutputNames
const std::vector< std::string > & getOutputNames() const
Get the names of all the output nodes.
Definition ONNXRuntime.cxx:177