From 8cf3fbf1453bc6ec8a0ade4ebce814352878841f Mon Sep 17 00:00:00 2001
From: Vladislav Denisov <vlad.roix@yandex.ru>
Date: Mon, 3 Nov 2025 16:27:07 +0300
Subject: [PATCH 01/17] IREE inference

---
 src/inference/README.md           |  78 ++++++++
 src/inference/inference_iree.py   | 307 ++++++++++++++++++++++++++++++
 src/inference/io_adapter.py       |   8 +
 src/inference/io_model_wrapper.py |  16 ++
 src/inference/transformer.py      |  68 +++++++
 5 files changed, 477 insertions(+)
 create mode 100644 src/inference/inference_iree.py

diff --git a/src/inference/README.md b/src/inference/README.md
index da8fe747b..0f569467e 100644
--- a/src/inference/README.md
+++ b/src/inference/README.md
@@ -17,6 +17,7 @@
 1. ncnn.
 1. PaddlePaddle.
 1. Spektral.
+1. IREE.
 
 ## Вывод глубоких моделей с использованием Inference Engine
 
@@ -1482,6 +1483,82 @@ python inference_ncnn.py --model <model_name> \
                          --batch_size <batch_size>
 ```
 
+## Вывод глубоких моделей с использованием IREE
+
+#### Аргументы командной строки
+
+Название скрипта:
+
+```bash
+inference_iree.py
+```
+
+Обязательные аргументы:
+
+- `-m / --model` - путь до vmfb-файла, содержащего скомпилированную модель.
+- `-fn / --function_name` - название функции, которая будет вызвана IREE для исполнения модели.
+- `-i / --input` - путь до изображения или директории с изображениями
+  (расширения файлов `.jpg`, `.png`, `.bmp` и т.д.).
+- `-is / --input_shape` - размеры входного тензора сети в формате
+  BxCxWxH, B - размер пачки, C - количество каналов изображений,
+  W - ширина изображений, H - высота изображений.
+
+Опциональные аргументы:
+
+- `-b / --batch_size` - количество изображений, которые будут обработаны
+  за один проход сети. По умолчанию равно `1`.
+- `-ni / --number_iter` - количество прямых проходов по сети.
+  По умолчанию выполняется один проход по сети.
+- `--time` - время выполнения инференса в секундах. Этот параметр можно 
+  задать вместо задать вместо параметра `-ni / --number_iter`. Если 
+  одновременно указать и `-ni / --number_iter` и `--time`,
+  то будет учитываться тот параметр, при котором инферес работает дольше.
+- `--layout` - формат входных тензоров. По умолчанию `NHWС`.
+- `--channel_swap` - порядок перестановки цветовых каналов изображения.
+  Загрузка изображений осуществляется в формате BGR (порядок
+  соответствует `(0, 1, 2)`), а большинство нейронных сетей принимают
+  на вход изображения в формате RGB, поэтому по умолчанию порядок
+  `(2, 1, 0)`.
+- `--norm` - флаг необходимости нормировки изображений.
+  Среднее и среднеквадратическое отклонение, которые принимаются
+  на вход указываются в следующих двух аргументах.
+- `--mean` - среднее значение интенсивности, которое вычитается
+  из изображений в процессе нормировки. По умолчанию
+  данный параметр принимает значение `0 0 0`.
+- `--std` - среднеквадратическое отклонение интенсивности, на которое
+  делится значение интенсивности каждого пикселя входного изображения
+  в процессе нормировки. По умолчанию данный параметр принимает значение `1 1 1`.
+- `-t / --task` - название задачи. Текущая реализация поддерживает
+  решение задачи классификации (`classification`). По умолчанию принимает значение `feedforward`.
+- `-nt / --number_top` - количество лучших результатов, выводимых
+  при решении задачи классификации. По умолчанию выводится `10` наилучших
+  результатов.
+- `-l / --labels`- путь до файла в формате JSON с перечнем меток
+  при решении задачи. По умолчанию принимает значение
+  `image_net_labels.json`, что соответствует меткам набора данных
+  ImageNet.
+- `-d / --device` - оборудование, на котором выполняется вывод сети.
+  Поддерживается вывод на CPU (значение параметра `CPU`). По умолчанию принимает значение `CPU`.
+- `--raw_output` - работа скрипта без логов. По умолчанию не установлен.
+- `--report_path` - путь до файла с отчетом в формате `.json`.
+
+
+#### Примеры запуска
+
+**Командная строка для решения задачи классификации изображений**
+
+```bash
+python3 inference_iree.py \
+    -t classification -i <path_to_image>/<image_name> \
+    -m <path_to_model>/<model_name>.vmfb \
+    --function_name main_graph \
+    --input_shape 1 3 224 224 \ 
+    --labels <path_to_labels>/image_net_synset.txt
+```
+
+Результат выполнения: набор наиболее вероятных классов, которым принадлежит
+изображение.
+
 <!-- LINKS -->
 [execution_providers]: https://onnxruntime.ai/docs/execution-providers
 [gluon_modelzoo]: https://cv.gluon.ai/model_zoo/index.html
@@ -1492,3 +1569,4 @@ python inference_ncnn.py --model <model_name> \
 [dgl]: https://www.dgl.ai/pages/start.html
 [ogb]: https://ogb.stanford.edu/
 [tensorflow-gpu]: https://www.tensorflow.org/install/pip
+[iree]: https://iree.dev/
diff --git a/src/inference/inference_iree.py b/src/inference/inference_iree.py
new file mode 100644
index 000000000..8cf9d49ea
--- /dev/null
+++ b/src/inference/inference_iree.py
@@ -0,0 +1,307 @@
+import argparse
+import sys
+import traceback
+from pathlib import Path
+
+import postprocessing_data as pp
+from inference_tools.loop_tools import loop_inference, get_exec_time
+from io_adapter import IOAdapter
+from io_model_wrapper import IREEModelWrapper
+from reporter.report_writer import ReportWriter
+from transformer import IREETransformer
+
+import numpy as np
+
+sys.path.append(str(Path(__file__).resolve().parents[1].joinpath('utils')))
+from logger_conf import configure_logger  # noqa: E402
+
+log = configure_logger()
+
+try:
+    import iree.runtime as ireert  # noqa: E402
+except ImportError as e:
+    log.error(f"IREE import error: {e}")
+    sys.exit(1)
+
+
+def cli_argument_parser():
+    parser = argparse.ArgumentParser()
+
+    
+    parser.add_argument('-m', '--model',
+                        help='Path to .vmfb file with compiled model.',
+                        required=True,
+                        type=str,
+                        dest='model')
+    parser.add_argument('-fn', '--function_name',
+                        help='IREE module function name to execute.',
+                        required=True,
+                        type=str,
+                        dest='function_name')
+    parser.add_argument('-i', '--input',
+                        help='Path to data.',
+                        required=True,
+                        type=str,
+                        nargs='+',
+                        dest='input')
+    parser.add_argument('-is', '--input_shape',
+                        help='Input shape BxHxWxC, B is a batch size,'
+                             'H is an input tensor height,'
+                             'W is an input tensor width,'
+                             'C is an input tensor number of channels.',
+                        required=True,
+                        type=int,
+                        nargs=4,
+                        dest='input_shape')
+    parser.add_argument('-b', '--batch_size',
+                        help='Size of the processed pack.'
+                             'Should be the same as B in input_shape argument.',
+                        default=1,
+                        type=int,
+                        dest='batch_size')
+    parser.add_argument('-l', '--labels',
+                        help='Labels mapping file.',
+                        default=None,
+                        type=str,
+                        dest='labels')
+    parser.add_argument('-nt', '--number_top',
+                        help='Number of top results.',
+                        default=5,
+                        type=int,
+                        dest='number_top')
+    parser.add_argument('-t', '--task',
+                        help='Task type. Default: feedforward.',
+                        choices=['feedforward', 'classification'],
+                        default='feedforward',
+                        type=str,
+                        dest='task')
+    parser.add_argument('-ni', '--number_iter',
+                        help='Number of inference iterations.',
+                        default=1,
+                        type=int,
+                        dest='number_iter')
+    parser.add_argument('--raw_output',
+                        help='Raw output without logs.',
+                        default=False,
+                        type=bool,
+                        dest='raw_output')
+    parser.add_argument('--time',
+                        required=False,
+                        default=0,
+                        type=int,
+                        dest='time',
+                        help='Optional. Maximum test duration. 0 if no restrictions.')
+    parser.add_argument('--report_path',
+                        type=Path,
+                        default=Path(__file__).parent / 'iree_inference_report.json',
+                        dest='report_path')
+    parser.add_argument('--layout',
+                        help='Input layout.',
+                        default='NHWC',
+                        choices=['NHWC', 'NCHW'],
+                        type=str,
+                        dest='layout')
+    parser.add_argument('--norm',
+                        help='Flag to normalize input images.',
+                        action='store_true',
+                        dest='norm')
+    parser.add_argument('--mean',
+                        help='Mean values.',
+                        default=[0, 0, 0],
+                        type=float,
+                        nargs=3,
+                        dest='mean')
+    parser.add_argument('--std',
+                        help='Standard deviation values.',
+                        default=[1., 1., 1.],
+                        type=float,
+                        nargs=3,
+                        dest='std')
+    parser.add_argument('--channel_swap',
+                        help='Parameter of channel swap.',
+                        default=[2, 1, 0],
+                        type=int,
+                        nargs=3,
+                        dest='channel_swap')
+    parser.add_argument('-d', '--device',
+                        help='Specify the target device to infer (CPU by default)',
+                        default='CPU',
+                        type=str,
+                        dest='device')
+
+    return parser.parse_args()
+
+
+def load_iree_model(model_path):
+    try:
+        config = ireert.Config('local-task')
+
+        with open(model_path, 'rb') as f:
+            vmfb_buffer = f.read()
+
+        vm_module = ireert.VmModule.from_flatbuffer(config.vm_instance, vmfb_buffer)
+        context = ireert.SystemContext(config=config)
+        context.add_vm_module(vm_module)
+
+        log.info(f"Successfully loaded IREE model")
+        return context
+
+    except Exception as e:
+        log.error(f"Failed to load IREE model: {e}")
+        raise
+
+
+def get_inference_function(model_context, function_name):
+    try:
+        main_module = model_context.modules.module
+        inference_func = main_module[function_name]
+        log.info(f"Using function '{function_name}' for inference")
+        return inference_func
+
+    except Exception as e:
+        log.error(f"Failed to get inference function: {e}")
+        raise
+
+
+def inference_iree(inference_func, number_iter, get_slice, test_duration):
+    result = None
+    time_infer = []
+
+    if number_iter == 1:
+        slice_input = get_slice()
+        result, exec_time = infer_slice(inference_func, slice_input)
+        time_infer.append(exec_time)
+    else:
+        time_infer = loop_inference(number_iter, test_duration)(
+            inference_iteration
+        )(inference_func, get_slice)['time_infer']
+    
+    log.info('Inference completed')
+    return result, time_infer
+
+
+def inference_iteration(inference_func, get_slice):
+    slice_input = get_slice()
+    _, exec_time = infer_slice(inference_func, slice_input)
+    return exec_time
+
+
+@get_exec_time()
+def infer_slice(inference_func, slice_input):
+    config = ireert.Config('local-task')
+    device = config.device
+
+    input_buffers = list()
+    for input_ in slice_input:
+        input_buffers.append(ireert.asdevicearray(device, input_))
+    
+    result = inference_func(*input_buffers)
+
+    if hasattr(result, 'to_host'):
+        result = result.to_host()
+
+    return result
+
+
+def prepare_output(result, task):
+    if task == 'feedforward':
+        return {}
+    elif task == 'classification':
+        if hasattr(result, 'to_host'):
+            result = result.to_host()
+        
+        # Extract tensor from dict if needed
+        if isinstance(result, dict):
+            result_key = next(iter(result))
+            logits = result[result_key]
+            output_key = result_key
+        else:
+            logits = np.array(result)
+            output_key = 'output'
+        
+        # Ensure correct shape (batch_size, num_classes)
+        if logits.ndim == 1:
+            logits = logits.reshape(1, -1)
+        elif logits.ndim > 2:
+            logits = logits.reshape(logits.shape[0], -1)
+        
+        # Apply softmax
+        max_logits = np.max(logits, axis=-1, keepdims=True)
+        exp_logits = np.exp(logits - max_logits)
+        probabilities = exp_logits / np.sum(exp_logits, axis=-1, keepdims=True)
+        
+        return {output_key: probabilities}
+    else:
+        raise ValueError(f'Unsupported task {task}')
+
+
+def create_dict_for_transformer(args):
+    return {
+        'channel_swap': getattr(args, 'channel_swap'),
+        'mean': getattr(args, 'mean'),
+        'std': getattr(args, 'std'),
+        'norm': getattr(args, 'norm'),
+        'layout': getattr(args, 'layout'),
+        'input_shape': getattr(args, 'input_shape'),
+        'batch_size': getattr(args, 'batch_size'),
+    }
+
+
+def main():
+    args = cli_argument_parser()
+    
+    try:
+        model_wrapper = IREEModelWrapper(args)
+        data_transformer = IREETransformer(create_dict_for_transformer(args))
+        io = IOAdapter.get_io_adapter(args, model_wrapper, data_transformer)
+
+        report_writer = ReportWriter()
+        report_writer.update_framework_info(name='IREE')
+        report_writer.update_configuration_setup(
+            batch_size=args.batch_size,
+            iterations_num=args.number_iter,
+            target_device=args.device
+        )
+
+        model_context = load_iree_model(args.model)
+        inference_func = get_inference_function(model_context, args.function_name)
+
+        log.info(f'Preparing input data: {args.input}')
+        io.prepare_input(model_context, args.input)
+
+        log.info(f'Starting inference ({args.number_iter} iterations) on {args.device}')
+        result, inference_time = inference_iree(
+            inference_func,
+            args.number_iter,
+            io.get_slice_input_iree,
+            args.time
+        )
+
+        log.info('Computing performance metrics')
+        inference_result = pp.calculate_performance_metrics_sync_mode(
+            args.batch_size, 
+            inference_time
+        )
+    
+        report_writer.update_execution_results(**inference_result)
+        report_writer.write_report(args.report_path)
+
+        if not args.raw_output:
+            if args.number_iter == 1:
+                try:
+                    log.info('Converting output tensor to print results')
+                    result = prepare_output(result, args.task)
+                    log.info('Inference results')
+                    io.process_output(result, log)
+                except Exception as ex:
+                    log.warning(f'Error when printing inference results: {str(ex)}')
+
+        log.info(f'Performance results: {inference_result}')
+
+    except Exception:
+        log.error(traceback.format_exc())
+        sys.exit(1)
+
+
+if __name__ == '__main__':
+    sys.exit(main() or 0)
diff --git a/src/inference/io_adapter.py b/src/inference/io_adapter.py
index 75693e2e4..d555fb574 100644
--- a/src/inference/io_adapter.py
+++ b/src/inference/io_adapter.py
@@ -186,6 +186,14 @@ def get_slice_input(self, *args, **kwargs):
 
         return slice_input
 
+    def get_slice_input_iree(self, *args, **kwargs):
+        slice_input = list()
+        for key in self._transformed_input:
+            data_gen = self._transformed_input[key]
+            slice_data = [copy.deepcopy(next(data_gen)) for _ in range(self._batch_size)]
+            slice_input.append(np.stack(slice_data))
+        return slice_input
+
     def get_slice_input_mxnet(self, *args, **kwargs):
         import mxnet
         slice_input = dict.fromkeys(self._transformed_input.keys(), None)
diff --git a/src/inference/io_model_wrapper.py b/src/inference/io_model_wrapper.py
index 1c68c89dd..27d3c672f 100644
--- a/src/inference/io_model_wrapper.py
+++ b/src/inference/io_model_wrapper.py
@@ -409,3 +409,19 @@ def get_input_layer_dtype(self):
 
 class ExecuTorchIOModelWrapper(TVMIOModelWrapper):
     pass
+
+
+class IREEModelWrapper(IOModelWrapper):
+    def __init__(self, args):
+        self._input_shapes = [args.input_shape]
+        self._model_path = args.model
+    
+    def get_input_layer_names(self, model):
+        return ['input']
+
+    def get_input_layer_shape(self, model, layer_name):
+        return self._input_shapes[0]
+
+    def get_input_layer_dtype(self, model, layer_name):
+        import numpy as np
+        return np.float32
diff --git a/src/inference/transformer.py b/src/inference/transformer.py
index 2d85d0c06..eb9301963 100644
--- a/src/inference/transformer.py
+++ b/src/inference/transformer.py
@@ -368,3 +368,71 @@ def transform_images(self, images, shape, element_type, *args):
 
 class ExecuTorchTransformer(TVMTransformer):
     pass
+
+
+class IREETransformer(Transformer):
+    def __init__(self, converting):
+        self._converting = converting
+
+    def __set_norm(self, image):
+        if self._converting.get('norm', False):
+            image = image.astype(np.float32) / 255.0
+        return image
+
+    def __set_channel_swap(self, image):
+        channel_swap = self._converting.get('channel_swap')
+        if channel_swap is not None:
+            image = image[:, :, channel_swap]
+        return image
+
+    def __set_mean(self, image):
+        mean = self._converting.get('mean')
+        if mean is not None and len(mean) == 3:
+            image[:, :, 0] -= mean[0]
+            image[:, :, 1] -= mean[1]
+            image[:, :, 2] -= mean[2]
+        return image
+
+    def __set_std(self, image):
+        std = self._converting.get('std')
+        if std is not None and len(std) == 3:
+            image[:, :, 0] /= std[0]
+            image[:, :, 1] /= std[1]
+            image[:, :, 2] /= std[2]
+        return image
+
+    def __set_layout(self, image):
+        layout = self._converting.get('layout', 'NHWC')
+        if layout == 'NCHW':
+            # HWC to CHW
+            image = image.transpose(2, 0, 1)
+        return image
+
+    def __bgr_to_rgb(self, image):
+        return cv2.cvtColor(image, cv2.COLOR_BGR2RGB)
+
+    def _transform(self, image):
+        transformed_image = self.__bgr_to_rgb(image)
+        transformed_image = self.__set_norm(transformed_image)
+        transformed_image = self.__set_channel_swap(transformed_image)
+        transformed_image = self.__set_mean(transformed_image)
+        transformed_image = self.__set_std(transformed_image)
+        transformed_image = self.__set_layout(transformed_image)
+        return transformed_image
+
+    def transform_images(self, images, shape, element_type, *args):
+        dataset_size = images.shape[0]
+        new_shape = [dataset_size] + shape[1:]
+        transformed_images = np.zeros(shape=new_shape, dtype=element_type)
+        for i in range(dataset_size):
+            transformed_images[i] = self._transform(images[i])
+        return transformed_images
+
+    def get_shape_in_chw_order(self, shape, *args):
+        layout = self._converting.get('layout', 'NHWC')
+        if layout == 'NHWC':
+            return shape[3], shape[1], shape[2]
+        elif layout == 'NCHW':
+            return shape[1], shape[2], shape[3]
+        else:
+            return shape[1:]

From d35b02d6fcb78f2dd7d40296db59d1594e41d5a9 Mon Sep 17 00:00:00 2001
From: Vladislav Denisov <vlad.roix@yandex.ru>
Date: Mon, 10 Nov 2025 21:35:35 +0300
Subject: [PATCH 02/17] =?UTF-8?q?=D0=9F=D1=80=D0=BE=D0=BC=D0=B5=D0=B6?=
 =?UTF-8?q?=D1=83=D1=82=D0=BE=D1=87=D0=BD=D0=BE=D0=B5=20=D1=80=D0=B5=D1=88?=
 =?UTF-8?q?=D0=B5=D0=BD=D0=B8=D0=B5=20=D0=B4=D0=BB=D1=8F=20=D0=BA=D0=BE?=
 =?UTF-8?q?=D0=BD=D0=B2=D0=B5=D1=80=D1=82=D0=B0=D1=86=D0=B8=D0=B8=20=D0=BC?=
 =?UTF-8?q?=D0=BE=D0=B4=D0=B5=D0=BB=D0=B5=D0=B9?=
MIME-Version: 1.0
Content-Type: text/plain; charset=UTF-8
Content-Transfer-Encoding: 8bit

---
 src/model_converters/iree_converter/README.md |  0
 .../iree_converter/__init__.py                |  0
 .../iree_converter/iree_auxiliary/__init__.py |  0
 .../iree_auxiliary/converter.py               | 39 ++++++++
 .../iree_auxiliary/onnx_format.py             | 26 ++++++
 .../iree_auxiliary/pytorch_format.py          | 53 +++++++++++
 .../iree_converter/iree_converter.py          | 88 +++++++++++++++++++
 7 files changed, 206 insertions(+)
 create mode 100644 src/model_converters/iree_converter/README.md
 create mode 100644 src/model_converters/iree_converter/__init__.py
 create mode 100644 src/model_converters/iree_converter/iree_auxiliary/__init__.py
 create mode 100644 src/model_converters/iree_converter/iree_auxiliary/converter.py
 create mode 100644 src/model_converters/iree_converter/iree_auxiliary/onnx_format.py
 create mode 100644 src/model_converters/iree_converter/iree_auxiliary/pytorch_format.py
 create mode 100644 src/model_converters/iree_converter/iree_converter.py

diff --git a/src/model_converters/iree_converter/README.md b/src/model_converters/iree_converter/README.md
new file mode 100644
index 000000000..e69de29bb
diff --git a/src/model_converters/iree_converter/__init__.py b/src/model_converters/iree_converter/__init__.py
new file mode 100644
index 000000000..e69de29bb
diff --git a/src/model_converters/iree_converter/iree_auxiliary/__init__.py b/src/model_converters/iree_converter/iree_auxiliary/__init__.py
new file mode 100644
index 000000000..e69de29bb
diff --git a/src/model_converters/iree_converter/iree_auxiliary/converter.py b/src/model_converters/iree_converter/iree_auxiliary/converter.py
new file mode 100644
index 000000000..db5c7feec
--- /dev/null
+++ b/src/model_converters/iree_converter/iree_auxiliary/converter.py
@@ -0,0 +1,39 @@
+import abc
+import sys
+from pathlib import Path
+
+sys.path.append(str(Path(__file__).resolve().parent.parent.parent.parent.joinpath('utils')))
+from logger_conf import configure_logger  # noqa: E402
+
+log = configure_logger()
+
+
+class IREEConverter(metaclass=abc.ABCMeta):
+    def __init__(self, args):
+        self.model_name = args.get('model_name', None)
+        self.output_mlir = args.get('output_mlir', None)
+        self.log = log
+
+    @abc.abstractmethod
+    def _convert_model_from_framework(self):
+        pass
+
+    @property
+    @abc.abstractmethod
+    def source_framework(self):
+        pass
+
+    @staticmethod
+    def get_converter(args):
+        framework = args['source_framework'].lower()
+        if framework == 'onnx':
+            from onnx_format import IREEConverterONNXFormat
+            return IREEConverterONNXFormat(args)
+        elif framework == 'pytorch':
+            from pytorch_format import IREEConverterPyTorchFormat
+            return IREEConverterPyTorchFormat(args)
+
+    def convert_to_mlir(self):
+        self.log.info(f'Get IREE MLIR for {self.model_name} from {self.source_framework} framework')
+        self._convert_model_from_framework()
+        return
diff --git a/src/model_converters/iree_converter/iree_auxiliary/onnx_format.py b/src/model_converters/iree_converter/iree_auxiliary/onnx_format.py
new file mode 100644
index 000000000..86e381f5b
--- /dev/null
+++ b/src/model_converters/iree_converter/iree_auxiliary/onnx_format.py
@@ -0,0 +1,26 @@
+import subprocess
+from converter import IREEConverter
+
+
+class IREEConverterONNXFormat(IREEConverter):
+    def __init__(self, args):
+        super().__init__(args)
+        self.model_path = args.get('model_path', None)
+        self.onnx_opset_version = args.get('onnx_opset_version', None)
+
+    @property
+    def source_framework(self):
+        return 'ONNX'
+
+    def _convert_model_from_framework(self):
+        import_args = [
+            "iree-import-onnx",
+            self.model_path,
+            "--opset-version",
+            str(self.onnx_opset_version),
+            "-o",
+            self.output_mlir,
+        ]
+        import_cmd = subprocess.list2cmdline(import_args)
+        ret = subprocess.run(import_cmd, shell=True, capture_output=True)
+        return
diff --git a/src/model_converters/iree_converter/iree_auxiliary/pytorch_format.py b/src/model_converters/iree_converter/iree_auxiliary/pytorch_format.py
new file mode 100644
index 000000000..152c7f753
--- /dev/null
+++ b/src/model_converters/iree_converter/iree_auxiliary/pytorch_format.py
@@ -0,0 +1,53 @@
+import importlib
+import subprocess
+from converter import IREEConverter
+
+
+class IREEConverterPyTorchFormat(IREEConverter):
+    def __init__(self, args):
+        super().__init__(args)
+        self.torch = importlib.import_module('torch')
+        self.aot = importlib.import_module('iree.turbine.aot')
+        self.model_path = args.get('model_path', None)
+        self.model_weights = args.get('model_weights', None)
+        self.module = args.get('torch_module', None)
+        self.input_shape = args.get('input_shape', None)
+
+    @property
+    def source_framework(self):
+        return 'PyTorch'
+
+    def __get_model_from_path(self):
+        self.log.info(f'Loading model from path {self.model_path}')
+        file_type = self.model_path.split('.')[-1]
+        supported_extensions = ['pt']
+        if file_type not in supported_extensions:
+            raise ValueError(f'The file type {file_type} is not supported')
+        model = self.torch.load(self.model_path)
+        model.eval()
+        return model
+
+    def __get_model_from_module(self):
+        self.log.info(f'Loading model {self.model_name} from module')
+        model_cls = importlib.import_module(self.module).__getattribute__(self.model_name)
+        if self.model_weights is None or self.model_weights == '':
+            self.log.info('Loading pretrained model')
+            model = model_cls(weights=True)
+        else:
+            self.log.info(f'Loading model with weights from file {self.model_weights}')
+            model = model_cls()
+            checkpoint = self.torch.load(self.model_weights, map_location=self.device.lower())
+            model.load_state_dict(checkpoint, strict=False)
+        model.eval()
+        return model
+
+    def _convert_model_from_framework(self):
+        model = None
+        if self.module:
+            model = self.__get_model_from_module()
+        else:
+            model = self.__get_model_from_path()
+        example_arg = self.torch.randn(*self.input_shape)
+        export_output = self.aot.export(model, example_arg)
+        export_output.save_mlir(self.output_mlir)
+        return
diff --git a/src/model_converters/iree_converter/iree_converter.py b/src/model_converters/iree_converter/iree_converter.py
new file mode 100644
index 000000000..2489e5dfa
--- /dev/null
+++ b/src/model_converters/iree_converter/iree_converter.py
@@ -0,0 +1,88 @@
+import argparse
+import os
+import sys
+import traceback
+from pathlib import Path
+sys.path.append(str(Path(__file__).resolve().parent.joinpath('iree_auxiliary')))
+from converter import IREEConverter  # noqa: E402
+
+sys.path.append(str(Path(__file__).resolve().parent.parent.parent))
+from utils.logger_conf import configure_logger  # noqa: E402
+
+log = configure_logger()
+
+
+def cli_argument_parser():
+    parser = argparse.ArgumentParser()
+    parser.add_argument('-f', '--source_framework',
+                        help='Source model framework',
+                        required=True,
+                        type=str,
+                        dest='source_framework')
+    parser.add_argument('-mn', '--model_name',
+                        help='Model name.',
+                        type=str,
+                        dest='model_name')
+    parser.add_argument('-m', '--model',
+                        help='Path to an .onnx or .pt file with a trained model.',
+                        type=str,
+                        dest='model_path')
+    parser.add_argument('-w', '--weights',
+                        help='Path to an .pth file with a trained weights.',
+                        type=str,
+                        dest='model_weights')
+    parser.add_argument('-tm', '--torch_module',
+                        help='Torch module with model architecture.',
+                        default='torchvision.models',
+                        type=str,
+                        dest='torch_module')
+    parser.add_argument('--onnx_opset_version',
+                        help='Path to an .onnx with a trained model.',
+                        type=int,
+                        default=18,
+                        dest='onnx_opset_version')
+    parser.add_argument('-is', '--input_shape',
+                        help='Input shape BxWxHxC, B is a batch size,'
+                             'W is an input tensor width,'
+                             'H is an input tensor height,'
+                             'C is an input tensor number of channels.',
+                        type=int,
+                        nargs=4,
+                        dest='input_shape')
+    parser.add_argument('-o', '--output_mlir',
+                        help='Path to save the MLIR.',
+                        required=True,
+                        type=str,
+                        dest='output_mlir')
+    args = parser.parse_args()
+    return args
+
+
+def create_dict_for_converter(args):
+    dictionary = {
+        'source_framework': args.source_framework,
+        'model_name': args.model_name,
+        'model_path': args.model_path,
+        'model_weights': args.model_weights,
+        'torch_module': args.torch_module,
+        'onnx_opset_version': args.onnx_opset_version,
+        'input_shape': args.input_shape,
+        'output_mlir': args.output_mlir
+    }
+    return dictionary
+
+
+def main():
+    args = cli_argument_parser()
+    try:
+        converter = IREEConverter.get_converter(create_dict_for_converter(args))
+        converter.convert_to_mlir()
+        if os.path.exists(args.output_mlir):
+            print(f'The MLIR has been sucessfully saved into {args.output_mlir}')
+    except Exception:
+        log.error(traceback.format_exc())
+        sys.exit(1)
+
+
+if __name__ == '__main__':
+    sys.exit(main() or 0)

From b70d73502d8657c453e4fcc1e0480445f126cf2f Mon Sep 17 00:00:00 2001
From: Vladislav Denisov <vlad.roix@yandex.ru>
Date: Tue, 11 Nov 2025 20:18:32 +0300
Subject: [PATCH 03/17] Added iree_compiler, more checks for converter and
 README

---
 src/model_converters/iree_converter/README.md | 117 ++++++++++++++++++
 .../iree_auxiliary/onnx_format.py             |  14 +++
 .../iree_auxiliary/pytorch_format.py          |  35 +++++-
 .../iree_converter/iree_compiler.py           |  75 +++++++++++
 .../iree_converter/iree_converter.py          |   1 +
 5 files changed, 241 insertions(+), 1 deletion(-)
 create mode 100644 src/model_converters/iree_converter/iree_compiler.py

diff --git a/src/model_converters/iree_converter/README.md b/src/model_converters/iree_converter/README.md
index e69de29bb..f627daf03 100644
--- a/src/model_converters/iree_converter/README.md
+++ b/src/model_converters/iree_converter/README.md
@@ -0,0 +1,117 @@
+# Conversion to the IREE format
+IREE converter supports conversion to the IREE MLIR format from ONNX and PyTorch formats.
+
+IREE compiler supports compilation from `.mlir` format to the `.vmfb` format for deployment on various backends.
+
+## IREE converter usage
+
+Basic usage of the script:
+
+```sh
+iree_converter.py --source_framework <source_framework> \
+                  --model_name <model_name> \
+                  --model <model> \
+                  --weights <weights> \
+                  --torch_module <torch_module> \
+                  --input_shape <input_shape> \
+                  --onnx_opset_version <onnx_opset_version> \
+                  --output_mlir <output_mlir>
+```
+
+This script converts model from `<source_framework>` to the IREE MLIR format.
+
+### IREE converter parameters
+- `-f / --source_framework` is a source framework where the model was trained. Required. Choices: `onnx`, `pytorch`.
+- `-mn / --model_name` is a model name. Required for PyTorch models loaded from module.
+- `-m / --model` is a path to an `.onnx` or `.pt` file with a trained model.
+- `-w / --weights` is a path to an `.pth` file with trained weights for PyTorch models.
+- `-tm / --torch_module` is a module with the model architecture for PyTorch models. Default: `torchvision.models`.
+- `-is / --input_shape` is an input shape in the format BxWxHxC, where B is a batch size, W is an input tensor width, H is an input tensor height, C is an input tensor number of channels. Required for PyTorch models.
+- `--onnx_opset_version` is the ONNX opset version for ONNX models. Default: `18`.
+- `-o / --output_mlir` is path to save the MLIR file. Required.
+
+### Parameter combinations
+#### For ONNX models:
+- Required: `--source_framework onnx`, `--model <path/to/model.onnx>`, `--output_mlir <output_path>`
+- Optional: `--onnx_opset_version` (default: 18)
+#### For PyTorch models:
+Two loading methods are supported (mutually exclusive):
+1. From file:
+- Required: `--source_framework pytorch`, `--model <path/to/model.pt>`, `--input_shape B W H C`, `--output_mlir <output_path>`
+- Optional: `--weights <path/to/weights.pth>`
+1. From module:
+- Required: `--source_framework pytorch`, `--model_name <model_name>`, `--torch_module <module>`, `--input_shape B W H C`, `--output_mlir <output_path>`
+- Optional: `--weights <path/to/weights.pth>`
+
+### Examples of usage
+ONNX model conversion:
+```sh
+python3 iree_converter.py -f onnx -m efficientnet-b0.onnx \
+                         --onnx_opset_version 18 \
+                         -o ./output/efficientnet-b0.mlir
+```
+
+PyTorch model from file:
+```sh
+python3 iree_converter.py -f pytorch -m resnet50.pt \
+                         -is 1 224 224 3 \
+                         -o ./output/resnet50.mlir
+```
+
+PyTorch model from torchvision with pretrained weights:
+```sh
+python3 iree_converter.py -f pytorch -mn resnet50 \
+                         -tm torchvision.models \
+                         -is 1 224 224 3 \
+                         -o ./output/resnet50.mlir
+```
+
+PyTorch model with custom weights:
+```sh
+python3 iree_converter.py -f pytorch -mn resnet50 \
+                         -tm torchvision.models \
+                         -w ./weights/resnet50-custom.pth \
+                         -is 1 224 224 3 \
+                         -o ./output/resnet50-custom.mlir
+```
+
+## IREE compiler usage
+
+Basic usage of the script:
+```sh
+iree_compiler.py --mlir <input.mlir> \
+                 --target_backend <target_backend> \
+                 --opt_level <opt_level> \
+                 --output_file <output_file> \
+                 [--extra_args <extra_args>]
+```
+This script compiles model from `.mlir` format to the deployable binary format for the specified target backend.
+
+### IREE compiler parameters
+- `-m / --mlir` - Path to an .mlir file with a model. Required.
+- `-tb / --target_backend` - Target backend for compilation. Required. Examples: `llvm-cpu`, `cuda`, `vulkan`, `vmvx`.
+- `--opt_level` - The optimization level of the compilation. Choices: `0`, `1`, `2`, `3`. Default: `2`.
+- `-o / --output_file` - Path to save the compiled model. Required.
+- `--extra_args` - Extra arguments for compilation. Optional.
+
+### Supported target backends
+- `llvm-cpu` - CPU execution using LLVM
+- `cuda` - NVIDIA GPU execution using CUDA
+- `vulkan` - GPU execution using Vulkan API
+- `vmvx` - Portable VM bytecode execution
+- `metal` - Apple GPU execution using Metal
+- `rocm` - AMD GPU execution using ROCm
+
+### Examples of usage
+```sh
+python3 iree_compiler.py -m ./models/resnet50.mlir \
+                        -tb llvm-cpu \
+                        --opt_level 2 \
+                        -o ./compiled/resnet50-cpu.vmfb
+```
+### Using extra arguments
+The `--extra_args` parameter allows passing additional compilation flags:
+```sh
+python3 iree_compiler.py -m model.mlir -tb llvm-cpu -o output.vmfb \
+                        --extra_args --iree-llvmcpu-target-triple=x86_64-linux-gnu
+```
diff --git a/src/model_converters/iree_converter/iree_auxiliary/onnx_format.py b/src/model_converters/iree_converter/iree_auxiliary/onnx_format.py
index 86e381f5b..8f836b4d3 100644
--- a/src/model_converters/iree_converter/iree_auxiliary/onnx_format.py
+++ b/src/model_converters/iree_converter/iree_auxiliary/onnx_format.py
@@ -1,4 +1,5 @@
 import subprocess
+import os
 from converter import IREEConverter
 
 
@@ -7,12 +8,25 @@ def __init__(self, args):
         super().__init__(args)
         self.model_path = args.get('model_path', None)
         self.onnx_opset_version = args.get('onnx_opset_version', None)
+        self._validate_arguments()
 
     @property
     def source_framework(self):
         return 'ONNX'
 
+    def _validate_arguments(self):
+        if self.model_path is None or self.model_path == '':
+            raise ValueError("The model_path parameter is required for ONNX conversion.")
+
+        if not os.path.exists(self.model_path):
+            raise FileNotFoundError(f"Model file not found: {self.model_path}")
+
+        if self.onnx_opset_version is None:
+            raise ValueError("The onnx_opset_version parameter is required for ONNX conversion.")
+
     def _convert_model_from_framework(self):
+        if not os.path.exists(self.output_mlir):
+            os.mkdir(self.output_mlir)
         import_args = [
             "iree-import-onnx",
             self.model_path,
diff --git a/src/model_converters/iree_converter/iree_auxiliary/pytorch_format.py b/src/model_converters/iree_converter/iree_auxiliary/pytorch_format.py
index 152c7f753..7e5f035a8 100644
--- a/src/model_converters/iree_converter/iree_auxiliary/pytorch_format.py
+++ b/src/model_converters/iree_converter/iree_auxiliary/pytorch_format.py
@@ -1,5 +1,5 @@
 import importlib
-import subprocess
+import os
 from converter import IREEConverter
 
 
@@ -12,10 +12,41 @@ def __init__(self, args):
         self.model_weights = args.get('model_weights', None)
         self.module = args.get('torch_module', None)
         self.input_shape = args.get('input_shape', None)
+        self._validate_arguments()
 
     @property
     def source_framework(self):
         return 'PyTorch'
+    
+    def _validate_arguments(self):
+        if self.input_shape is None:
+            raise ValueError("The input_shape parameter is required for PyTorch conversion.")
+        
+        # Check load methods:
+        # 1. model_path (load from file)
+        # 2. module + model_name (load from torch module)
+        has_model_path = self.model_path is not None and self.model_path != ''
+        has_module_model = (self.module is not None and self.module != '' and 
+                          self.model_name is not None and self.model_name != '')
+        
+        if not has_model_path and not has_module_model:
+            raise ValueError(
+                "For PyTorch conversion, you must specify either model_path, "
+                "or torch_module and model_name"
+            )
+        
+        if has_model_path and has_module_model:
+            raise ValueError(
+                "Provided incompatible parameters for PyTorch conversion (model_path and torch_module+model_name). "
+                "Please choose only one method of this."
+            )
+
+        if has_model_path and not os.path.exists(self.model_path):
+            raise FileNotFoundError(f"Model file not found: {self.model_path}")
+
+        if (self.model_weights is not None and self.model_weights != '' and 
+            not os.path.exists(self.model_weights)):
+            raise FileNotFoundError(f"Model weights not found: {self.model_weights}")
 
     def __get_model_from_path(self):
         self.log.info(f'Loading model from path {self.model_path}')
@@ -49,5 +80,7 @@ def _convert_model_from_framework(self):
             model = self.__get_model_from_path()
         example_arg = self.torch.randn(*self.input_shape)
         export_output = self.aot.export(model, example_arg)
+        if not os.path.exists(self.output_mlir):
+            os.mkdir(self.output_mlir)
         export_output.save_mlir(self.output_mlir)
         return
diff --git a/src/model_converters/iree_converter/iree_compiler.py b/src/model_converters/iree_converter/iree_compiler.py
new file mode 100644
index 000000000..a2371900a
--- /dev/null
+++ b/src/model_converters/iree_converter/iree_compiler.py
@@ -0,0 +1,75 @@
+import argparse
+import sys
+import os
+import traceback
+from pathlib import Path
+from iree.compiler.tools import compile_str, compile_file
+
+sys.path.append(str(Path(__file__).resolve().parent.parent.parent))
+from utils.logger_conf import configure_logger  # noqa: E402
+
+log = configure_logger()
+
+
+class IREECompiler:
+    @staticmethod
+    def compile(mlir, target, opt_level, extra_args, output_file=None):
+        if not os.path.exists(output_file):
+            os.mkdir(output_file)
+        extra_args.append(f'--iree-opt-level=O{opt_level}')
+        compile_func = compile_file if os.path.isfile(mlir) else compile_str
+        return compile_func(mlir, target_backends=[target], extra_args=extra_args, output_file=output_file)
+
+
+def cli_argument_parser():
+    parser = argparse.ArgumentParser()
+    parser.add_argument('-m', '--mlir',
+                        help='Path to an .mlir file with a model.',
+                        required=True,
+                        type=str)
+    parser.add_argument('-tb', '--target_backend',
+                        help='Target backend, for example "llvm-cpu" for CPU.',
+                        required=True,
+                        type=str)
+    parser.add_argument('--opt_level',
+                        help='The optimization level of the task extractions.',
+                        type=int,
+                        choices=[0, 1, 2, 3],
+                        default=2)
+    parser.add_argument('--extra_args',
+                        help='The extra arguments for compilation.',
+                        type=str,
+                        nargs=argparse.REMAINDER,
+                        default=[])
+    parser.add_argument('-o', '--output_file',
+                        help='Path to compiled model.',
+                        required=True,
+                        type=str)
+    args = parser.parse_args()
+    return args
+
+
+def create_dict_for_compilation(args):
+    dictionary = {
+        'mlir': args.mlir,
+        'target_backend': args.target_backend,
+        'opt_level': args.opt_level,
+        'extra_args': args.extra_args,
+        'output_file': args.output_file,
+    }
+    return dictionary
+
+
+def main():
+    args = cli_argument_parser()
+    try:
+        IREECompiler.compile(args.mlir, args.target_backend, args.opt_level, args.extra_args, args.output_file)
+        if os.path.exists(args.output_file):
+            print(f'The MLIR has been sucessfully compiled into {args.output_file}')
+    except Exception:
+        log.error(traceback.format_exc())
+        sys.exit(1)
+
+
+if __name__ == '__main__':
+    sys.exit(main() or 0)
diff --git a/src/model_converters/iree_converter/iree_converter.py b/src/model_converters/iree_converter/iree_converter.py
index 2489e5dfa..a46a5cdba 100644
--- a/src/model_converters/iree_converter/iree_converter.py
+++ b/src/model_converters/iree_converter/iree_converter.py
@@ -18,6 +18,7 @@ def cli_argument_parser():
                         help='Source model framework',
                         required=True,
                         type=str,
+                        choices=['onnx', 'pytorch'],
                         dest='source_framework')
     parser.add_argument('-mn', '--model_name',
                         help='Model name.',

From 71f8774030b95daf1c28bd28bd1a7d85ab54f1c2 Mon Sep 17 00:00:00 2001
From: Vladislav Denisov <vlad.roix@yandex.ru>
Date: Tue, 11 Nov 2025 21:01:07 +0300
Subject: [PATCH 04/17] Added to inference auto-compile model from mlir

---
 src/inference/inference_iree.py               | 54 ++++++++++++++-----
 .../iree_converter/iree_auxiliary/compiler.py | 12 +++++
 .../iree_converter/iree_compiler.py           | 24 +--------
 3 files changed, 55 insertions(+), 35 deletions(-)
 create mode 100644 src/model_converters/iree_converter/iree_auxiliary/compiler.py

diff --git a/src/inference/inference_iree.py b/src/inference/inference_iree.py
index 8cf9d49ea..d01a75630 100644
--- a/src/inference/inference_iree.py
+++ b/src/inference/inference_iree.py
@@ -12,6 +12,11 @@
 
 import numpy as np
 
+sys.path.append(str(Path(__file__).resolve().parents[1].joinpath('model_converters',
+                                                                 'iree_converter',
+                                                                 'iree_auxiliary')))
+from compiler import IREECompiler  # noqa: E402
+
 sys.path.append(str(Path(__file__).resolve().parents[1].joinpath('utils')))
 from logger_conf import configure_logger  # noqa: E402
 
@@ -29,7 +34,7 @@ def cli_argument_parser():
 
     
     parser.add_argument('-m', '--model',
-                        help='Path to .vmfb file with compiled model.',
+                        help='Path to .vmfb file with compiled model or .mlir.',
                         required=True,
                         type=str,
                         dest='model')
@@ -123,21 +128,37 @@ def cli_argument_parser():
                         type=int,
                         nargs=3,
                         dest='channel_swap')
-    parser.add_argument('-d', '--device',
-                        help='Specify the target device to infer (CPU by default)',
-                        default='CPU',
+    parser.add_argument('-tb', '--target_backend',
+                        help='Target backend, for example "llvm-cpu" for CPU.',
+                        default='llvm-cpu',
+                        type=str,
+                        dest='target_backend')
+    parser.add_argument('--opt_level',
+                        help='The optimization level of the task extractions.',
+                        type=int,
+                        choices=[0, 1, 2, 3],
+                        default=2)
+    parser.add_argument('--extra_compile_args',
+                        help='The extra arguments for MLIR compilation.',
                         type=str,
-                        dest='device')
+                        nargs=argparse.REMAINDER,
+                        default=[])
 
     return parser.parse_args()
 
 
-def load_iree_model(model_path):
+def compile_mlir(mlir_path, target_backend, opt_level, extra_compile_args):
     try:
-        config = ireert.Config('local-task')
+        log.info(f'Starting model compilation')
+        return IREECompiler.compile(mlir_path, target_backend, opt_level, extra_compile_args)
+    except Exception as e:
+        log.error(f"Failed to compile MLIR: {e}")
+        raise
 
-        with open(model_path, 'rb') as f:
-            vmfb_buffer = f.read()
+
+def load_iree_model(vmfb_buffer):
+    try:
+        config = ireert.Config('local-task')
 
         vm_module = ireert.VmModule.from_flatbuffer(config.vm_instance, vmfb_buffer)
         context = ireert.SystemContext(config=config)
@@ -260,16 +281,25 @@ def main():
         report_writer.update_configuration_setup(
             batch_size=args.batch_size,
             iterations_num=args.number_iter,
-            target_device=args.device
+            target_device=args.target_backend
         )
 
-        model_context = load_iree_model(args.model)
+        file_type = args.model.split('.')[-1]
+        if file_type == 'mlir':
+            vmfb_buffer = compile_mlir(args.model, args.target_backend, args.opt_level, args.extra_compile_args)
+        elif file_type == 'vmfb':
+            with open(args.model, 'rb') as f:
+                vmfb_buffer = f.read()
+        else:
+            raise ValueError(f'The file type {file_type} is not supported')
+
+        model_context = load_iree_model(vmfb_buffer)
         inference_func = get_inference_function(model_context, args.function_name)
 
         log.info(f'Preparing input data: {args.input}')
         io.prepare_input(model_context, args.input)
 
-        log.info(f'Starting inference ({args.number_iter} iterations) on {args.device}')
+        log.info(f'Starting inference ({args.number_iter} iterations) on {args.target_backend}')
         result, inference_time = inference_iree(
             inference_func,
             args.number_iter,
diff --git a/src/model_converters/iree_converter/iree_auxiliary/compiler.py b/src/model_converters/iree_converter/iree_auxiliary/compiler.py
new file mode 100644
index 000000000..999d28001
--- /dev/null
+++ b/src/model_converters/iree_converter/iree_auxiliary/compiler.py
@@ -0,0 +1,12 @@
+import os
+from iree.compiler.tools import compile_str, compile_file
+
+
+class IREECompiler:
+    @staticmethod
+    def compile(mlir, target, opt_level, extra_args, output_file=None):
+        if output_file and not os.path.exists(output_file):
+            os.mkdir(output_file)
+        extra_args.append(f'--iree-opt-level=O{opt_level}')
+        compile_func = compile_file if os.path.isfile(mlir) else compile_str
+        return compile_func(mlir, target_backends=[target], extra_args=extra_args, output_file=output_file)
diff --git a/src/model_converters/iree_converter/iree_compiler.py b/src/model_converters/iree_converter/iree_compiler.py
index a2371900a..cd4ac309d 100644
--- a/src/model_converters/iree_converter/iree_compiler.py
+++ b/src/model_converters/iree_converter/iree_compiler.py
@@ -3,24 +3,13 @@
 import os
 import traceback
 from pathlib import Path
-from iree.compiler.tools import compile_str, compile_file
+from iree_auxiliary.compiler import IREECompiler
 
 sys.path.append(str(Path(__file__).resolve().parent.parent.parent))
 from utils.logger_conf import configure_logger  # noqa: E402
 
 log = configure_logger()
 
-
-class IREECompiler:
-    @staticmethod
-    def compile(mlir, target, opt_level, extra_args, output_file=None):
-        if not os.path.exists(output_file):
-            os.mkdir(output_file)
-        extra_args.append(f'--iree-opt-level=O{opt_level}')
-        compile_func = compile_file if os.path.isfile(mlir) else compile_str
-        return compile_func(mlir, target_backends=[target], extra_args=extra_args, output_file=output_file)
-
-
 def cli_argument_parser():
     parser = argparse.ArgumentParser()
     parser.add_argument('-m', '--mlir',
@@ -49,17 +38,6 @@ def cli_argument_parser():
     return args
 
 
-def create_dict_for_compilation(args):
-    dictionary = {
-        'mlir': args.mlir,
-        'target_backend': args.target_backend,
-        'opt_level': args.opt_level,
-        'extra_args': args.extra_args,
-        'output_file': args.output_file,
-    }
-    return dictionary
-
-
 def main():
     args = cli_argument_parser()
     try:

From a283d6b67e582a331a410ec0b6272ad28a01bcb4 Mon Sep 17 00:00:00 2001
From: Vladislav Denisov <vlad.roix@yandex.ru>
Date: Mon, 17 Nov 2025 20:52:41 +0300
Subject: [PATCH 05/17] IREE fix problems and comments

---
 src/inference/README.md                       |  2 +-
 src/inference/inference_iree.py               | 88 ++++++++++++-------
 src/inference/io_model_wrapper.py             |  2 +-
 src/model_converters/iree_converter/README.md | 32 +++----
 .../iree_auxiliary/onnx_format.py             |  8 +-
 .../iree_auxiliary/pytorch_format.py          | 32 +++----
 .../iree_converter/iree_compiler.py           |  1 +
 7 files changed, 97 insertions(+), 68 deletions(-)

diff --git a/src/inference/README.md b/src/inference/README.md
index 0f569467e..e5644288c 100644
--- a/src/inference/README.md
+++ b/src/inference/README.md
@@ -1569,4 +1569,4 @@ python3 inference_iree.py \
 [dgl]: https://www.dgl.ai/pages/start.html
 [ogb]: https://ogb.stanford.edu/
 [tensorflow-gpu]: https://www.tensorflow.org/install/pip
-[iree]: https://iree.dev/
+[iree]: https://iree.dev
diff --git a/src/inference/inference_iree.py b/src/inference/inference_iree.py
index d01a75630..be7944295 100644
--- a/src/inference/inference_iree.py
+++ b/src/inference/inference_iree.py
@@ -1,4 +1,5 @@
 import argparse
+import os
 import sys
 import traceback
 from pathlib import Path
@@ -25,14 +26,13 @@
 try:
     import iree.runtime as ireert  # noqa: E402
 except ImportError as e:
-    log.error(f"IREE import error: {e}")
+    log.error(f'IREE import error: {e}')
     sys.exit(1)
 
 
 def cli_argument_parser():
     parser = argparse.ArgumentParser()
 
-    
     parser.add_argument('-m', '--model',
                         help='Path to .vmfb file with compiled model or .mlir.',
                         required=True,
@@ -129,12 +129,12 @@ def cli_argument_parser():
                         nargs=3,
                         dest='channel_swap')
     parser.add_argument('-tb', '--target_backend',
-                        help='Target backend, for example "llvm-cpu" for CPU.',
+                        help='Target backend, for example `llvm-cpu` for CPU.',
                         default='llvm-cpu',
                         type=str,
                         dest='target_backend')
     parser.add_argument('--opt_level',
-                        help='The optimization level of the task extractions.',
+                        help='The optimization level of the compilation.',
                         type=int,
                         choices=[0, 1, 2, 3],
                         default=2)
@@ -149,38 +149,67 @@ def cli_argument_parser():
 
 def compile_mlir(mlir_path, target_backend, opt_level, extra_compile_args):
     try:
-        log.info(f'Starting model compilation')
+        log.info('Starting model compilation')
         return IREECompiler.compile(mlir_path, target_backend, opt_level, extra_compile_args)
     except Exception as e:
-        log.error(f"Failed to compile MLIR: {e}")
+        log.error(f'Failed to compile MLIR: {e}')
         raise
 
 
-def load_iree_model(vmfb_buffer):
+def load_model_buffer(model_path, target_backend, opt_level, extra_compile_args):
+    if not os.path.exists(model_path):
+        raise FileNotFoundError(f'Model file not found: {model_path}')
+
+    file_type = model_path.split('.')[-1]
+
+    if file_type == 'mlir':
+        if target_backend is None:
+            raise ValueError('target_backend is required for MLIR compilation')
+        vmfb_buffer = compile_mlir(model_path, target_backend, opt_level, extra_compile_args)
+    elif file_type == 'vmfb':
+        with open(model_path, 'rb') as f:
+            vmfb_buffer = f.read()
+    else:
+        raise ValueError(f'The file type {file_type} is not supported. Supported types: .mlir, .vmfb')
+
+    log.info(f'Successfully loaded model buffer from {model_path}')
+    return vmfb_buffer
+
+
+def create_iree_context_from_buffer(vmfb_buffer):
     try:
         config = ireert.Config('local-task')
-
         vm_module = ireert.VmModule.from_flatbuffer(config.vm_instance, vmfb_buffer)
         context = ireert.SystemContext(config=config)
         context.add_vm_module(vm_module)
 
-        log.info(f"Successfully loaded IREE model")
+        log.info('Successfully created IREE context from buffer')
         return context
 
     except Exception as e:
-        log.error(f"Failed to load IREE model: {e}")
+        log.error(f'Failed to create IREE context: {e}')
         raise
 
 
+def load_model(model_path, target_backend, opt_level, extra_compile_args):
+    vmfb_buffer = load_model_buffer(
+        model_path,
+        target_backend=target_backend,
+        opt_level=opt_level,
+        extra_compile_args=extra_compile_args
+    )
+    return create_iree_context_from_buffer(vmfb_buffer)
+
+
 def get_inference_function(model_context, function_name):
     try:
         main_module = model_context.modules.module
         inference_func = main_module[function_name]
-        log.info(f"Using function '{function_name}' for inference")
+        log.info(f'Using function {function_name} for inference')
         return inference_func
 
     except Exception as e:
-        log.error(f"Failed to get inference function: {e}")
+        log.error(f'Failed to get inference function: {e}')
         raise
 
 
@@ -196,7 +225,7 @@ def inference_iree(inference_func, number_iter, get_slice, test_duration):
         time_infer = loop_inference(number_iter, test_duration)(
             inference_iteration
         )(inference_func, get_slice)['time_infer']
-    
+
     log.info('Inference completed')
     return result, time_infer
 
@@ -215,7 +244,7 @@ def infer_slice(inference_func, slice_input):
     input_buffers = list()
     for input_ in slice_input:
         input_buffers.append(ireert.asdevicearray(device, input_))
-    
+
     result = inference_func(*input_buffers)
 
     if hasattr(result, 'to_host'):
@@ -230,7 +259,7 @@ def prepare_output(result, task):
     elif task == 'classification':
         if hasattr(result, 'to_host'):
             result = result.to_host()
-        
+
         # Extract tensor from dict if needed
         if isinstance(result, dict):
             result_key = next(iter(result))
@@ -239,18 +268,18 @@ def prepare_output(result, task):
         else:
             logits = np.array(result)
             output_key = 'output'
-        
+
         # Ensure correct shape (batch_size, num_classes)
         if logits.ndim == 1:
             logits = logits.reshape(1, -1)
         elif logits.ndim > 2:
             logits = logits.reshape(logits.shape[0], -1)
-        
+
         # Apply softmax
         max_logits = np.max(logits, axis=-1, keepdims=True)
         exp_logits = np.exp(logits - max_logits)
         probabilities = exp_logits / np.sum(exp_logits, axis=-1, keepdims=True)
-        
+
         return {output_key: probabilities}
     else:
         raise ValueError(f'Unsupported task {task}')
@@ -270,7 +299,7 @@ def create_dict_for_transformer(args):
 
 def main():
     args = cli_argument_parser()
-    
+
     try:
         model_wrapper = IREEModelWrapper(args)
         data_transformer = IREETransformer(create_dict_for_transformer(args))
@@ -284,16 +313,13 @@ def main():
             target_device=args.target_backend
         )
 
-        file_type = args.model.split('.')[-1]
-        if file_type == 'mlir':
-            vmfb_buffer = compile_mlir(args.model, args.target_backend, args.opt_level, args.extra_compile_args)
-        elif file_type == 'vmfb':
-            with open(args.model, 'rb') as f:
-                vmfb_buffer = f.read()
-        else:
-            raise ValueError(f'The file type {file_type} is not supported')
-
-        model_context = load_iree_model(vmfb_buffer)
+        log.info('Loading model')
+        model_context = load_model(
+            model_path=args.model,
+            target_backend=args.target_backend,
+            opt_level=args.opt_level,
+            extra_compile_args=args.extra_compile_args
+        )
         inference_func = get_inference_function(model_context, args.function_name)
 
         log.info(f'Preparing input data: {args.input}')
@@ -309,10 +335,10 @@ def main():
 
         log.info('Computing performance metrics')
         inference_result = pp.calculate_performance_metrics_sync_mode(
-            args.batch_size, 
+            args.batch_size,
             inference_time
         )
-    
+
         report_writer.update_execution_results(**inference_result)
         report_writer.write_report(args.report_path)
 
diff --git a/src/inference/io_model_wrapper.py b/src/inference/io_model_wrapper.py
index 27d3c672f..2aa15d13b 100644
--- a/src/inference/io_model_wrapper.py
+++ b/src/inference/io_model_wrapper.py
@@ -415,7 +415,7 @@ class IREEModelWrapper(IOModelWrapper):
     def __init__(self, args):
         self._input_shapes = [args.input_shape]
         self._model_path = args.model
-    
+
     def get_input_layer_names(self, model):
         return ['input']
 
diff --git a/src/model_converters/iree_converter/README.md b/src/model_converters/iree_converter/README.md
index f627daf03..1605f60f8 100644
--- a/src/model_converters/iree_converter/README.md
+++ b/src/model_converters/iree_converter/README.md
@@ -27,8 +27,8 @@ This script converts model from `<source_framework>` to the IREE MLIR format.
 - `-w / --weights` is a path to an `.pth` file with trained weights for PyTorch models.
 - `-tm / --torch_module` is a module with the model architecture for PyTorch models. Default: `torchvision.models`.
 - `-is / --input_shape` is an input shape in the format BxWxHxC, where B is a batch size, W is an input tensor width, H is an input tensor height, C is an input tensor number of channels. Required for PyTorch models.
-- `--onnx_opset_version` is the ONNX opset version for ONNX models. Default: `18`.
-- `-o / --output_mlir` is path to save the MLIR file. Required.
+- `--onnx_opset_version` is an ONNX opset version for ONNX models. Default: `18`.
+- `-o / --output_mlir` is a path to save the MLIR file. Required.
 
 ### Parameter combinations
 #### For ONNX models:
@@ -44,21 +44,21 @@ Two loading methods are supported (mutually exclusive):
 - Optional: `--weights <path/to/weights.pth>`
 
 ### Examples of usage
-ONNX model conversion:
+ONNX model conversion ([source of the model efficientnet-b0.onnx](https://github.com/onnx/models/blob/main/Computer_Vision/efficientnet_b0_Opset17_timm/efficientnet_b0_Opset17.onnx)):
 ```sh
 python3 iree_converter.py -f onnx -m efficientnet-b0.onnx \
                          --onnx_opset_version 18 \
                          -o ./output/efficientnet-b0.mlir
 ```
 
-PyTorch model from file:
+PyTorch model from file (`.pt` can be created using [tutorial](https://docs.pytorch.org/docs/main/notes/serialization.html#saving-and-loading-torch-nn-modules)):
 ```sh
 python3 iree_converter.py -f pytorch -m resnet50.pt \
                          -is 1 224 224 3 \
                          -o ./output/resnet50.mlir
 ```
 
-PyTorch model from torchvision with pretrained weights:
+PyTorch model from [torchvision](https://docs.pytorch.org/vision/main/models.html) with pretrained weights:
 ```sh
 python3 iree_converter.py -f pytorch -mn resnet50 \
                          -tm torchvision.models \
@@ -88,19 +88,19 @@ iree_compiler.py --mlir <input.mlir> \
 This script compiles model from `.mlir` format to the deployable binary format for the specified target backend.
 
 ### IREE compiler parameters
-- `-m / --mlir` - Path to an .mlir file with a model. Required.
-- `-tb / --target_backend` - Target backend for compilation. Required. Examples: `llvm-cpu`, `cuda`, `vulkan`, `vmvx`.
-- `--opt_level` - The optimization level of the compilation. Choices: `0`, `1`, `2`, `3`. Default: `2`.
-- `-o / --output_file` - Path to save the compiled model. Required.
-- `--extra_args` - Extra arguments for compilation. Optional.
+- `-m / --mlir` is a path to an .mlir file with a model. Required.
+- `-tb / --target_backend` is a target backend for compilation. Required. Examples: `llvm-cpu`, `cuda`, `vulkan`, `vmvx`.
+- `--opt_level` is an optimization level of the compilation. Choices: `0`, `1`, `2`, `3`. Default: `2`.
+- `-o / --output_file` is a path to save the compiled model. Required.
+- `--extra_args` - is an extra arguments for compilation. Optional.
 
 ### Supported target backends
-- `llvm-cpu` - CPU execution using LLVM
-- `cuda` - NVIDIA GPU execution using CUDA
-- `vulkan` - GPU execution using Vulkan API
-- `vmvx` - Portable VM bytecode execution
-- `metal` - Apple GPU execution using Metal
-- `rocm` - AMD GPU execution using ROCm
+- `llvm-cpu` - CPU execution using LLVM.
+- `cuda` - NVIDIA GPU execution using CUDA.
+- `vulkan` - GPU execution using Vulkan API.
+- `vmvx` - Portable VM bytecode execution.
+- `metal` - Apple GPU execution using Metal.
+- `rocm` - AMD GPU execution using ROCm.
 
 ### Examples of usage
 ```sh
diff --git a/src/model_converters/iree_converter/iree_auxiliary/onnx_format.py b/src/model_converters/iree_converter/iree_auxiliary/onnx_format.py
index 8f836b4d3..e5f0e0326 100644
--- a/src/model_converters/iree_converter/iree_auxiliary/onnx_format.py
+++ b/src/model_converters/iree_converter/iree_auxiliary/onnx_format.py
@@ -16,13 +16,13 @@ def source_framework(self):
 
     def _validate_arguments(self):
         if self.model_path is None or self.model_path == '':
-            raise ValueError("The model_path parameter is required for ONNX conversion.")
+            raise ValueError('The model_path parameter is required for ONNX conversion.')
 
         if not os.path.exists(self.model_path):
-            raise FileNotFoundError(f"Model file not found: {self.model_path}")
+            raise FileNotFoundError(f'Model file not found: {self.model_path}')
 
         if self.onnx_opset_version is None:
-            raise ValueError("The onnx_opset_version parameter is required for ONNX conversion.")
+            raise ValueError('The onnx_opset_version parameter is required for ONNX conversion.')
 
     def _convert_model_from_framework(self):
         if not os.path.exists(self.output_mlir):
@@ -36,5 +36,5 @@ def _convert_model_from_framework(self):
             self.output_mlir,
         ]
         import_cmd = subprocess.list2cmdline(import_args)
-        ret = subprocess.run(import_cmd, shell=True, capture_output=True)
+        subprocess.run(import_cmd, shell=True, capture_output=True)
         return
diff --git a/src/model_converters/iree_converter/iree_auxiliary/pytorch_format.py b/src/model_converters/iree_converter/iree_auxiliary/pytorch_format.py
index 7e5f035a8..cd9aa91c5 100644
--- a/src/model_converters/iree_converter/iree_auxiliary/pytorch_format.py
+++ b/src/model_converters/iree_converter/iree_auxiliary/pytorch_format.py
@@ -17,36 +17,38 @@ def __init__(self, args):
     @property
     def source_framework(self):
         return 'PyTorch'
-    
+
     def _validate_arguments(self):
         if self.input_shape is None:
-            raise ValueError("The input_shape parameter is required for PyTorch conversion.")
-        
+            raise ValueError('The input_shape parameter is required for PyTorch conversion.')
+
         # Check load methods:
         # 1. model_path (load from file)
         # 2. module + model_name (load from torch module)
         has_model_path = self.model_path is not None and self.model_path != ''
-        has_module_model = (self.module is not None and self.module != '' and 
-                          self.model_name is not None and self.model_name != '')
-        
+        has_module_model = (self.module is not None
+                            and self.module != ''
+                            and self.model_name is not None
+                            and self.model_name != '')
+
         if not has_model_path and not has_module_model:
             raise ValueError(
-                "For PyTorch conversion, you must specify either model_path, "
-                "or torch_module and model_name"
+                'For PyTorch conversion, you must specify either model_path, \
+                or torch_module and model_name'
             )
-        
+
         if has_model_path and has_module_model:
             raise ValueError(
-                "Provided incompatible parameters for PyTorch conversion (model_path and torch_module+model_name). "
-                "Please choose only one method of this."
+                'Provided incompatible parameters for PyTorch conversion (model_path and torch_module+model_name). \
+                Please choose only one method of this.'
             )
 
         if has_model_path and not os.path.exists(self.model_path):
-            raise FileNotFoundError(f"Model file not found: {self.model_path}")
+            raise FileNotFoundError(f'Model file not found: {self.model_path}')
 
-        if (self.model_weights is not None and self.model_weights != '' and 
-            not os.path.exists(self.model_weights)):
-            raise FileNotFoundError(f"Model weights not found: {self.model_weights}")
+        if (self.model_weights is not None and self.model_weights != ''
+                and not os.path.exists(self.model_weights)):
+            raise FileNotFoundError(f'Model weights not found: {self.model_weights}')
 
     def __get_model_from_path(self):
         self.log.info(f'Loading model from path {self.model_path}')
diff --git a/src/model_converters/iree_converter/iree_compiler.py b/src/model_converters/iree_converter/iree_compiler.py
index cd4ac309d..6273059cf 100644
--- a/src/model_converters/iree_converter/iree_compiler.py
+++ b/src/model_converters/iree_converter/iree_compiler.py
@@ -10,6 +10,7 @@
 
 log = configure_logger()
 
+
 def cli_argument_parser():
     parser = argparse.ArgumentParser()
     parser.add_argument('-m', '--mlir',

From 2ddb87267c66506c7c15a030fe9f5d21ca19a985 Mon Sep 17 00:00:00 2001
From: Vladislav Denisov <vlad.roix@yandex.ru>
Date: Mon, 17 Nov 2025 20:53:42 +0300
Subject: [PATCH 06/17] Fix code-style for non-IREE scripts

---
 src/accuracy_checker/process.py | 2 +-
 src/inference/io_adapter.py     | 4 ++--
 src/quantization/process.py     | 2 +-
 3 files changed, 4 insertions(+), 4 deletions(-)

diff --git a/src/accuracy_checker/process.py b/src/accuracy_checker/process.py
index 6661be780..df117097f 100644
--- a/src/accuracy_checker/process.py
+++ b/src/accuracy_checker/process.py
@@ -25,7 +25,7 @@ def execute(self, idx):
         command_line = self.__fill_command_line()
         if command_line == '':
             self.__log.error('Command line is empty')
-        self.__log.info(f'Start accuracy check for {idx+1} test: {self._test.model.name}')
+        self.__log.info(f'Start accuracy check for {idx + 1} test: {self._test.model.name}')
         self.__log.info(f'Command line is : {command_line}')
         self._executor.set_target_framework(self._test.framework)
         command_line = self._executor.prepare_command_line(self._test, command_line)
diff --git a/src/inference/io_adapter.py b/src/inference/io_adapter.py
index d555fb574..177fb803d 100644
--- a/src/inference/io_adapter.py
+++ b/src/inference/io_adapter.py
@@ -433,7 +433,7 @@ def get_slice_input(self, *args, **kwargs):
         return [self._prompts[0]] * self._batch_size
 
     def process_output(self, result, log):
-        output_text = '\n'.join([f'{i+1}) {text} ... \n' for i, text in enumerate(result)])
+        output_text = '\n'.join([f'{i + 1}) {text} ... \n' for i, text in enumerate(result)])
         log.info(f'Generated results: \n{output_text}')
 
 
@@ -443,7 +443,7 @@ def get_slice_input(self, *args, **kwargs):
         return self.audio_data, self.sampling_rate, self.audio_length
 
     def process_output(self, result, log):
-        output_text = '\n'.join([f'{i+1}) {text} ... \n' for i, text in enumerate(result)])
+        output_text = '\n'.join([f'{i + 1}) {text} ... \n' for i, text in enumerate(result)])
         log.info(f'Generated results: \n{output_text}')
 
 
diff --git a/src/quantization/process.py b/src/quantization/process.py
index 506c97a9e..3bf5f5787 100644
--- a/src/quantization/process.py
+++ b/src/quantization/process.py
@@ -74,7 +74,7 @@ def execute(self, idx):
         command_line = self.__fill_command_line()
         if command_line == '':
             self.__log.error('Command line is empty')
-        self.__log.info(f'Start quantization model #{idx+1}!')
+        self.__log.info(f'Start quantization model #{idx + 1}!')
         self.__log.info(f'Command line is : {command_line}')
         self._status, self._output = self._executor.execute_process(command_line)
         if type(self._output) is not list:

From 4d09e218a53b6bcab4238c64974489a3216ec44c Mon Sep 17 00:00:00 2001
From: Vladislav Denisov <vlad.roix@yandex.ru>
Date: Mon, 17 Nov 2025 21:49:40 +0300
Subject: [PATCH 07/17] IREE converter support in inference script (without
 full validation cli)

---
 src/inference/inference_iree.py | 88 ++++++++++++++++++++++++++++++---
 1 file changed, 82 insertions(+), 6 deletions(-)

diff --git a/src/inference/inference_iree.py b/src/inference/inference_iree.py
index be7944295..81c85467e 100644
--- a/src/inference/inference_iree.py
+++ b/src/inference/inference_iree.py
@@ -2,6 +2,7 @@
 import os
 import sys
 import traceback
+import tempfile
 from pathlib import Path
 
 import postprocessing_data as pp
@@ -17,6 +18,7 @@
                                                                  'iree_converter',
                                                                  'iree_auxiliary')))
 from compiler import IREECompiler  # noqa: E402
+from converter import IREEConverter  # noqa: E402
 
 sys.path.append(str(Path(__file__).resolve().parents[1].joinpath('utils')))
 from logger_conf import configure_logger  # noqa: E402
@@ -30,14 +32,45 @@
     sys.exit(1)
 
 
+def validate_cli_args(args):
+    if args.model:
+        pass
+    else:
+        pass
+
+
 def cli_argument_parser():
     parser = argparse.ArgumentParser()
-
+    parser.add_argument('-f', '--source_framework',
+                        help='Source model framework (required for automatic conversion to MLIR)',
+                        type=str,
+                        choices=['onnx', 'pytorch'],
+                        dest='source_framework')    
     parser.add_argument('-m', '--model',
-                        help='Path to .vmfb file with compiled model or .mlir.',
-                        required=True,
+                        help='Path to source framework model (.onnx, .pt),'
+                             'to file with compiled model (.vmfb)'
+                             'or MLIR (.mlir).',
                         type=str,
                         dest='model')
+    parser.add_argument('-w', '--weights',
+                        help='Path to an .pth file with a trained weights.'
+                             'Availiable when source_framework=pytorch ',
+                        type=str,
+                        dest='model_weights')
+    parser.add_argument('-tm', '--torch_module',
+                        help='Torch module with model architecture.'
+                             'Availiable when source_framework=pytorch',
+                        type=str,
+                        dest='torch_module')
+    parser.add_argument('-mn', '--model_name',
+                        help='Model name.',
+                        type=str,
+                        dest='model_name')
+    parser.add_argument('--onnx_opset_version',
+                        help='Path to an .onnx with a trained model.'
+                             'Availiable when source_framework=onnx',
+                        type=int,
+                        dest='onnx_opset_version')
     parser.add_argument('-fn', '--function_name',
                         help='IREE module function name to execute.',
                         required=True,
@@ -143,8 +176,25 @@ def cli_argument_parser():
                         type=str,
                         nargs=argparse.REMAINDER,
                         default=[])
-
-    return parser.parse_args()
+    args = parser.parse_args()
+    validate_cli_args(args)
+    return args
+
+
+def convert_model_to_mlir(model_path, model_weights, torch_module, model_name, onnx_opset_version, source_framework, input_shape, output_mlir):
+    dictionary = {
+        'source_framework': source_framework,
+        'model_name': model_name,
+        'model_path': model_path,
+        'model_weights': model_weights,
+        'torch_module': torch_module,
+        'onnx_opset_version': onnx_opset_version,
+        'input_shape': input_shape,
+        'output_mlir': output_mlir
+    }
+    converter = IREEConverter.get_converter(dictionary)
+    converter.convert_to_mlir()
+    return
 
 
 def compile_mlir(mlir_path, target_backend, opt_level, extra_compile_args):
@@ -191,13 +241,33 @@ def create_iree_context_from_buffer(vmfb_buffer):
         raise
 
 
-def load_model(model_path, target_backend, opt_level, extra_compile_args):
+def load_model(model_path, model_weights, torch_module, model_name, onnx_opset_version,
+               source_framework, input_shape, target_backend, opt_level, extra_compile_args):
+    is_tmp_mlir = False
+    if model_path is None or model_path.split('.')[-1] not in ['vmfb', 'mlir']:
+        with tempfile.NamedTemporaryFile(mode='w+t', delete=False, suffix='.mlir') as temp:
+            output_mlir = temp.name
+            convert_model_to_mlir(model_path,
+                                  model_weights,
+                                  torch_module,
+                                  model_name,
+                                  onnx_opset_version,
+                                  source_framework,
+                                  input_shape,
+                                  output_mlir)
+            model_path = output_mlir
+            is_tmp_mlir = True
+
     vmfb_buffer = load_model_buffer(
         model_path,
         target_backend=target_backend,
         opt_level=opt_level,
         extra_compile_args=extra_compile_args
     )
+
+    if is_tmp_mlir:
+        os.remove(model_path)
+
     return create_iree_context_from_buffer(vmfb_buffer)
 
 
@@ -316,6 +386,12 @@ def main():
         log.info('Loading model')
         model_context = load_model(
             model_path=args.model,
+            model_weights=args.model_weights,
+            torch_module=args.torch_module,
+            model_name=args.model_name,
+            onnx_opset_version=args.onnx_opset_version,
+            source_framework=args.source_framework,
+            input_shape=args.input_shape,
             target_backend=args.target_backend,
             opt_level=args.opt_level,
             extra_compile_args=args.extra_compile_args

From 15ac8f9065b76c8140e0874776d4551d5ee9ae67 Mon Sep 17 00:00:00 2001
From: Vladislav Denisov <vlad.roix@yandex.ru>
Date: Tue, 18 Nov 2025 19:31:33 +0300
Subject: [PATCH 08/17] IREE inference_auxiliary

---
 src/inference/inference_iree.py               | 165 +-----------
 src/inference/io_adapter.py                   |   2 +-
 src/inference/iree_auxiliary.py               | 247 ++++++++++++++++++
 .../iree_converter/iree_auxiliary/compiler.py |   2 +-
 .../iree_auxiliary/onnx_format.py             |   6 +-
 .../iree_auxiliary/pytorch_format.py          |   4 +-
 .../iree_converter/iree_compiler.py           |   2 +-
 .../iree_converter/iree_converter.py          |   2 +-
 8 files changed, 264 insertions(+), 166 deletions(-)
 create mode 100644 src/inference/iree_auxiliary.py

diff --git a/src/inference/inference_iree.py b/src/inference/inference_iree.py
index 81c85467e..6163c1f2e 100644
--- a/src/inference/inference_iree.py
+++ b/src/inference/inference_iree.py
@@ -1,8 +1,6 @@
 import argparse
-import os
 import sys
 import traceback
-import tempfile
 from pathlib import Path
 
 import postprocessing_data as pp
@@ -11,14 +9,8 @@
 from io_model_wrapper import IREEModelWrapper
 from reporter.report_writer import ReportWriter
 from transformer import IREETransformer
+from iree_auxiliary import (load_model, create_dict_for_transformer, prepare_output, validate_cli_args)
 
-import numpy as np
-
-sys.path.append(str(Path(__file__).resolve().parents[1].joinpath('model_converters',
-                                                                 'iree_converter',
-                                                                 'iree_auxiliary')))
-from compiler import IREECompiler  # noqa: E402
-from converter import IREEConverter  # noqa: E402
 
 sys.path.append(str(Path(__file__).resolve().parents[1].joinpath('utils')))
 from logger_conf import configure_logger  # noqa: E402
@@ -32,20 +24,13 @@
     sys.exit(1)
 
 
-def validate_cli_args(args):
-    if args.model:
-        pass
-    else:
-        pass
-
-
 def cli_argument_parser():
     parser = argparse.ArgumentParser()
     parser.add_argument('-f', '--source_framework',
                         help='Source model framework (required for automatic conversion to MLIR)',
                         type=str,
                         choices=['onnx', 'pytorch'],
-                        dest='source_framework')    
+                        dest='source_framework')
     parser.add_argument('-m', '--model',
                         help='Path to source framework model (.onnx, .pt),'
                              'to file with compiled model (.vmfb)'
@@ -181,96 +166,6 @@ def cli_argument_parser():
     return args
 
 
-def convert_model_to_mlir(model_path, model_weights, torch_module, model_name, onnx_opset_version, source_framework, input_shape, output_mlir):
-    dictionary = {
-        'source_framework': source_framework,
-        'model_name': model_name,
-        'model_path': model_path,
-        'model_weights': model_weights,
-        'torch_module': torch_module,
-        'onnx_opset_version': onnx_opset_version,
-        'input_shape': input_shape,
-        'output_mlir': output_mlir
-    }
-    converter = IREEConverter.get_converter(dictionary)
-    converter.convert_to_mlir()
-    return
-
-
-def compile_mlir(mlir_path, target_backend, opt_level, extra_compile_args):
-    try:
-        log.info('Starting model compilation')
-        return IREECompiler.compile(mlir_path, target_backend, opt_level, extra_compile_args)
-    except Exception as e:
-        log.error(f'Failed to compile MLIR: {e}')
-        raise
-
-
-def load_model_buffer(model_path, target_backend, opt_level, extra_compile_args):
-    if not os.path.exists(model_path):
-        raise FileNotFoundError(f'Model file not found: {model_path}')
-
-    file_type = model_path.split('.')[-1]
-
-    if file_type == 'mlir':
-        if target_backend is None:
-            raise ValueError('target_backend is required for MLIR compilation')
-        vmfb_buffer = compile_mlir(model_path, target_backend, opt_level, extra_compile_args)
-    elif file_type == 'vmfb':
-        with open(model_path, 'rb') as f:
-            vmfb_buffer = f.read()
-    else:
-        raise ValueError(f'The file type {file_type} is not supported. Supported types: .mlir, .vmfb')
-
-    log.info(f'Successfully loaded model buffer from {model_path}')
-    return vmfb_buffer
-
-
-def create_iree_context_from_buffer(vmfb_buffer):
-    try:
-        config = ireert.Config('local-task')
-        vm_module = ireert.VmModule.from_flatbuffer(config.vm_instance, vmfb_buffer)
-        context = ireert.SystemContext(config=config)
-        context.add_vm_module(vm_module)
-
-        log.info('Successfully created IREE context from buffer')
-        return context
-
-    except Exception as e:
-        log.error(f'Failed to create IREE context: {e}')
-        raise
-
-
-def load_model(model_path, model_weights, torch_module, model_name, onnx_opset_version,
-               source_framework, input_shape, target_backend, opt_level, extra_compile_args):
-    is_tmp_mlir = False
-    if model_path is None or model_path.split('.')[-1] not in ['vmfb', 'mlir']:
-        with tempfile.NamedTemporaryFile(mode='w+t', delete=False, suffix='.mlir') as temp:
-            output_mlir = temp.name
-            convert_model_to_mlir(model_path,
-                                  model_weights,
-                                  torch_module,
-                                  model_name,
-                                  onnx_opset_version,
-                                  source_framework,
-                                  input_shape,
-                                  output_mlir)
-            model_path = output_mlir
-            is_tmp_mlir = True
-
-    vmfb_buffer = load_model_buffer(
-        model_path,
-        target_backend=target_backend,
-        opt_level=opt_level,
-        extra_compile_args=extra_compile_args
-    )
-
-    if is_tmp_mlir:
-        os.remove(model_path)
-
-    return create_iree_context_from_buffer(vmfb_buffer)
-
-
 def get_inference_function(model_context, function_name):
     try:
         main_module = model_context.modules.module
@@ -293,7 +188,7 @@ def inference_iree(inference_func, number_iter, get_slice, test_duration):
         time_infer.append(exec_time)
     else:
         time_infer = loop_inference(number_iter, test_duration)(
-            inference_iteration
+            inference_iteration,
         )(inference_func, get_slice)['time_infer']
 
     log.info('Inference completed')
@@ -311,7 +206,7 @@ def infer_slice(inference_func, slice_input):
     config = ireert.Config('local-task')
     device = config.device
 
-    input_buffers = list()
+    input_buffers = ()
     for input_ in slice_input:
         input_buffers.append(ireert.asdevicearray(device, input_))
 
@@ -323,50 +218,6 @@ def infer_slice(inference_func, slice_input):
     return result
 
 
-def prepare_output(result, task):
-    if task == 'feedforward':
-        return {}
-    elif task == 'classification':
-        if hasattr(result, 'to_host'):
-            result = result.to_host()
-
-        # Extract tensor from dict if needed
-        if isinstance(result, dict):
-            result_key = next(iter(result))
-            logits = result[result_key]
-            output_key = result_key
-        else:
-            logits = np.array(result)
-            output_key = 'output'
-
-        # Ensure correct shape (batch_size, num_classes)
-        if logits.ndim == 1:
-            logits = logits.reshape(1, -1)
-        elif logits.ndim > 2:
-            logits = logits.reshape(logits.shape[0], -1)
-
-        # Apply softmax
-        max_logits = np.max(logits, axis=-1, keepdims=True)
-        exp_logits = np.exp(logits - max_logits)
-        probabilities = exp_logits / np.sum(exp_logits, axis=-1, keepdims=True)
-
-        return {output_key: probabilities}
-    else:
-        raise ValueError(f'Unsupported task {task}')
-
-
-def create_dict_for_transformer(args):
-    return {
-        'channel_swap': getattr(args, 'channel_swap'),
-        'mean': getattr(args, 'mean'),
-        'std': getattr(args, 'std'),
-        'norm': getattr(args, 'norm'),
-        'layout': getattr(args, 'layout'),
-        'input_shape': getattr(args, 'input_shape'),
-        'batch_size': getattr(args, 'batch_size'),
-    }
-
-
 def main():
     args = cli_argument_parser()
 
@@ -380,7 +231,7 @@ def main():
         report_writer.update_configuration_setup(
             batch_size=args.batch_size,
             iterations_num=args.number_iter,
-            target_device=args.target_backend
+            target_device=args.target_backend,
         )
 
         log.info('Loading model')
@@ -394,7 +245,7 @@ def main():
             input_shape=args.input_shape,
             target_backend=args.target_backend,
             opt_level=args.opt_level,
-            extra_compile_args=args.extra_compile_args
+            extra_compile_args=args.extra_compile_args,
         )
         inference_func = get_inference_function(model_context, args.function_name)
 
@@ -406,13 +257,13 @@ def main():
             inference_func,
             args.number_iter,
             io.get_slice_input_iree,
-            args.time
+            args.time,
         )
 
         log.info('Computing performance metrics')
         inference_result = pp.calculate_performance_metrics_sync_mode(
             args.batch_size,
-            inference_time
+            inference_time,
         )
 
         report_writer.update_execution_results(**inference_result)
diff --git a/src/inference/io_adapter.py b/src/inference/io_adapter.py
index 177fb803d..f3a71d486 100644
--- a/src/inference/io_adapter.py
+++ b/src/inference/io_adapter.py
@@ -187,7 +187,7 @@ def get_slice_input(self, *args, **kwargs):
         return slice_input
 
     def get_slice_input_iree(self, *args, **kwargs):
-        slice_input = list()
+        slice_input = ()
         for key in self._transformed_input:
             data_gen = self._transformed_input[key]
             slice_data = [copy.deepcopy(next(data_gen)) for _ in range(self._batch_size)]
diff --git a/src/inference/iree_auxiliary.py b/src/inference/iree_auxiliary.py
new file mode 100644
index 000000000..49330a494
--- /dev/null
+++ b/src/inference/iree_auxiliary.py
@@ -0,0 +1,247 @@
+import os
+import sys
+import tempfile
+from pathlib import Path
+
+import numpy as np
+
+sys.path.append(str(Path(__file__).resolve().parents[1].joinpath('model_converters',
+                                                                 'iree_converter',
+                                                                 'iree_auxiliary')))
+from compiler import IREECompiler  # noqa: E402
+from converter import IREEConverter  # noqa: E402
+
+sys.path.append(str(Path(__file__).resolve().parents[1].joinpath('utils')))
+from logger_conf import configure_logger  # noqa: E402
+
+log = configure_logger()
+
+try:
+    import iree.runtime as ireert  # noqa: E402
+except ImportError as e:
+    log.error(f'IREE import error: {e}')
+    sys.exit(1)
+
+
+def _validate_onnx_args(args):
+    if not args.model:
+        raise ValueError('Model path (-m/--model) is required for ONNX framework')
+
+    if not args.model.endswith('.onnx'):
+        raise ValueError('For ONNX framework, model must be an .onnx file')
+
+    if not os.path.exists(args.model):
+        raise FileNotFoundError(f'Model file not found: {args.model}')
+
+    if not args.onnx_opset_version:
+        raise ValueError('onnx_opset_version is required for ONNX framework')
+
+
+def _validate_pytorch_args(args):
+    has_model_path = args.model is not None and args.model != ''
+    has_module_model = (args.torch_module is not None and args.torch_module != ''
+                        and args.model_name is not None and args.model_name != '')
+
+    if not has_model_path and not has_module_model:
+        raise ValueError(
+            'For PyTorch conversion, you must specify either model_path (.pt file), '
+            'or torch_module and model_name',
+        )
+
+    if has_model_path and has_module_model:
+        raise ValueError(
+            'Provided incompatible parameters for PyTorch conversion (model_path and torch_module+model_name). '
+            'Please choose only one method.',
+        )
+
+    if has_model_path:
+        if not os.path.exists(args.model):
+            raise FileNotFoundError(f'Model file not found: {args.model}')
+
+        file_type = args.model.split('.')[-1]
+        supported_extensions = ['pt']
+        if file_type not in supported_extensions:
+            raise ValueError(f'The file type {file_type} is not supported.'
+                             f'Supported: {", ".join(supported_extensions)}')
+
+    if args.model_weights and args.model_weights != '' and not os.path.exists(args.model_weights):
+        raise FileNotFoundError(f'Model weights not found: {args.model_weights}')
+
+
+def _validate_conversion_model_args(args):
+    if not args.target_backend:
+        raise ValueError(f'target_backend is required when using conversion from {args.source_framework} model')
+    if args.source_framework == 'onnx':
+        _validate_onnx_args(args)
+    elif args.source_framework == 'pytorch':
+        _validate_pytorch_args(args)
+
+
+def _validate_mlir_args(args):
+    if not args.target_backend:
+        raise ValueError('target_backend is required when using .mlir model')
+
+    if not os.path.exists(args.model):
+        raise FileNotFoundError(f'MLIR file not found: {args.model}')
+
+
+def _validate_vmfb_args(args):
+    if not os.path.exists(args.model):
+        raise FileNotFoundError(f'VMFB file not found: {args.model}')
+
+
+def _validate_iree_model_args(args):
+    if not args.model:
+        raise ValueError('Model path (-m/--model) is required when source_framework is not specified')
+
+    file_ext = args.model.split('.')[-1].lower()
+
+    if file_ext == 'mlir':
+        _validate_mlir_args(args)
+    elif file_ext == 'vmfb':
+        _validate_vmfb_args(args)
+    else:
+        supported_formats = ['.onnx', '.pt', '.mlir', '.vmfb']
+        raise ValueError(f'Unsupported model format: {args.model}. Supported formats: {", ".join(supported_formats)}')
+
+
+def validate_cli_args(args):
+    if args.source_framework:
+        _validate_conversion_model_args(args)
+    else:
+        _validate_iree_model_args(args)
+
+
+def _convert_model_to_mlir(model_path, model_weights, torch_module, model_name, onnx_opset_version,
+                           source_framework, input_shape, output_mlir):
+    dictionary = {
+        'source_framework': source_framework,
+        'model_name': model_name,
+        'model_path': model_path,
+        'model_weights': model_weights,
+        'torch_module': torch_module,
+        'onnx_opset_version': onnx_opset_version,
+        'input_shape': input_shape,
+        'output_mlir': output_mlir,
+    }
+    converter = IREEConverter.get_converter(dictionary)
+    converter.convert_to_mlir()
+    return
+
+
+def _compile_mlir(mlir_path, target_backend, opt_level, extra_compile_args):
+    try:
+        log.info('Starting model compilation')
+        return IREECompiler.compile_model(mlir_path, target_backend, opt_level, extra_compile_args)
+    except Exception as e:
+        log.error(f'Failed to compile MLIR: {e}')
+        raise
+
+
+def _load_model_buffer(model_path, target_backend, opt_level, extra_compile_args):
+    if not os.path.exists(model_path):
+        raise FileNotFoundError(f'Model file not found: {model_path}')
+
+    file_type = model_path.split('.')[-1]
+
+    if file_type == 'mlir':
+        if target_backend is None:
+            raise ValueError('target_backend is required for MLIR compilation')
+        vmfb_buffer = _compile_mlir(model_path, target_backend, opt_level, extra_compile_args)
+    elif file_type == 'vmfb':
+        with open(model_path, 'rb') as f:
+            vmfb_buffer = f.read()
+    else:
+        raise ValueError(f'The file type {file_type} is not supported. Supported types: .mlir, .vmfb')
+
+    log.info(f'Successfully loaded model buffer from {model_path}')
+    return vmfb_buffer
+
+
+def _create_iree_context_from_buffer(vmfb_buffer):
+    try:
+        config = ireert.Config('local-task')
+        vm_module = ireert.VmModule.from_flatbuffer(config.vm_instance, vmfb_buffer)
+        context = ireert.SystemContext(config=config)
+        context.add_vm_module(vm_module)
+
+        log.info('Successfully created IREE context from buffer')
+        return context
+
+    except Exception as e:
+        log.error(f'Failed to create IREE context: {e}')
+        raise
+
+
+def load_model(model_path, model_weights, torch_module, model_name, onnx_opset_version,
+               source_framework, input_shape, target_backend, opt_level, extra_compile_args):
+    is_tmp_mlir = False
+    if model_path is None or model_path.split('.')[-1] not in ['vmfb', 'mlir']:
+        with tempfile.NamedTemporaryFile(mode='w+t', delete=False, suffix='.mlir') as temp:
+            output_mlir = temp.name
+            _convert_model_to_mlir(model_path,
+                                   model_weights,
+                                   torch_module,
+                                   model_name,
+                                   onnx_opset_version,
+                                   source_framework,
+                                   input_shape,
+                                   output_mlir)
+            model_path = output_mlir
+            is_tmp_mlir = True
+
+    vmfb_buffer = _load_model_buffer(
+        model_path,
+        target_backend=target_backend,
+        opt_level=opt_level,
+        extra_compile_args=extra_compile_args,
+    )
+
+    if is_tmp_mlir:
+        os.remove(model_path)
+
+    return _create_iree_context_from_buffer(vmfb_buffer)
+
+
+def prepare_output(result, task):
+    if task == 'feedforward':
+        return {}
+    elif task == 'classification':
+        if hasattr(result, 'to_host'):
+            result = result.to_host()
+
+        # Extract tensor from dict if needed
+        if isinstance(result, dict):
+            result_key = next(iter(result))
+            logits = result[result_key]
+            output_key = result_key
+        else:
+            logits = np.array(result)
+            output_key = 'output'
+
+        # Ensure correct shape (batch_size, num_classes)
+        if logits.ndim == 1:
+            logits = logits.reshape(1, -1)
+        elif logits.ndim > 2:
+            logits = logits.reshape(logits.shape[0], -1)
+
+        # Apply softmax
+        max_logits = np.max(logits, axis=-1, keepdims=True)
+        exp_logits = np.exp(logits - max_logits)
+        probabilities = exp_logits / np.sum(exp_logits, axis=-1, keepdims=True)
+
+        return {output_key: probabilities}
+    else:
+        raise ValueError(f'Unsupported task {task}')
+
+
+def create_dict_for_transformer(args):
+    return {
+        'channel_swap': args.channel_swap,
+        'mean': args.mean,
+        'std': args.std,
+        'norm': args.norm,
+        'layout': args.layout,
+        'input_shape': args.input_shape,
+        'batch_size': args.batch_size,
+    }
diff --git a/src/model_converters/iree_converter/iree_auxiliary/compiler.py b/src/model_converters/iree_converter/iree_auxiliary/compiler.py
index 999d28001..8a17d861f 100644
--- a/src/model_converters/iree_converter/iree_auxiliary/compiler.py
+++ b/src/model_converters/iree_converter/iree_auxiliary/compiler.py
@@ -4,7 +4,7 @@
 
 class IREECompiler:
     @staticmethod
-    def compile(mlir, target, opt_level, extra_args, output_file=None):
+    def compile_model(mlir, target, opt_level, extra_args, output_file=None):
         if output_file and not os.path.exists(output_file):
             os.mkdir(output_file)
         extra_args.append(f'--iree-opt-level=O{opt_level}')
diff --git a/src/model_converters/iree_converter/iree_auxiliary/onnx_format.py b/src/model_converters/iree_converter/iree_auxiliary/onnx_format.py
index e5f0e0326..0e81ae2ef 100644
--- a/src/model_converters/iree_converter/iree_auxiliary/onnx_format.py
+++ b/src/model_converters/iree_converter/iree_auxiliary/onnx_format.py
@@ -28,11 +28,11 @@ def _convert_model_from_framework(self):
         if not os.path.exists(self.output_mlir):
             os.mkdir(self.output_mlir)
         import_args = [
-            "iree-import-onnx",
+            'iree-import-onnx',
             self.model_path,
-            "--opset-version",
+            '--opset-version',
             str(self.onnx_opset_version),
-            "-o",
+            '-o',
             self.output_mlir,
         ]
         import_cmd = subprocess.list2cmdline(import_args)
diff --git a/src/model_converters/iree_converter/iree_auxiliary/pytorch_format.py b/src/model_converters/iree_converter/iree_auxiliary/pytorch_format.py
index cd9aa91c5..9f9b7cce6 100644
--- a/src/model_converters/iree_converter/iree_auxiliary/pytorch_format.py
+++ b/src/model_converters/iree_converter/iree_auxiliary/pytorch_format.py
@@ -34,13 +34,13 @@ def _validate_arguments(self):
         if not has_model_path and not has_module_model:
             raise ValueError(
                 'For PyTorch conversion, you must specify either model_path, \
-                or torch_module and model_name'
+                or torch_module and model_name',
             )
 
         if has_model_path and has_module_model:
             raise ValueError(
                 'Provided incompatible parameters for PyTorch conversion (model_path and torch_module+model_name). \
-                Please choose only one method of this.'
+                Please choose only one method of this.',
             )
 
         if has_model_path and not os.path.exists(self.model_path):
diff --git a/src/model_converters/iree_converter/iree_compiler.py b/src/model_converters/iree_converter/iree_compiler.py
index 6273059cf..ad8f72b0a 100644
--- a/src/model_converters/iree_converter/iree_compiler.py
+++ b/src/model_converters/iree_converter/iree_compiler.py
@@ -42,7 +42,7 @@ def cli_argument_parser():
 def main():
     args = cli_argument_parser()
     try:
-        IREECompiler.compile(args.mlir, args.target_backend, args.opt_level, args.extra_args, args.output_file)
+        IREECompiler.compile_model(args.mlir, args.target_backend, args.opt_level, args.extra_args, args.output_file)
         if os.path.exists(args.output_file):
             print(f'The MLIR has been sucessfully compiled into {args.output_file}')
     except Exception:
diff --git a/src/model_converters/iree_converter/iree_converter.py b/src/model_converters/iree_converter/iree_converter.py
index a46a5cdba..f6472eb81 100644
--- a/src/model_converters/iree_converter/iree_converter.py
+++ b/src/model_converters/iree_converter/iree_converter.py
@@ -68,7 +68,7 @@ def create_dict_for_converter(args):
         'torch_module': args.torch_module,
         'onnx_opset_version': args.onnx_opset_version,
         'input_shape': args.input_shape,
-        'output_mlir': args.output_mlir
+        'output_mlir': args.output_mlir,
     }
     return dictionary
 

From 1d7520995f61b03f720182538f77d40b91492361 Mon Sep 17 00:00:00 2001
From: Vladislav Denisov <vlad.roix@yandex.ru>
Date: Sat, 22 Nov 2025 18:23:03 +0300
Subject: [PATCH 09/17] IREE benchmark and update README

---
 requirements_frameworks.txt                   |   4 +
 src/benchmark/README.md                       |   2 +
 src/benchmark/config_parser_factory.py        |   3 +
 .../frameworks/config_parser/test_reporter.py |   4 +-
 .../frameworks/framework_wrapper_registry.py  |   2 +
 src/benchmark/frameworks/iree/__init__.py     |   0
 .../frameworks/iree/iree_parameters_parser.py |  85 +++++++++++
 src/benchmark/frameworks/iree/iree_process.py | 125 +++++++++++++++++
 src/benchmark/frameworks/iree/iree_wrapper.py |  17 +++
 src/benchmark/frameworks/known_frameworks.py  |   1 +
 src/benchmark/tests/test_processes.py         |   2 +
 src/configs/README.md                         |  56 ++++++++
 src/inference/README.md                       | 132 ++++++++++++------
 src/inference/inference_iree.py               |  10 +-
 src/inference/io_adapter.py                   |   2 +-
 src/inference/iree_auxiliary.py               |  74 ++++------
 src/inference/transformer.py                  |   8 +-
 src/model_converters/README.md                |   1 +
 src/model_converters/iree_converter/README.md |  12 +-
 .../iree_converter/iree_auxiliary/compiler.py |   2 -
 .../iree_auxiliary/onnx_format.py             |   2 -
 .../iree_auxiliary/pytorch_format.py          |   2 -
 .../iree_converter/iree_converter.py          |   6 +-
 23 files changed, 435 insertions(+), 117 deletions(-)
 create mode 100644 src/benchmark/frameworks/iree/__init__.py
 create mode 100644 src/benchmark/frameworks/iree/iree_parameters_parser.py
 create mode 100644 src/benchmark/frameworks/iree/iree_process.py
 create mode 100644 src/benchmark/frameworks/iree/iree_wrapper.py

diff --git a/requirements_frameworks.txt b/requirements_frameworks.txt
index 0334d3635..7c24a9276 100644
--- a/requirements_frameworks.txt
+++ b/requirements_frameworks.txt
@@ -23,3 +23,7 @@ paddlepaddle==2.6.0
 
 ncnn
 spektral==1.3.0
+
+iree-base-compiler
+iree-base-runtime
+iree-turbine
\ No newline at end of file
diff --git a/src/benchmark/README.md b/src/benchmark/README.md
index c44fd7e9a..c03ac63ef 100644
--- a/src/benchmark/README.md
+++ b/src/benchmark/README.md
@@ -22,6 +22,7 @@ the following frameworks:
 - [RKNN][rknn].
 - [Spektral][spektral] (Python API).
 - [PaddlePaddle][paddlepaddle] (Python API).
+- [IREE][iree] (Python API).
 
 ### Implemented algorithm
 
@@ -274,3 +275,4 @@ pip install openvino_dev[mxnet,caffe,caffe2,onnx,pytorch,tensorflow2]==<your ver
 [rknn]: https://github.com/rockchip-linux/rknpu2
 [spektral]: https://graphneural.network
 [paddlepaddle]: https://www.paddlepaddle.org.cn/en
+[iree]: https://iree.dev
diff --git a/src/benchmark/config_parser_factory.py b/src/benchmark/config_parser_factory.py
index 7c276a284..8b50edaa4 100644
--- a/src/benchmark/config_parser_factory.py
+++ b/src/benchmark/config_parser_factory.py
@@ -14,6 +14,7 @@
 from frameworks.ncnn.ncnn_parameters_parser import NcnnParametersParser
 from frameworks.spektral.spektral_parameters_parser import SpektralParametersParser
 from frameworks.executorch.executorch_parameters_parser import ExecuTorchParametersParser
+from frameworks.iree.iree_parameters_parser import IREEParametersParser
 
 
 def get_parameters_parser(framework):
@@ -57,4 +58,6 @@ def get_parameters_parser(framework):
         return CppParametersParser()
     if framework == KnownFrameworks.executorch:
         return ExecuTorchParametersParser()
+    if framework == KnownFrameworks.iree:
+        return IREEParametersParser()
     raise NotImplementedError(f'Unknown framework {framework}')
diff --git a/src/benchmark/frameworks/config_parser/test_reporter.py b/src/benchmark/frameworks/config_parser/test_reporter.py
index 04a1e8211..b942453e3 100644
--- a/src/benchmark/frameworks/config_parser/test_reporter.py
+++ b/src/benchmark/frameworks/config_parser/test_reporter.py
@@ -77,7 +77,9 @@ def prepare_framework_params(self):
         match_parameter_description['compile_with_backend'] = 'Pytorch compile backend'
 
         match_parameter_description['high_level_api'] = 'TVM HighLevelAPI'
-        match_parameter_description['opt_level'] = 'TVM OptimizationLevel'
+        match_parameter_description['opt_level'] = 'Optimization level'
+
+        match_parameter_description['extra_compile_args'] = 'Extra compile args'
 
         for parameter, description in match_parameter_description.items():
             if hasattr(self.dep_parameters, parameter) and getattr(self.dep_parameters, parameter) is not None:
diff --git a/src/benchmark/frameworks/framework_wrapper_registry.py b/src/benchmark/frameworks/framework_wrapper_registry.py
index 588df47c3..7518f1f11 100644
--- a/src/benchmark/frameworks/framework_wrapper_registry.py
+++ b/src/benchmark/frameworks/framework_wrapper_registry.py
@@ -21,6 +21,7 @@
 from .rknn.rknn_wrapper import RknnWrapper
 from .executorch_cpp.executorch_cpp_wrapper import ExecuTorchCppWrapper
 from .executorch.executorch_wrapper import ExecuTorchWrapper
+from .iree.iree_wrapper import IREEWrapper
 
 
 class FrameworkWrapperRegistry(metaclass=Singleton):
@@ -62,3 +63,4 @@ def _get_wrappers(self):
         self._framework_wrappers[RknnWrapper.framework_name] = RknnWrapper()
         self._framework_wrappers[ExecuTorchCppWrapper.framework_name] = ExecuTorchCppWrapper()
         self._framework_wrappers[ExecuTorchWrapper.framework_name] = ExecuTorchWrapper()
+        self._framework_wrappers[IREEWrapper.framework_name] = IREEWrapper()
diff --git a/src/benchmark/frameworks/iree/__init__.py b/src/benchmark/frameworks/iree/__init__.py
new file mode 100644
index 000000000..e69de29bb
diff --git a/src/benchmark/frameworks/iree/iree_parameters_parser.py b/src/benchmark/frameworks/iree/iree_parameters_parser.py
new file mode 100644
index 000000000..02a1c5836
--- /dev/null
+++ b/src/benchmark/frameworks/iree/iree_parameters_parser.py
@@ -0,0 +1,85 @@
+from ..config_parser.dependent_parameters_parser import DependentParametersParser
+from ..config_parser.framework_parameters_parser import FrameworkParameters
+
+
+class IREEParametersParser(DependentParametersParser):
+    CONFIG_FRAMEWORK_DEPENDENT_TAG = 'FrameworkDependent'
+    TAG_FUNCTION_NAME = 'FunctionName'
+    TAG_INPUT_SHAPE = 'InputShape'
+    TAG_LAYOUT = 'Layout'
+    TAG_NORMALIZE = 'Normalize'
+    TAG_MEAN = 'Mean'
+    TAG_STD = 'Std'
+    TAG_CHANNEL_SWAP = 'ChannelSwap'
+    TAG_TARGET_BACKEND = 'TargetBackend'
+    TAG_OPTIMIZATION_LEVEL = 'OptimizationLevel'
+    TAG_ONNX_OPSET = 'OnnxOpsetVersion'
+    TAG_EXTRA_COMPILE_ARGS = 'ExtraCompileArgs'
+
+    def parse_parameters(self, curr_test):
+        dep_parameters_tag = curr_test.getElementsByTagName(self.CONFIG_FRAMEWORK_DEPENDENT_TAG)[0]
+
+        def _read_tag(tag_name):
+            tag_nodes = dep_parameters_tag.getElementsByTagName(tag_name)
+            if not tag_nodes:
+                return None
+            node = tag_nodes[0].firstChild
+            return node.data.strip() if node else None
+
+        return IREEParameters(
+            function_name=_read_tag(self.TAG_FUNCTION_NAME),
+            input_shape=_read_tag(self.TAG_INPUT_SHAPE),
+            layout=_read_tag(self.TAG_LAYOUT),
+            normalize=_read_tag(self.TAG_NORMALIZE),
+            mean=_read_tag(self.TAG_MEAN),
+            std=_read_tag(self.TAG_STD),
+            channel_swap=_read_tag(self.TAG_CHANNEL_SWAP),
+            target_backend=_read_tag(self.TAG_TARGET_BACKEND),
+            optimization_level=_read_tag(self.TAG_OPTIMIZATION_LEVEL),
+            onnx_opset_version=_read_tag(self.TAG_ONNX_OPSET),
+            extra_compile_args=_read_tag(self.TAG_EXTRA_COMPILE_ARGS),
+        )
+
+
+class IREEParameters(FrameworkParameters):
+    def __init__(self, function_name, input_shape, layout, normalize, mean, std, channel_swap,
+                 target_backend, optimization_level, onnx_opset_version, extra_compile_args):
+        self.function_name = None
+        self.input_shape = None
+        self.layout = 'NHWC'
+        self.normalize = None
+        self.mean = None
+        self.std = None
+        self.channel_swap = None
+        self.target_backend = 'llvm-cpu'
+        self.opt_level = '2'
+        self.onnx_opset_version = None
+        self.extra_compile_args = None
+
+        if not self._parameter_is_not_none(function_name):
+            raise ValueError('FunctionName is a required parameter for IREE benchmark tests.')
+        self.function_name = function_name
+
+        if not self._parameter_is_not_none(input_shape):
+            raise ValueError('InputShape is a required parameter for IREE benchmark tests.')
+        self.input_shape = input_shape
+
+        if self._parameter_is_not_none(layout):
+            self.layout = layout
+        if self._parameter_is_not_none(normalize):
+            self.normalize = normalize
+        if self._parameter_is_not_none(mean):
+            self.mean = mean
+        if self._parameter_is_not_none(std):
+            self.std = std
+        if self._parameter_is_not_none(channel_swap):
+            self.channel_swap = channel_swap
+        if self._parameter_is_not_none(target_backend):
+            self.target_backend = target_backend
+        if self._parameter_is_not_none(optimization_level):
+            self.opt_level = optimization_level
+        if self._parameter_is_not_none(onnx_opset_version):
+            self.onnx_opset_version = onnx_opset_version
+        if self._parameter_is_not_none(extra_compile_args):
+            self.extra_compile_args = extra_compile_args
+
diff --git a/src/benchmark/frameworks/iree/iree_process.py b/src/benchmark/frameworks/iree/iree_process.py
new file mode 100644
index 000000000..753f41cac
--- /dev/null
+++ b/src/benchmark/frameworks/iree/iree_process.py
@@ -0,0 +1,125 @@
+from pathlib import Path
+
+from ..processes import ProcessHandler
+
+
+class IREEProcess(ProcessHandler):
+    benchmark_app_name = 'iree_python_benchmark'
+    launcher_latency_units = 'seconds'
+
+    def __init__(self, test, executor, log):
+        super().__init__(test, executor, log)
+        self.path_to_script = Path.joinpath(self.inference_script_root, 'inference_iree.py')
+
+    @staticmethod
+    def create_process(test, executor, log):
+        return IREEProcess(test, executor, log)
+
+    def get_performance_metrics(self):
+        return self.get_performance_metrics_from_json_report()
+
+    def _fill_command_line(self):
+        python = ProcessHandler.get_cmd_python_version(self._test)
+        arguments = self._compose_arguments()
+        return f'{python} {self.path_to_script} {arguments}'.strip()
+
+    def _compose_arguments(self):
+        model = self._test.model
+        dep = self._test.dep_parameters
+        indep = self._test.indep_parameters
+
+        dataset_path = self._normalize_optional(self._test.dataset.path if self._test.dataset else None)
+        model_path = self._normalize_optional(model.model)
+        weights_path = self._normalize_optional(model.weight)
+
+        command = f'-fn {dep.function_name} -is {dep.input_shape} -ni {indep.iteration} ' \
+                  f'--report_path {self.report_path}'
+
+        command = self._add_optional_argument_to_cmd_line(command, '-mn', model.name)
+
+        source_framework = self._get_source_framework(model.source_framework)
+        command = self._add_optional_argument_to_cmd_line(command, '-f', source_framework)
+
+        command = self._add_optional_argument_to_cmd_line(command, '-m', model_path)
+        command = self._add_optional_argument_to_cmd_line(command, '-w', weights_path)
+
+        module_path = self._normalize_optional(model.module)
+        command = self._add_optional_argument_to_cmd_line(command, '-tm', module_path)
+        command = self._add_optional_argument_to_cmd_line(command, '-i', dataset_path)
+        command = self._add_optional_argument_to_cmd_line(command, '-b', indep.batch_size)
+
+        task_type = self._resolve_task_type(model)
+        command = self._add_optional_argument_to_cmd_line(command, '--task', task_type)
+
+        time_limit = indep.test_time_limit
+        command = self._add_optional_argument_to_cmd_line(command, '--time', time_limit)
+
+        layout = self._normalize_optional(dep.layout)
+        command = self._add_optional_argument_to_cmd_line(command, '--layout', layout)
+        if self._parameter_is_true(dep.normalize):
+            command = self._add_flag_to_cmd_line(command, '--norm')
+
+        mean = self._normalize_optional(dep.mean)
+        std = self._normalize_optional(dep.std)
+        channel_swap = self._normalize_optional(dep.channel_swap)
+        command = self._add_optional_argument_to_cmd_line(command, '--mean', mean)
+        command = self._add_optional_argument_to_cmd_line(command, '--std', std)
+        command = self._add_optional_argument_to_cmd_line(command, '--channel_swap', channel_swap)
+
+        target_backend = self._normalize_optional(dep.target_backend) or 'llvm-cpu'
+        command = self._add_optional_argument_to_cmd_line(command, '-tb', target_backend)
+
+        opt_level = self._normalize_optional(dep.opt_level) or '2'
+        command = self._add_optional_argument_to_cmd_line(command, '--opt_level', opt_level)
+
+        onnx_opset = self._normalize_optional(dep.onnx_opset_version)
+        command = self._add_optional_argument_to_cmd_line(command, '--onnx_opset_version', onnx_opset)
+
+        if indep.raw_output:
+            command = self._add_argument_to_cmd_line(command, '--raw_output', indep.raw_output)
+
+        extra_compile_args = self._normalize_optional(dep.extra_compile_args)
+
+        if extra_compile_args:
+            command = f'{command} --extra_compile_args {extra_compile_args}'
+
+        return command.strip()
+
+    @staticmethod
+    def _normalize_optional(value):
+        if value is None:
+            return None
+        string_value = str(value).strip()
+        if not string_value or string_value.lower() == 'none':
+            return None
+        return string_value
+
+    @staticmethod
+    def _parameter_is_true(value):
+        if value is None:
+            return False
+        return str(value).strip().lower() in ['true', '1', 'yes']
+
+    @staticmethod
+    def _get_source_framework(value):
+        normalized_value = IREEProcess._normalize_optional(value)
+        if not normalized_value:
+            return None
+        normalized_value = normalized_value.lower()
+        allowed_frameworks = {'onnx', 'pytorch'}
+        if normalized_value in allowed_frameworks:
+            return normalized_value
+        return None
+
+    @staticmethod
+    def _resolve_task_type(model):
+        candidate = getattr(model, 'task', None)
+        normalized_candidate = IREEProcess._normalize_optional(candidate)
+        if not normalized_candidate:
+            return None
+        normalized_candidate = normalized_candidate.lower()
+        allowed_tasks = {'feedforward', 'classification'}
+        if normalized_candidate in allowed_tasks:
+            return normalized_candidate
+        return None
+
diff --git a/src/benchmark/frameworks/iree/iree_wrapper.py b/src/benchmark/frameworks/iree/iree_wrapper.py
new file mode 100644
index 000000000..f0366918d
--- /dev/null
+++ b/src/benchmark/frameworks/iree/iree_wrapper.py
@@ -0,0 +1,17 @@
+from ..config_parser.test_reporter import Test
+from ..framework_wrapper import FrameworkWrapper
+from ..known_frameworks import KnownFrameworks
+from .iree_process import IREEProcess
+
+
+class IREEWrapper(FrameworkWrapper):
+    framework_name = KnownFrameworks.iree
+
+    @staticmethod
+    def create_process(test, executor, log, **kwargs):
+        return IREEProcess.create_process(test, executor, log)
+
+    @staticmethod
+    def create_test(model, dataset, indep_parameters, dep_parameters):
+        return Test(model, dataset, indep_parameters, dep_parameters)
+
diff --git a/src/benchmark/frameworks/known_frameworks.py b/src/benchmark/frameworks/known_frameworks.py
index 17773a410..34a11a4ce 100644
--- a/src/benchmark/frameworks/known_frameworks.py
+++ b/src/benchmark/frameworks/known_frameworks.py
@@ -19,3 +19,4 @@ class KnownFrameworks:
     ncnn = 'ncnn'
     executorch_cpp = 'ExecuTorch Cpp'
     executorch = 'ExecuTorch'
+    iree = 'IREE'
diff --git a/src/benchmark/tests/test_processes.py b/src/benchmark/tests/test_processes.py
index 2d86e5f20..ec493ff6a 100644
--- a/src/benchmark/tests/test_processes.py
+++ b/src/benchmark/tests/test_processes.py
@@ -21,6 +21,7 @@
 from src.benchmark.frameworks.tensorflow.tensorflow_process import TensorFlowProcess
 from src.benchmark.frameworks.tensorflow_lite.tensorflow_lite_process import TensorFlowLiteProcess
 from src.benchmark.tests.test_executor import get_host_executor
+from src.benchmark.frameworks.iree.iree_process import IREEProcess
 
 log.basicConfig(
     format='[ %(levelname)s ] %(message)s',
@@ -70,6 +71,7 @@ class DotDict(dict):
                                                  ['OpenCV DNN Python', OpenCVDNNPythonProcess],
                                                  ['ONNX Runtime Python', ONNXRuntimePythonProcess],
                                                  ['TVM', TVMProcess],
+                                                 ['IREE', IREEProcess],
                                                  ])
 @pytest.mark.parametrize('complex_test', [['sync', 'handwritten', None, SyncOpenVINOProcess],
                                           ['async', 'handwritten', None, AsyncOpenVINOProcess],
diff --git a/src/configs/README.md b/src/configs/README.md
index 9f27ab4ba..068db32c7 100644
--- a/src/configs/README.md
+++ b/src/configs/README.md
@@ -360,6 +360,21 @@
   - `Framework` - тег, обязательный для заполнения. Определяет фреймворк, модели которого будут
     запущены средствами Apache TVM. По умолчанию задается фреймворк `TVM`.
 
+- Набор тегов для тестирования вывода средствами IREE:
+
+  - `FunctionName` - тег, обязательный для заполнения. Определяет имя функции в IREE-модуле, которое будет вызвано.
+  - `InputShape` - тег, обязательный для заполнения. Определяет размеры входного тензора в формате `B C H W`.
+  - `Layout` - тег, необязательный для заполнения. Определяет расположение каналов входного тензора (`NCHW` по умолчанию).
+  - `Normalize` - тег, необязательный для заполнения. Определяет необходимость нормализации входного изображения с помощью параметров `Mean` и `Std`.
+  - `Mean` - тег, необязательный для заполнения. Определяет средние значения, которые будут вычитаться из каждого канала входного изображения.
+  - `Std` - тег, необязательный для заполнения. Определяет коэффициенты масштабирования для каждого канала входного изображения.
+  - `ChannelSwap` - тег, необязательный для заполнения. Определяет изменение порядка каналов на входном изображении.
+  - `TargetBackend` - тег, необязательный для заполнения. Целевой backend компиляции IREE (`llvm-cpu` по умолчанию).
+  - `OptimizationLevel` - тег, необязательный для заполнения. Определяет уровень оптимизаций при компиляции (`2` по умолчанию).
+  - `OnnxOpsetVersion` - тег, необязательный для заполнения. Указывает версию opset при конвертации ONNX-моделей.
+  - `ExtraCompileArgs` - тег, необязательный для заполнения. Дополнительные аргументы компиляции IREE; перечисляются через пробел и будут добавлены в конец командной строки.
+  - Для PyTorch моделей также возможно использование тега `<Module>` внутри секции `<Model>`, чтобы указать путь к модулю с архитектурой (значение будет проброшено в параметр `--torch_module` скрипта инференса).
+
 ### Примеры заполнения
 
 #### Пример заполнения конфигурации для измерения производительности вывода средствами Intel Distribution of OpenVINO Toolkit
@@ -773,6 +788,47 @@
 </Test>
 ```
 
+#### Пример заполнения конфигурации для измерения производительности вывода средствами IREE
+
+```xml
+<?xml version="1.0" encoding="utf-8" ?>
+<Test>
+    <Model>
+        <Task>classification</Task>
+        <Name>resnet50</Name>
+        <Precision>FP32</Precision>
+        <SourceFramework>onnx</SourceFramework>
+        <ModelPath>/home/user/models/resnet50/resnet50.onnx</ModelPath>
+        <WeightsPath></WeightsPath>
+        <Module></Module>         <!-- Тег для загрузки PyTorch моделей напрямую из модуля, например torchvision.models -->
+    </Model>
+    <Dataset>
+        <Name>ImageNet</Name>
+        <Path>/mnt/datasets/ILSVRC2012_img_val</Path>
+    </Dataset>
+    <FrameworkIndependent>
+        <InferenceFramework>IREE</InferenceFramework>
+        <BatchSize>1</BatchSize>
+        <Device>CPU</Device>
+        <IterationCount>20</IterationCount>
+        <TestTimeLimit>60</TestTimeLimit>
+    </FrameworkIndependent>
+    <FrameworkDependent>
+        <FunctionName>main</FunctionName>
+        <InputShape>1 3 224 224</InputShape>
+        <Layout>NCHW</Layout>
+        <Normalize>True</Normalize>
+        <Mean>0.485 0.456 0.406</Mean>
+        <Std>0.229 0.224 0.225</Std>
+        <ChannelSwap>2 1 0</ChannelSwap>
+        <TargetBackend>llvm-cpu</TargetBackend>
+        <OptimizationLevel>3</OptimizationLevel>
+        <OnnxOpsetVersion>17</OnnxOpsetVersion>
+        <ExtraCompileArgs>--iree-llvmcpu-target-cpu-features=host</ExtraCompileArgs>
+    </FrameworkDependent>
+</Test>
+```
+
 #### Пример заполнения конфигурации для измерения производительности вывода средствами RKNN C++ API
 
 ```xml
diff --git a/src/inference/README.md b/src/inference/README.md
index e5644288c..547cf8638 100644
--- a/src/inference/README.md
+++ b/src/inference/README.md
@@ -1485,75 +1485,117 @@ python inference_ncnn.py --model <model_name> \
 
 ## Вывод глубоких моделей с использованием IREE
 
-#### Аргументы командной строки
-
-Название скрипта:
+#### Скрипт
 
 ```bash
 inference_iree.py
 ```
 
-Обязательные аргументы:
+#### Общие обязательные аргументы
 
-- `-m / --model` - путь до vmfb-файла, содержащего скомпилированную модель.
-- `-fn / --function_name` - название функции, которая будет вызвана IREE для исполнения модели.
+- `-fn / --function_name` - имя функции внутри IREE-модуля, которое будет вызвано при инференсе.
 - `-i / --input` - путь до изображения или директории с изображениями
   (расширения файлов `.jpg`, `.png`, `.bmp` и т.д.).
 - `-is / --input_shape` - размеры входного тензора сети в формате
-  BxCxWxH, B - размер пачки, C - количество каналов изображений,
-  W - ширина изображений, H - высота изображений.
+  BxCxHxW, B - размер пачки, C - количество каналов изображений,
+  H - высота изображений, W - ширина изображений.
 
-Опциональные аргументы:
+#### Остальные параметры зависят от того, в каком формате модель подается на вход.
+
+
+- **Готовый IREE-модуль (`.vmfb` или `.mlir`)**
+  - `-m / --model` - путь до модели в формате `.vmfb` (готовый бинарник) или `.mlir` (будет скомпилирован перед запуском), обязателен.
+  - `-tb / --target_backend` - целевой backend для компиляции и исполнения (`llvm-cpu`, `cuda`, `vulkan`, `metal`, `rocm`, `vmvx` и т.д.). По умолчанию `llvm-cpu`. Обязателен, если модель в формате `.mlir`.
+
+- **ONNX-модель**
+  - `--source_framework onnx` - фреймворк, из которого будет загружена модель. Обязателен.
+  - `-m / --model` - путь до модели в формате `.onnx`, обязателен.
+  - `--onnx_opset_version` - версия ONNX-opset (по умолчанию `18`).
+  - `-tb / --target_backend` - целевой backend для компиляции и исполнения (`llvm-cpu`, `cuda`, `vulkan`, `metal`, `rocm`, `vmvx` и т.д.). По умолчанию `llvm-cpu`. Обязателен.
+
+- **PyTorch-модель из файла**
+  - `--source_framework pytorch` - фреймворк, из которого будет загружена модель, обязателен.
+  - `-m / --model` - путь до модели в формате `.pt`, обязателен.
+  - `-w / --weights` - путь до файла с весами модели в формате `.pth`, опционален.
+  - `-tb / --target_backend` - целевой backend для компиляции и исполнения (`llvm-cpu`, `cuda`, `vulkan`, `metal`, `rocm`, `vmvx` и т.д.). По умолчанию `llvm-cpu`. Обязателен.
+
+- **PyTorch-модель из модуля**
+  - `--source_framework pytorch` - фреймворк, из которого будет загружена модель, обязателен.
+  - `-tm / --torch_module` - 
+  - `-mn / --model_name` - 
+  - `-w / --weights` - путь до файла с весами модели в формате `.pth`, опционален.
+  - `-tb / --target_backend` - целевой backend для компиляции и исполнения (`llvm-cpu`, `cuda`, `vulkan`, `metal`, `rocm`, `vmvx` и т.д.). По умолчанию `llvm-cpu`. Обязателен.
+
+#### Опциональные аргументы
 
 - `-b / --batch_size` - количество изображений, которые будут обработаны
-  за один проход сети. По умолчанию равно `1`.
-- `-ni / --number_iter` - количество прямых проходов по сети.
-  По умолчанию выполняется один проход по сети.
-- `--time` - время выполнения инференса в секундах. Этот параметр можно 
-  задать вместо задать вместо параметра `-ni / --number_iter`. Если 
-  одновременно указать и `-ni / --number_iter` и `--time`,
-  то будет учитываться тот параметр, при котором инферес работает дольше.
-- `--layout` - формат входных тензоров. По умолчанию `NHWС`.
-- `--channel_swap` - порядок перестановки цветовых каналов изображения.
-  Загрузка изображений осуществляется в формате BGR (порядок
-  соответствует `(0, 1, 2)`), а большинство нейронных сетей принимают
-  на вход изображения в формате RGB, поэтому по умолчанию порядок
-  `(2, 1, 0)`.
-- `--norm` - флаг необходимости нормировки изображений.
-  Среднее и среднеквадратическое отклонение, которые принимаются
-  на вход указываются в следующих двух аргументах.
-- `--mean` - среднее значение интенсивности, которое вычитается
-  из изображений в процессе нормировки. По умолчанию
-  данный параметр принимает значение `0 0 0`.
-- `--std` - среднеквадратическое отклонение интенсивности, на которое
-  делится значение интенсивности каждого пикселя входного изображения
-  в процессе нормировки. По умолчанию данный параметр принимает значение `1 1 1`.
+  за один проход сети. По умолчанию равно `1`. Значение данного параметра
+  должно быть равно значению B из параметра `input_shape`.
 - `-t / --task` - название задачи. Текущая реализация поддерживает
   решение задачи классификации (`classification`). По умолчанию принимает значение `feedforward`.
-- `-nt / --number_top` - количество лучших результатов, выводимых
-  при решении задачи классификации. По умолчанию выводится `10` наилучших
-  результатов.
 - `-l / --labels`- путь до файла в формате JSON с перечнем меток
-  при решении задачи. По умолчанию принимает значение
+  при решении задачи классификации. По умолчанию принимает значение
   `image_net_labels.json`, что соответствует меткам набора данных
   ImageNet.
-- `-d / --device` - оборудование, на котором выполняется вывод сети.
-  Поддерживается вывод на CPU (значение параметра `CPU`). По умолчанию принимает значение `CPU`.
+- `-nt / --number_top` - количество лучших результатов, выводимых при решении задачи классификации. По умолчанию выводится `5` наилучших
+  результатов.
+- `-ni / --number_iter` - количество прямых проходов по сети.
+  По умолчанию выполняется `1` проход по сети.
 - `--raw_output` - работа скрипта без логов. По умолчанию не установлен.
-- `--report_path` - путь до файла с отчетом в формате `.json`.
-
+- `--time` – ограничение по времени в секундах. Если заданы одновременно `--time` и `-ni`, выполняется тот сценарий, который дольше.
+- `--report_path` – путь к `.json`-отчёту (по умолчанию `src/inference/iree_inference_report.json`).
+- `--layout` – формат входного тензора (`NHWC` или `NCHW`, по умолчанию `NCHW`).
+- `--norm` – флаг нормализации изображения (делит значения на `255` перед дальнейшей обработкой).
+- `--mean`, `--std`, `--channel_swap` – параметры препроцессинга. Значения по умолчанию: `mean=[0, 0, 0]`, `std=[1, 1, 1]`, `channel_swap=[2, 1, 0]`.
+- `--opt_level` – уровень оптимизаций, если перед началом вывода потребуется компиляция модели (`0–3`, по умолчанию `2`).
+- `--extra_compile_args` – дополнительные флаги компиляции (должны указываться строго в конце командной строки).
+  ```
+  --extra_compile_args --iree-llvmcpu-target-cpu=cascadelake --iree-llvmcpu-target-triple=x86_64-linux-gnu
+  ```
 
 #### Примеры запуска
 
-**Командная строка для решения задачи классификации изображений**
+**Готовый `.vmfb`**
 
 ```bash
 python3 inference_iree.py \
-    -t classification -i <path_to_image>/<image_name> \
-    -m <path_to_model>/<model_name>.vmfb \
-    --function_name main_graph \
-    --input_shape 1 3 224 224 \ 
-    --labels <path_to_labels>/image_net_synset.txt
+    -m compiled/resnet50.vmfb \
+    -fn main \
+    -i ./data/images \
+    -is 1 3 224 224 \
+    -b 1 -ni 100 \
+    -t classification \
+    -l ./labels/imagenet_synset.txt
+```
+
+**Автоконвертация ONNX -> MLIR -> VMFB**
+
+```bash
+python3 inference_iree.py \
+    --source_framework onnx \
+    -m ./models/efficientnet-b0.onnx \
+    --onnx_opset_version 18 \
+    -fn main \
+    -i ./data/test.jpg \
+    -is 1 3 224 224 \
+    -tb llvm-cpu \
+    --opt_level 3 \
+    --extra_compile_args --iree-vulkan-target-triple=rdna2-pc-linux-gnu
+```
+
+** Автоконвертация Pytorch модели из `torchvision`**
+
+```bash
+python3 inference_iree.py \
+    --source_framework pytorch \
+    -mn resnet50 \
+    -tm torchvision.models \
+    -fn classification \
+    -i ./data/images \
+    -is 1 3 224 224 \
+    -tb llvm-cpu \
+    --mean 123.68 116.78 103.94 \
+    --std 58.40 57.12 57.38
 ```
 
 Результат выполнения: набор наиболее вероятных классов, которым принадлежит
diff --git a/src/inference/inference_iree.py b/src/inference/inference_iree.py
index 6163c1f2e..7ba741b6d 100644
--- a/src/inference/inference_iree.py
+++ b/src/inference/inference_iree.py
@@ -68,10 +68,10 @@ def cli_argument_parser():
                         nargs='+',
                         dest='input')
     parser.add_argument('-is', '--input_shape',
-                        help='Input shape BxHxWxC, B is a batch size,'
+                        help='Input shape BxCxHxW, B is a batch size,'
+                             'C is an input tensor number of channels,'
                              'H is an input tensor height,'
-                             'W is an input tensor width,'
-                             'C is an input tensor number of channels.',
+                             'W is an input tensor width.',
                         required=True,
                         type=int,
                         nargs=4,
@@ -120,7 +120,7 @@ def cli_argument_parser():
                         dest='report_path')
     parser.add_argument('--layout',
                         help='Input layout.',
-                        default='NHWC',
+                        default='NCHW',
                         choices=['NHWC', 'NCHW'],
                         type=str,
                         dest='layout')
@@ -206,7 +206,7 @@ def infer_slice(inference_func, slice_input):
     config = ireert.Config('local-task')
     device = config.device
 
-    input_buffers = ()
+    input_buffers = []
     for input_ in slice_input:
         input_buffers.append(ireert.asdevicearray(device, input_))
 
diff --git a/src/inference/io_adapter.py b/src/inference/io_adapter.py
index f3a71d486..010a27748 100644
--- a/src/inference/io_adapter.py
+++ b/src/inference/io_adapter.py
@@ -187,7 +187,7 @@ def get_slice_input(self, *args, **kwargs):
         return slice_input
 
     def get_slice_input_iree(self, *args, **kwargs):
-        slice_input = ()
+        slice_input = []
         for key in self._transformed_input:
             data_gen = self._transformed_input[key]
             slice_data = [copy.deepcopy(next(data_gen)) for _ in range(self._batch_size)]
diff --git a/src/inference/iree_auxiliary.py b/src/inference/iree_auxiliary.py
index 49330a494..6822936ab 100644
--- a/src/inference/iree_auxiliary.py
+++ b/src/inference/iree_auxiliary.py
@@ -23,18 +23,32 @@
     sys.exit(1)
 
 
-def _validate_onnx_args(args):
+def _validate_iree_model_args(args):
     if not args.model:
-        raise ValueError('Model path (-m/--model) is required for ONNX framework')
+        raise ValueError('Model path (-m/--model) is required')
+    if not os.path.exists(args.model):
+        raise FileNotFoundError(f'The file not found: {args.model}')
+
+    file_type = args.model.split('.')[-1].lower()
+    supported_extensions = ['mlir', 'vmfb']
+    if file_type not in supported_extensions:
+        raise ValueError(f'Model must be an {supported_extensions} file')
+    if file_type == 'mlir' and not args.target_backend:
+        raise ValueError('target_backend is required when using .mlir model')
 
-    if not args.model.endswith('.onnx'):
-        raise ValueError('For ONNX framework, model must be an .onnx file')
 
+def _validate_onnx_args(args):
+    if not args.model:
+        raise ValueError('Model path (-m/--model) is required for ONNX framework')
     if not os.path.exists(args.model):
         raise FileNotFoundError(f'Model file not found: {args.model}')
 
-    if not args.onnx_opset_version:
-        raise ValueError('onnx_opset_version is required for ONNX framework')
+    file_type = args.model.split('.')[-1]
+    if file_type == 'onnx':
+        if not args.onnx_opset_version:
+            raise ValueError('onnx_opset_version is required for ONNX framework')
+    else:
+        _validate_iree_model_args(args)
 
 
 def _validate_pytorch_args(args):
@@ -44,7 +58,7 @@ def _validate_pytorch_args(args):
 
     if not has_model_path and not has_module_model:
         raise ValueError(
-            'For PyTorch conversion, you must specify either model_path (.pt file), '
+            'For PyTorch conversion, you must specify either model_path, '
             'or torch_module and model_name',
         )
 
@@ -59,55 +73,21 @@ def _validate_pytorch_args(args):
             raise FileNotFoundError(f'Model file not found: {args.model}')
 
         file_type = args.model.split('.')[-1]
-        supported_extensions = ['pt']
-        if file_type not in supported_extensions:
-            raise ValueError(f'The file type {file_type} is not supported.'
-                             f'Supported: {", ".join(supported_extensions)}')
+        if file_type != 'pt':
+            _validate_iree_model_args(args)
+    else:
+        if not args.target_backend:
+            raise ValueError(f'target_backend is required when using conversion from torch module')
 
     if args.model_weights and args.model_weights != '' and not os.path.exists(args.model_weights):
         raise FileNotFoundError(f'Model weights not found: {args.model_weights}')
 
 
-def _validate_conversion_model_args(args):
-    if not args.target_backend:
-        raise ValueError(f'target_backend is required when using conversion from {args.source_framework} model')
+def validate_cli_args(args):
     if args.source_framework == 'onnx':
         _validate_onnx_args(args)
     elif args.source_framework == 'pytorch':
         _validate_pytorch_args(args)
-
-
-def _validate_mlir_args(args):
-    if not args.target_backend:
-        raise ValueError('target_backend is required when using .mlir model')
-
-    if not os.path.exists(args.model):
-        raise FileNotFoundError(f'MLIR file not found: {args.model}')
-
-
-def _validate_vmfb_args(args):
-    if not os.path.exists(args.model):
-        raise FileNotFoundError(f'VMFB file not found: {args.model}')
-
-
-def _validate_iree_model_args(args):
-    if not args.model:
-        raise ValueError('Model path (-m/--model) is required when source_framework is not specified')
-
-    file_ext = args.model.split('.')[-1].lower()
-
-    if file_ext == 'mlir':
-        _validate_mlir_args(args)
-    elif file_ext == 'vmfb':
-        _validate_vmfb_args(args)
-    else:
-        supported_formats = ['.onnx', '.pt', '.mlir', '.vmfb']
-        raise ValueError(f'Unsupported model format: {args.model}. Supported formats: {", ".join(supported_formats)}')
-
-
-def validate_cli_args(args):
-    if args.source_framework:
-        _validate_conversion_model_args(args)
     else:
         _validate_iree_model_args(args)
 
diff --git a/src/inference/transformer.py b/src/inference/transformer.py
index eb9301963..42a27eaaf 100644
--- a/src/inference/transformer.py
+++ b/src/inference/transformer.py
@@ -402,10 +402,10 @@ def __set_std(self, image):
         return image
 
     def __set_layout(self, image):
-        layout = self._converting.get('layout', 'NHWC')
-        if layout == 'NCHW':
-            # HWC to CHW
-            image = image.transpose(2, 0, 1)
+        layout = self._converting['layout']
+        if layout is not None:
+            layout = LAYER_LAYOUT_TO_IMAGE[layout]
+            image = np.expand_dims(image, 0).transpose(layout)
         return image
 
     def __bgr_to_rgb(self, image):
diff --git a/src/model_converters/README.md b/src/model_converters/README.md
index 7d7dea499..28679735c 100644
--- a/src/model_converters/README.md
+++ b/src/model_converters/README.md
@@ -16,6 +16,7 @@
   format from TensorFlow and ONNX formats.
 - `tvm_converter` contains converter and compiler
   to the TVM format.
+- `iree_converter` contains tools to convert ONNX or PyTorch models to IREE MLIR and compile them to VMFB binaries.
 
 ## An overview of existing model converters
 
diff --git a/src/model_converters/iree_converter/README.md b/src/model_converters/iree_converter/README.md
index 1605f60f8..604265df5 100644
--- a/src/model_converters/iree_converter/README.md
+++ b/src/model_converters/iree_converter/README.md
@@ -26,23 +26,25 @@ This script converts model from `<source_framework>` to the IREE MLIR format.
 - `-m / --model` is a path to an `.onnx` or `.pt` file with a trained model.
 - `-w / --weights` is a path to an `.pth` file with trained weights for PyTorch models.
 - `-tm / --torch_module` is a module with the model architecture for PyTorch models. Default: `torchvision.models`.
-- `-is / --input_shape` is an input shape in the format BxWxHxC, where B is a batch size, W is an input tensor width, H is an input tensor height, C is an input tensor number of channels. Required for PyTorch models.
+- `-is / --input_shape` is an input shape in the format BxHxWxC, where B is a batch size, H is an input tensor height, W is an input tensor width, C is an input tensor number of channels. Required for PyTorch models.
 - `--onnx_opset_version` is an ONNX opset version for ONNX models. Default: `18`.
 - `-o / --output_mlir` is a path to save the MLIR file. Required.
 
 ### Parameter combinations
 #### For ONNX models:
 - Required: `--source_framework onnx`, `--model <path/to/model.onnx>`, `--output_mlir <output_path>`
-- Optional: `--onnx_opset_version` (default: 18)
+- Optional: `--onnx_opset_version` (default: 18; the converter validates that the value is set, so keep the default or override it explicitly)
 #### For PyTorch models:
 Two loading methods are supported (mutually exclusive):
 1. From file:
-- Required: `--source_framework pytorch`, `--model <path/to/model.pt>`, `--input_shape B W H C`, `--output_mlir <output_path>`
-- Optional: `--weights <path/to/weights.pth>`
+- Required: `--source_framework pytorch`, `--model <path/to/model.pt>`, `--input_shape B H W C`, `--output_mlir <output_path>`
+- Optional: `--model_name <name>` (used only for logging), `--weights <path/to/weights.pth>`
 1. From module:
-- Required: `--source_framework pytorch`, `--model_name <model_name>`, `--torch_module <module>`, `--input_shape B W H C`, `--output_mlir <output_path>`
+- Required: `--source_framework pytorch`, `--model_name <model_name>`, `--torch_module <module>`, `--input_shape B H W C`, `--output_mlir <output_path>`
 - Optional: `--weights <path/to/weights.pth>`
 
+> **Note:** `--model` and the pair `(--torch_module`, `--model_name)` are mutually exclusive. Passing both at the same time will raise a validation error (`converter.py` enforces the rule). Likewise, `--input_shape` is only validated for PyTorch conversions, so you can omit it for ONNX.
+
 ### Examples of usage
 ONNX model conversion ([source of the model efficientnet-b0.onnx](https://github.com/onnx/models/blob/main/Computer_Vision/efficientnet_b0_Opset17_timm/efficientnet_b0_Opset17.onnx)):
 ```sh
diff --git a/src/model_converters/iree_converter/iree_auxiliary/compiler.py b/src/model_converters/iree_converter/iree_auxiliary/compiler.py
index 8a17d861f..3792a6abd 100644
--- a/src/model_converters/iree_converter/iree_auxiliary/compiler.py
+++ b/src/model_converters/iree_converter/iree_auxiliary/compiler.py
@@ -5,8 +5,6 @@
 class IREECompiler:
     @staticmethod
     def compile_model(mlir, target, opt_level, extra_args, output_file=None):
-        if output_file and not os.path.exists(output_file):
-            os.mkdir(output_file)
         extra_args.append(f'--iree-opt-level=O{opt_level}')
         compile_func = compile_file if os.path.isfile(mlir) else compile_str
         return compile_func(mlir, target_backends=[target], extra_args=extra_args, output_file=output_file)
diff --git a/src/model_converters/iree_converter/iree_auxiliary/onnx_format.py b/src/model_converters/iree_converter/iree_auxiliary/onnx_format.py
index 0e81ae2ef..0de82c784 100644
--- a/src/model_converters/iree_converter/iree_auxiliary/onnx_format.py
+++ b/src/model_converters/iree_converter/iree_auxiliary/onnx_format.py
@@ -25,8 +25,6 @@ def _validate_arguments(self):
             raise ValueError('The onnx_opset_version parameter is required for ONNX conversion.')
 
     def _convert_model_from_framework(self):
-        if not os.path.exists(self.output_mlir):
-            os.mkdir(self.output_mlir)
         import_args = [
             'iree-import-onnx',
             self.model_path,
diff --git a/src/model_converters/iree_converter/iree_auxiliary/pytorch_format.py b/src/model_converters/iree_converter/iree_auxiliary/pytorch_format.py
index 9f9b7cce6..787fef036 100644
--- a/src/model_converters/iree_converter/iree_auxiliary/pytorch_format.py
+++ b/src/model_converters/iree_converter/iree_auxiliary/pytorch_format.py
@@ -82,7 +82,5 @@ def _convert_model_from_framework(self):
             model = self.__get_model_from_path()
         example_arg = self.torch.randn(*self.input_shape)
         export_output = self.aot.export(model, example_arg)
-        if not os.path.exists(self.output_mlir):
-            os.mkdir(self.output_mlir)
         export_output.save_mlir(self.output_mlir)
         return
diff --git a/src/model_converters/iree_converter/iree_converter.py b/src/model_converters/iree_converter/iree_converter.py
index f6472eb81..60ac06795 100644
--- a/src/model_converters/iree_converter/iree_converter.py
+++ b/src/model_converters/iree_converter/iree_converter.py
@@ -43,10 +43,10 @@ def cli_argument_parser():
                         default=18,
                         dest='onnx_opset_version')
     parser.add_argument('-is', '--input_shape',
-                        help='Input shape BxWxHxC, B is a batch size,'
-                             'W is an input tensor width,'
+                        help='Input shape BxCxHxW, B is a batch size,'
+                             'C is an input tensor number of channels,'
                              'H is an input tensor height,'
-                             'C is an input tensor number of channels.',
+                             'W is an input tensor width.',
                         type=int,
                         nargs=4,
                         dest='input_shape')

From 99c37f99248fa5b31c802708f185d505ca0942e8 Mon Sep 17 00:00:00 2001
From: Vladislav Denisov <vlad.roix@yandex.ru>
Date: Sat, 22 Nov 2025 18:24:17 +0300
Subject: [PATCH 10/17] IREE dockerfile

---
 docker/IREE/Dockerfile | 19 +++++++++++++++++++
 1 file changed, 19 insertions(+)
 create mode 100644 docker/IREE/Dockerfile

diff --git a/docker/IREE/Dockerfile b/docker/IREE/Dockerfile
new file mode 100644
index 000000000..c9bf64d24
--- /dev/null
+++ b/docker/IREE/Dockerfile
@@ -0,0 +1,19 @@
+FROM ubuntu_for_dli
+
+# Install IREE
+ARG IREE_VERSION=3.8.0
+RUN python3 -m pip install iree-base-compiler==${IREE_VERSION} iree-base-runtime==${IREE_VERSION} iree-turbine==${IREE_VERSION} 
+
+# Install dependencies
+RUN python3 -m pip install opencv-python numpy
+
+# Install onnx for model conversion
+ARG ONNX_VERSION=1.19.1
+RUN python3 -m pip install onnx==${ONNX_VERSION}
+
+# Install torch for model conversion
+ARG TORCH_VERSION=2.9.1
+ARG TORCHVISION_VERSION=0.24.1
+RUN python3 -m pip install torch==${TORCH_VERSION} torchvision==${TORCHVISION_VERSION}
+
+WORKDIR /tmp/

From 70526453d3c0421d93746556507e7c6096ed0cbf Mon Sep 17 00:00:00 2001
From: Vladislav Denisov <vlad.roix@yandex.ru>
Date: Sat, 22 Nov 2025 18:32:48 +0300
Subject: [PATCH 11/17] Fix code-style

---
 src/benchmark/frameworks/iree/iree_parameters_parser.py | 1 -
 src/benchmark/frameworks/iree/iree_process.py           | 5 ++---
 src/benchmark/frameworks/iree/iree_wrapper.py           | 1 -
 src/inference/iree_auxiliary.py                         | 2 +-
 4 files changed, 3 insertions(+), 6 deletions(-)

diff --git a/src/benchmark/frameworks/iree/iree_parameters_parser.py b/src/benchmark/frameworks/iree/iree_parameters_parser.py
index 02a1c5836..b3ed7e03f 100644
--- a/src/benchmark/frameworks/iree/iree_parameters_parser.py
+++ b/src/benchmark/frameworks/iree/iree_parameters_parser.py
@@ -82,4 +82,3 @@ def __init__(self, function_name, input_shape, layout, normalize, mean, std, cha
             self.onnx_opset_version = onnx_opset_version
         if self._parameter_is_not_none(extra_compile_args):
             self.extra_compile_args = extra_compile_args
-
diff --git a/src/benchmark/frameworks/iree/iree_process.py b/src/benchmark/frameworks/iree/iree_process.py
index 753f41cac..7f0456c59 100644
--- a/src/benchmark/frameworks/iree/iree_process.py
+++ b/src/benchmark/frameworks/iree/iree_process.py
@@ -32,8 +32,8 @@ def _compose_arguments(self):
         model_path = self._normalize_optional(model.model)
         weights_path = self._normalize_optional(model.weight)
 
-        command = f'-fn {dep.function_name} -is {dep.input_shape} -ni {indep.iteration} ' \
-                  f'--report_path {self.report_path}'
+        command = (f'-fn {dep.function_name} -is {dep.input_shape} -ni {indep.iteration} '
+                   f'--report_path {self.report_path}')
 
         command = self._add_optional_argument_to_cmd_line(command, '-mn', model.name)
 
@@ -122,4 +122,3 @@ def _resolve_task_type(model):
         if normalized_candidate in allowed_tasks:
             return normalized_candidate
         return None
-
diff --git a/src/benchmark/frameworks/iree/iree_wrapper.py b/src/benchmark/frameworks/iree/iree_wrapper.py
index f0366918d..355f484d3 100644
--- a/src/benchmark/frameworks/iree/iree_wrapper.py
+++ b/src/benchmark/frameworks/iree/iree_wrapper.py
@@ -14,4 +14,3 @@ def create_process(test, executor, log, **kwargs):
     @staticmethod
     def create_test(model, dataset, indep_parameters, dep_parameters):
         return Test(model, dataset, indep_parameters, dep_parameters)
-
diff --git a/src/inference/iree_auxiliary.py b/src/inference/iree_auxiliary.py
index 6822936ab..65babca53 100644
--- a/src/inference/iree_auxiliary.py
+++ b/src/inference/iree_auxiliary.py
@@ -77,7 +77,7 @@ def _validate_pytorch_args(args):
             _validate_iree_model_args(args)
     else:
         if not args.target_backend:
-            raise ValueError(f'target_backend is required when using conversion from torch module')
+            raise ValueError('target_backend is required when using conversion from torch module')
 
     if args.model_weights and args.model_weights != '' and not os.path.exists(args.model_weights):
         raise FileNotFoundError(f'Model weights not found: {args.model_weights}')

From 87ed5f3c2b9283f05fe2e86274c07dc41c9a613c Mon Sep 17 00:00:00 2001
From: Vladislav Denisov <vlad.roix@yandex.ru>
Date: Wed, 26 Nov 2025 17:44:24 +0300
Subject: [PATCH 12/17] Fix paddlepaddle version

---
 requirements_frameworks.txt | 2 +-
 1 file changed, 1 insertion(+), 1 deletion(-)

diff --git a/requirements_frameworks.txt b/requirements_frameworks.txt
index 7c24a9276..2a24c1e0c 100644
--- a/requirements_frameworks.txt
+++ b/requirements_frameworks.txt
@@ -18,7 +18,7 @@ dglgo==0.0.2
 tflite
 
 paddleslim==2.6.0
-paddlepaddle==2.6.0
+paddlepaddle==2.6.2
 --extra-index-url https://mirror.baidu.com/pypi/simple
 
 ncnn

From 03dc82c9d3e3cf407b0ff8bbe7baf5cdb9dc8d0e Mon Sep 17 00:00:00 2001
From: Vladislav Denisov <vlad.roix@yandex.ru>
Date: Wed, 26 Nov 2025 17:46:37 +0300
Subject: [PATCH 13/17] Updated README for IREE

---
 README.md               |  3 +++
 src/inference/README.md | 30 +++++++++++++++---------------
 2 files changed, 18 insertions(+), 15 deletions(-)

diff --git a/README.md b/README.md
index e9ef49bd7..e41870c45 100644
--- a/README.md
+++ b/README.md
@@ -33,6 +33,7 @@ DLI supports inference using the following frameworks:
 - [ncnn][ncnn] (Python API).
 - [PaddlePaddle][PaddlePaddle] (Python API).
 - [ExecuTorch][executorch] (C++ and Python APIs)
+- [IREE][iree] (Python API)
 
 More information about DLI is available on the web-site
 ([here][dli-ru-web-page] (in Russian)
@@ -105,6 +106,7 @@ Please consider citing the following papers.
     for TensorFlow.
   - `TensorFlowLite` is a directory of Dockerfiles for TensorFlow Lite.
   - `TVM` is a directory of Dockerfiles for Apache TVM.
+  - `IREE` is a directory of Dockerfiles for IREE. 
 
 - `docs` directory contains auxiliary documentation. Please, find
   complete documentation at the [Wiki page][dli-wiki].
@@ -282,6 +284,7 @@ Report questions, issues and suggestions, using:
 [ncnn]: https://github.com/Tencent/ncnn
 [PaddlePaddle]: https://www.paddlepaddle.org.cn/en
 [executorch]: https://pytorch.org/executorch-overview
+[iree]: https://iree.dev
 [benchmark-app]: https://github.com/openvinotoolkit/openvino/tree/master/samples/cpp/benchmark_app
 [dli-ru-web-page]: http://hpc-education.unn.ru/dli-ru
 [dli-web-page]: http://hpc-education.unn.ru/dli
diff --git a/src/inference/README.md b/src/inference/README.md
index 547cf8638..3157f765c 100644
--- a/src/inference/README.md
+++ b/src/inference/README.md
@@ -1502,29 +1502,29 @@ inference_iree.py
 
 #### Остальные параметры зависят от того, в каком формате модель подается на вход.
 
-
 - **Готовый IREE-модуль (`.vmfb` или `.mlir`)**
-  - `-m / --model` - путь до модели в формате `.vmfb` (готовый бинарник) или `.mlir` (будет скомпилирован перед запуском), обязателен.
-  - `-tb / --target_backend` - целевой backend для компиляции и исполнения (`llvm-cpu`, `cuda`, `vulkan`, `metal`, `rocm`, `vmvx` и т.д.). По умолчанию `llvm-cpu`. Обязателен, если модель в формате `.mlir`.
+  - `-m / --model` - путь до модели в формате `.vmfb` (готовый бинарник) или `.mlir` (будет скомпилирован перед запуском). Обязательный параметр.
+  - `-tb / --target_backend` - целевой backend для компиляции и исполнения (`llvm-cpu`, `cuda`, `vulkan`, `metal`, `rocm`, `vmvx` и т.д.). По умолчанию `llvm-cpu`. Обязательный параметр, если модель в формате `.mlir`.
 
 - **ONNX-модель**
-  - `--source_framework onnx` - фреймворк, из которого будет загружена модель. Обязателен.
-  - `-m / --model` - путь до модели в формате `.onnx`, обязателен.
+  - `--source_framework onnx` - фреймворк, из которого будет загружена модель. Обязательный параметр.
+  - `-m / --model` - путь до модели в формате `.onnx`. Обязательный параметр.
   - `--onnx_opset_version` - версия ONNX-opset (по умолчанию `18`).
-  - `-tb / --target_backend` - целевой backend для компиляции и исполнения (`llvm-cpu`, `cuda`, `vulkan`, `metal`, `rocm`, `vmvx` и т.д.). По умолчанию `llvm-cpu`. Обязателен.
+  - `-tb / --target_backend` - целевой backend для компиляции и исполнения (`llvm-cpu`, `cuda`, `vulkan`, `metal`, `rocm`, `vmvx` и т.д.). По умолчанию `llvm-cpu`. Обязательный параметр.
 
 - **PyTorch-модель из файла**
-  - `--source_framework pytorch` - фреймворк, из которого будет загружена модель, обязателен.
-  - `-m / --model` - путь до модели в формате `.pt`, обязателен.
-  - `-w / --weights` - путь до файла с весами модели в формате `.pth`, опционален.
-  - `-tb / --target_backend` - целевой backend для компиляции и исполнения (`llvm-cpu`, `cuda`, `vulkan`, `metal`, `rocm`, `vmvx` и т.д.). По умолчанию `llvm-cpu`. Обязателен.
+  - `--source_framework pytorch` - фреймворк, из которого будет загружена модель. Обязательный параметр.
+  - `-m / --model` - путь до модели в формате `.pt`. Обязательный параметр.
+  - `-w / --weights` - путь до файла с весами модели в формате `.pth`. Опциональный параметр.
+  - `-tb / --target_backend` - целевой backend для компиляции и исполнения (`llvm-cpu`, `cuda`, `vulkan`, `metal`, `rocm`, `vmvx` и т.д.). По умолчанию `llvm-cpu`. Обязательный параметр.
 
 - **PyTorch-модель из модуля**
-  - `--source_framework pytorch` - фреймворк, из которого будет загружена модель, обязателен.
-  - `-tm / --torch_module` - 
-  - `-mn / --model_name` - 
-  - `-w / --weights` - путь до файла с весами модели в формате `.pth`, опционален.
-  - `-tb / --target_backend` - целевой backend для компиляции и исполнения (`llvm-cpu`, `cuda`, `vulkan`, `metal`, `rocm`, `vmvx` и т.д.). По умолчанию `llvm-cpu`. Обязателен.
+  - `--source_framework pytorch` - фреймворк, из которого будет загружена модель. Обязательный параметр.
+  - `-tm / --torch_module` - путь до Python модуля или относительный путь
+  до Python файла с архитектурой модели (например `torchvision.models` для модуля с [моделями][torchvision_models]). Обязательный параметр.
+  - `-mn / --model_name` - название модели. Обязательный параметр.
+  - `-w / --weights` - путь до файла с весами модели в формате `.pth`. Опциональный параметр.
+  - `-tb / --target_backend` - целевой backend для компиляции и исполнения (`llvm-cpu`, `cuda`, `vulkan`, `metal`, `rocm`, `vmvx` и т.д.). По умолчанию `llvm-cpu`. Обязательный параметр.
 
 #### Опциональные аргументы
 

From 8044518875d1ea3f71749dfb25b210162c23bd62 Mon Sep 17 00:00:00 2001
From: Vladislav Denisov <vlad.roix@yandex.ru>
Date: Wed, 26 Nov 2025 18:49:43 +0300
Subject: [PATCH 14/17] =?UTF-8?q?=D0=A3=D0=BF=D1=80=D0=BE=D1=89=D0=B5?=
 =?UTF-8?q?=D0=BD=20prepare=5Foutput=20=D0=B4=D0=BB=D1=8F=20IREE?=
MIME-Version: 1.0
Content-Type: text/plain; charset=UTF-8
Content-Transfer-Encoding: 8bit

---
 src/inference/iree_auxiliary.py | 17 ++---------------
 1 file changed, 2 insertions(+), 15 deletions(-)

diff --git a/src/inference/iree_auxiliary.py b/src/inference/iree_auxiliary.py
index 65babca53..a508115c3 100644
--- a/src/inference/iree_auxiliary.py
+++ b/src/inference/iree_auxiliary.py
@@ -190,27 +190,14 @@ def prepare_output(result, task):
         if hasattr(result, 'to_host'):
             result = result.to_host()
 
-        # Extract tensor from dict if needed
-        if isinstance(result, dict):
-            result_key = next(iter(result))
-            logits = result[result_key]
-            output_key = result_key
-        else:
-            logits = np.array(result)
-            output_key = 'output'
-
-        # Ensure correct shape (batch_size, num_classes)
-        if logits.ndim == 1:
-            logits = logits.reshape(1, -1)
-        elif logits.ndim > 2:
-            logits = logits.reshape(logits.shape[0], -1)
+        logits = np.array(result)
 
         # Apply softmax
         max_logits = np.max(logits, axis=-1, keepdims=True)
         exp_logits = np.exp(logits - max_logits)
         probabilities = exp_logits / np.sum(exp_logits, axis=-1, keepdims=True)
 
-        return {output_key: probabilities}
+        return {'output': probabilities}
     else:
         raise ValueError(f'Unsupported task {task}')
 

From 59b40d37e4f89272bbd45a285a2a873321f6001b Mon Sep 17 00:00:00 2001
From: Vladislav Denisov <vlad.roix@yandex.ru>
Date: Thu, 27 Nov 2025 12:01:01 +0300
Subject: [PATCH 15/17] IREE version for requirements

---
 requirements_frameworks.txt | 6 +++---
 1 file changed, 3 insertions(+), 3 deletions(-)

diff --git a/requirements_frameworks.txt b/requirements_frameworks.txt
index 2a24c1e0c..2684c5e55 100644
--- a/requirements_frameworks.txt
+++ b/requirements_frameworks.txt
@@ -24,6 +24,6 @@ paddlepaddle==2.6.2
 ncnn
 spektral==1.3.0
 
-iree-base-compiler
-iree-base-runtime
-iree-turbine
\ No newline at end of file
+iree-base-compiler==3.8.0
+iree-base-runtime==3.8.0
+iree-turbine==3.8.0
\ No newline at end of file

From 283b985262859c2ad4f52aaaa302099ed7a9382a Mon Sep 17 00:00:00 2001
From: Vladislav Denisov <vlad.roix@yandex.ru>
Date: Thu, 27 Nov 2025 21:24:03 +0400
Subject: [PATCH 16/17] IREE validation models

---
 README.md                                     |   3 +
 results/validation/validation_results_iree.md | 112 ++++++++++++++++++
 2 files changed, 115 insertions(+)
 create mode 100644 results/validation/validation_results_iree.md

diff --git a/README.md b/README.md
index e41870c45..735178fda 100644
--- a/README.md
+++ b/README.md
@@ -160,6 +160,9 @@ Please consider citing the following papers.
     - [`validation_results_tvm.md`](results/validation/validation_results_tvm.md)
       is a table that confirms correctness of inference implementation
       based on Apache TVM for several public models.
+    - [`validation_results_iree.md`](results/validation/validation_results_iree.md)
+      is a table that confirms correctness of inference implementation
+      based on IREE for several public models.
 
   - [`mxnet_models_checklist.md`](results/mxnet_models_checklist.md) contains a list
     of deep models inferred by MXNet checked in the DLI benchmark.
diff --git a/results/validation/validation_results_iree.md b/results/validation/validation_results_iree.md
new file mode 100644
index 000000000..d4753fb8e
--- /dev/null
+++ b/results/validation/validation_results_iree.md
@@ -0,0 +1,112 @@
+# Validation results for the models inferring using IREE
+
+## Public models
+
+We infer models using the following APIs:
+
+1. IREE, when we load PyTorch models directly from source format.
+
+   ```bash
+   python inference_iree.py -t classification -is 1 3 224 224 \
+                            -mn densenet121 \
+                            -tm torchvision.models \
+                            -f pytorch \
+                            -i data/ \
+                            --norm --mean 0.485 0.456 0.406 --std 0.229 0.224 0.225 \
+                            -l labels/image_net_synset.txt \
+                            --layout NCHW --channel_swap 2 1 0 \
+                            -fn main
+   ```
+
+1. IREE, when we load ONNX models directly from source format.
+
+   ```bash
+   python inference_iree.py -t classification -is 1 3 224 224 \
+                            -mn densenet121 \
+                            -m densenet121.onnx \
+                            -f onnx \
+                            --onnx_opset_version 18 \
+                            -i data/ \
+                            --norm --mean 0.485 0.456 0.406 --std 0.229 0.224 0.225 \
+                            -l labels/image_net_synset.txt \
+                            --layout NCHW --channel_swap 2 1 0 \
+                            -fn main_graph
+   ```
+
+1. PyTorch as source framework for reference.
+
+   ```bash
+   python inference_pytorch.py -t classification -is [1,3,224,224] \
+                               --input_names data \
+                               -mn densenet121 \
+                               -mm torchvision.models \
+                               -i data/ \
+                               --mean [123.675,116.28,103.53] \
+                               --input_scale [58.395,57.12,57.375] \
+                               -l labels/image_net_synset.txt
+   ```
+
+### Notes
+
+1. Models in ONNX format loaded from [onnx/models][onnx-models] repository.
+1. The model `squeezenet1.1` is missed in [onnx/models][onnx-models] repository.
+
+### Image classification
+
+#### Test image #1
+
+Data source: [ImageNet][imagenet]
+
+Image resolution: 709 x 510
+﻿
+<div style='float: center'>
+<img width="150" src="images\ILSVRC2012_val_00000023.JPEG"></img>
+</div>
+
+Model | Source Framework | Python API (source framework) | Python API (IREE, PyTorch) | Python API (IREE, ONNX) |
+-|-|-|-|-|
+densenet-121 | PyTorch | 0.9525911 Granny Smith<br>0.0132309 orange <br>0.0123391 lemon <br>0.0028140 banana <br>0.0020238 piggy bank, penny bank | 0.9523347 Granny Smith<br>0.0132272 orange<br>0.0125170 lemon<br>0.0027910 banana<br>0.0020333 piggy bank, penny bank | 0.9523349 Granny Smith<br>0.0132271 orange<br>0.0125169 lemon<br>0.0027909 banana<br>0.0020333 piggy bank, penny bank |
+efficientnet-b0 | PyTorch | 0.3421609 Granny Smith<br />0.1089311 piggy bank, penny bank <br />0.0693323 teapot <br />0.0249018 vase <br />0.0205339 saltshaker, salt shaker | 0.3421628 Granny Smith<br>0.1089310 piggy bank, penny bank<br>0.0693315 teapot<br>0.0249016 vase<br>0.0205339 saltshaker, salt shaker | 0.3421622 Granny Smith<br>0.1089308 piggy bank, penny bank<br>0.0693314 teapot<br>0.0249017 vase<br>0.0205338 saltshaker, salt shaker |
+googlenet-v1 | PyTorch | 0.5399834 Granny Smith<br>0.1101810 piggy bank, penny bank <br>0.0232574 vase <br>0.0213452 pitcher, ewer <br>0.0198953 bell pepper | 0.5432554 Granny Smith<br>0.1103971 piggy bank, penny bank<br>0.0232568 vase<br>0.0213901 pitcher, ewer<br>0.0196196 bell pepper | 0.5432543 Granny Smith<br>0.1103970 piggy bank, penny bank<br>0.0232569 vase<br>0.0213901 pitcher, ewer<br>0.0196196 bell pepper |
+resnet-50 | PyTorch | 0.9280675 Granny Smith<br />0.0129466 orange <br />0.0058861 lemon <br />0.0041993 necklace <br />0.0025445 banana | 0.9278086 Granny Smith<br>0.0129410 orange<br>0.0059573 lemon<br>0.0042141 necklace<br>0.0025712 banana | 0.4216066 Granny Smith<br>0.0661015 dumbbell<br>0.0348192 barbell<br>0.0049673 orange<br>0.0045203 syringe |
+squeezenet1.1 | PyTorch | 0.5913458 piggy bank, penny bank<br />0.0682889 Granny Smith <br />0.0610993 lemon <br />0.0596012 necklace <br />0.0492096 bucket, pail | 0.5895361 piggy bank, penny bank<br>0.0677933 Granny Smith<br>0.0610654 necklace<br>0.0610450 lemon<br>0.0490914 bucket, pail | - |
+
+#### Test image #2
+
+Data source: [ImageNet][imagenet]
+
+Image resolution: 500 x 500
+﻿
+<div style='float: center'>
+<img width="150" src="images\ILSVRC2012_val_00000247.JPEG">
+</div>
+
+Model | Source Framework | Python API (source framework) | Python API (IREE, PyTorch) | Python API (IREE, ONNX) |
+-|-|-|-|-|
+densenet-121 | PyTorch | 0.9847536 junco, snowbird<br />0.0068679 chickadee <br />0.0034511 brambling, Fringilla montifringilla <br />0.0015685 water ouzel, dipper <br />0.0012343 indigo bunting, indigo finch, indigo bird, Passerina cyanea | 0.9841590 junco, snowbird<br>0.0072199 chickadee<br>0.0034962 brambling, Fringilla montifringilla<br>0.0016226 water ouzel, dipper<br>0.0012858 indigo bunting, indigo finch, indigo bird, Passerina cyanea | 0.9841590 junco, snowbird<br>0.0072199 chickadee<br>0.0034962 brambling, Fringilla montifringilla<br>0.0016226 water ouzel, dipper<br>0.0012858 indigo bunting, indigo finch, indigo bird, Passerina cyanea |
+efficientnet-b0 | PyTorch | 0.8903497 junco, snowbird<br />0.0147084 water ouzel, dipper <br />0.0074830 chickadee <br />0.0044766 brambling, Fringilla montifringilla <br />0.0027406 goldfinch, Carduelis carduelis | 0.8903519 junco, snowbird<br>0.0147081 water ouzel, dipper<br>0.0074829 chickadee<br>0.0044765 brambling, Fringilla montifringilla<br>0.0027406 goldfinch, Carduelis carduelis | 0.8903498 junco, snowbird<br>0.0147084 water ouzel, dipper<br>0.0074830 chickadee<br>0.0044766 brambling, Fringilla montifringilla<br>0.0027406 goldfinch, Carduelis carduelis |
+googlenet-v1 | PyTorch | 0.6449553 junco, snowbird<br />0.0752306 chickadee <br />0.0480572 brambling, Fringilla montifringilla <br />0.0298399 goldfinch, Carduelis carduelis <br />0.0126128 house finch, linnet, Carpodacus mexicanus | 0.6461055 junco, snowbird<br>0.0772564 chickadee<br>0.0468782 brambling, Fringilla montifringilla<br>0.0295897 goldfinch, Carduelis carduelis<br>0.0123322 house finch, linnet, Carpodacus mexicanus | 0.6461049 junco, snowbird<br>0.0772565 chickadee<br>0.0468783 brambling, Fringilla montifringilla<br>0.0295897 goldfinch, Carduelis carduelis<br>0.0123323 house finch, linnet, Carpodacus mexicanus |
+resnet-50 | PyTorch | 0.9809760 junco, snowbird<br />0.0049167 goldfinch, Carduelis carduelis <br />0.0036987 chickadee <br />0.0036697 water ouzel, dipper <br />0.0029304 brambling, Fringilla montifringilla | 0.9805012 junco, snowbird<br>0.0049154 goldfinch, Carduelis carduelis<br>0.0039196 chickadee<br>0.0038098 water ouzel, dipper<br>0.0028983 brambling, Fringilla montifringilla | 0.3845567 junco, snowbird<br>0.0091156 water ouzel, dipper<br>0.0054526 chickadee<br>0.0026206 indigo bunting, indigo finch, indigo bird, Passerina cyanea<br>0.0023612 brambling, Fringilla montifringilla |
+squeezenet1.1 | PyTorch | 0.9609295 junco, snowbird<br />0.0248581 chickadee <br />0.0042597 brambling, Fringilla montifringilla <br />0.0037157 goldfinch, Carduelis carduelis <br />0.0033528 ruffed grouse, partridge, Bonasa umbellus | 0.9614577 junco, snowbird<br>0.0250981 chickadee<br>0.0040701 brambling, Fringilla montifringilla<br>0.0035156 goldfinch, Carduelis carduelis<br>0.0030858 ruffed grouse, partridge, Bonasa umbellus | - |
+
+#### Test image #3
+
+Data source: [ImageNet][imagenet]
+
+Image resolution: 333 x 500
+﻿
+<div style='float: center'>
+<img width="150" src="images\ILSVRC2012_val_00018592.JPEG">
+</div>
+
+Model | Source Framework | Python API (source framework) | Python API (IREE, PyTorch) | Python API (IREE, ONNX) |
+-|-|-|-|-|
+densenet-121 | PyTorch | 0.3047960 liner, ocean liner<br />0.1327189 breakwater, groin, groyne, mole, bulwark, seawall, jetty <br />0.1180288 container ship, containership, container vessel <br />0.0794686 drilling platform, offshore rig <br />0.0718431 dock, dockage, docking facility | 0.3022414 liner, ocean liner<br>0.1322474 breakwater, groin, groyne, mole, bulwark, seawall, jetty<br>0.1194614 container ship, containership, container vessel<br>0.0795042 drilling platform, offshore rig<br>0.0723073 dock, dockage, docking facility | 0.3022407 liner, ocean liner<br>0.1322481 breakwater, groin, groyne, mole, bulwark, seawall, jetty<br>0.1194605 container ship, containership, container vessel<br>0.0795041 drilling platform, offshore rig<br>0.0723069 dock, dockage, docking facility |
+efficientnet-b0 | PyTorch | 0.4476882 breakwater, groin, groyne, mole, bulwark, seawall, jetty<br />0.0953832 container ship, containership, container vessel <br />0.0872342 beacon, lighthouse, beacon light, pharos <br />0.0559825 drilling platform, offshore rig <br />0.0441807 liner, ocean liner | 0.4476875 breakwater, groin, groyne, mole, bulwark, seawall, jetty<br>0.0953838 container ship, containership, container vessel<br>0.0872344 beacon, lighthouse, beacon light, pharos<br>0.0559831 drilling platform, offshore rig<br>0.0441806 liner, ocean liner | 0.4476894 breakwater, groin, groyne, mole, bulwark, seawall, jetty<br>0.0953836 container ship, containership, container vessel<br>0.0872341 beacon, lighthouse, beacon light, pharos<br>0.0559827 drilling platform, offshore rig<br>0.0441803 liner, ocean liner |
+googlenet-v1 | PyTorch | 0.1330581 liner, ocean liner<br />0.0796951 drilling platform, offshore rig <br />0.0680323 container ship, containership, container vessel <br />0.0588053 breakwater, groin, groyne, mole, bulwark, seawall, jetty <br />0.0365606 fireboat | 0.1323653 liner, ocean liner<br>0.0796393 drilling platform, offshore rig<br>0.0678083 container ship, containership, container vessel<br>0.0585719 breakwater, groin, groyne, mole, bulwark, seawall, jetty<br>0.0366882 fireboat | 0.1323648 liner, ocean liner<br>0.0796394 drilling platform, offshore rig<br>0.0678085 container ship, containership, container vessel<br>0.0585720 breakwater, groin, groyne, mole, bulwark, seawall, jetty<br>0.0366881 fireboat |
+resnet-50 | PyTorch | 0.4818293 liner, ocean liner<br />0.0992477 breakwater, groin, groyne, mole, bulwark, seawall, jetty <br />0.0687505 container ship, containership, container vessel <br />0.0517874 dock, dockage, docking facility <br />0.0483462 pirate, pirate ship | 0.4759648 liner, ocean liner<br>0.1025407 breakwater, groin, groyne, mole, bulwark, seawall, jetty<br>0.0689996 container ship, containership, container vessel<br>0.0524496 dock, dockage, docking facility<br>0.0473777 pirate, pirate ship | 0.1220204 lifeboat<br>0.0430796 breakwater, groin, groyne, mole, bulwark, seawall, jetty<br>0.0360478 beacon, lighthouse, beacon light, pharos<br>0.0335465 dock, dockage, docking facility<br>0.0251255 liner, ocean liner |
+squeezenet1.1 | PyTorch | 0.4393108 liner, ocean liner<br />0.1895231 container ship, containership, container vessel <br />0.1506845 pirate, pirate ship <br />0.0962459 fireboat <br />0.0199389 drilling platform, offshore rig | 0.4413096 liner, ocean liner<br>0.1931005 container ship, containership, container vessel<br>0.1459103 pirate, pirate ship<br>0.0937753 fireboat<br>0.0198682 drilling platform, offshore rig | - |
+
+<!-- LINKS -->
+[imagenet]: http://www.image-net.org
+[onnx-models]: https://github.com/onnx/models/tree/main

From b61aad9d62fd22ea25bc69869730c52883755669 Mon Sep 17 00:00:00 2001
From: Vladislav Denisov <vlad.roix@yandex.ru>
Date: Fri, 28 Nov 2025 18:39:02 +0400
Subject: [PATCH 17/17] IREE checklist and README

---
 README.md                        |  6 ++++--
 results/iree_models_checklist.md | 18 ++++++++++++++++++
 2 files changed, 22 insertions(+), 2 deletions(-)
 create mode 100644 results/iree_models_checklist.md

diff --git a/README.md b/README.md
index 735178fda..358b34923 100644
--- a/README.md
+++ b/README.md
@@ -32,8 +32,8 @@ DLI supports inference using the following frameworks:
 - [RKNN][rknn] (C++ API).
 - [ncnn][ncnn] (Python API).
 - [PaddlePaddle][PaddlePaddle] (Python API).
-- [ExecuTorch][executorch] (C++ and Python APIs)
-- [IREE][iree] (Python API)
+- [ExecuTorch][executorch] (C++ and Python APIs).
+- [IREE][iree] (Python API).
 
 More information about DLI is available on the web-site
 ([here][dli-ru-web-page] (in Russian)
@@ -184,6 +184,8 @@ Please consider citing the following papers.
     of deep models inferred by TensorFlow Lite checked in the DLI benchmark.
   - [`tvm_models_checklist.md`](results/tvm_models_checklist.md) contains a list
     of deep models inferred by Apache TVM checked in the DLI benchmark.
+  - [`iree_models_checklist.md`](results/iree_models_checklist.md) contains a list
+    of deep models inferred by IREE checked in the DLI benchmark.
 
 - `src` directory contains benchmark sources.
 
diff --git a/results/iree_models_checklist.md b/results/iree_models_checklist.md
new file mode 100644
index 000000000..95c6f14a9
--- /dev/null
+++ b/results/iree_models_checklist.md
@@ -0,0 +1,18 @@
+# Model validation and performance analysis status for IREE
+
+## The list of models is from [TorchVision][torchvision] or [ONNX Model Zoo][onnx].
+
+### Image classification
+
+Model | Availability in [TorchVision][torchvision] (0.24) or [ONNX Model Zoo][onnx] (2025.11.28) | Availability in the validation table |
+-|-|-|
+densenet-121|+|+|
+efficientnet-b0|+|+|
+googlenet|+|+|
+resnet50|+|+|
+squeezenet1_1|+|+|
+
+
+<!-- LINKS -->
+[torchvision]: https://pytorch.org/vision/stable/models.html
+[onnx]: https://github.com/onnx/models