diff --git a/python/example/test_big_file.py b/python/example/test_big_file.py
new file mode 100755
index 00000000..37371b5d
--- /dev/null
+++ b/python/example/test_big_file.py
@@ -0,0 +1,191 @@
+#!/usr/bin/env python3
+
+import os
+import argparse
+import json
+import sys
+import shlex
+import subprocess
+import logging
+import srt
+import datetime
+
+from pathlib import Path
+from re import split
+from vosk import Model, KaldiRecognizer, SetLogLevel, list_model_pairs, list_models, list_languages
+from multiprocessing.dummy import Pool
+from timeit import default_timer as timer
+
+SetLogLevel(0)
+
+SAMPLE_RATE = 16000
+MODEL_PRE_URL = "https://alphacephei.com/vosk/models/"
+MODEL_LIST_URL = MODEL_PRE_URL + "model-list.json"
+MODEL_DIRS = [os.getenv("VOSK_MODEL_PATH"), Path("usr/share/vosk"),
+        Path.home() / "AppData/Local/vosk", Path.home() / ".cache/vosk"]
+
+parser = argparse.ArgumentParser(
+        description = "Transcribe big size audiofiles")
+parser.add_argument(
+        "--lang", "-l", default="en-us", type=str,
+        help="language")
+parser.add_argument(
+        "--small", "-s", default="vosk-model-small-en-us-0.15", type=str,
+        help="small model name")
+parser.add_argument(
+        "--big", "-b", default="vosk-model-en-us-0.22", type=str,
+        help="big model name")
+parser.add_argument(
+        "--input", "-i", type=str,
+        help="audiofile")
+parser.add_argument(
+        "--output", "-o", default="txt", type=str,
+        help="output type")
+parser.add_argument(
+        "--list-models", default=False, action="store_true",
+        help="list available models")
+parser.add_argument(
+        "--list-languages", default=False, action="store_true",
+        help="list available languages")
+parser.add_argument(
+        "--list-model-pairs", default=False, action="store_true",
+        help="list available model pairs")
+parser.add_argument(
+        "--log-level", default="INFO",
+        help="logging level")
+
+class BigFileProcessor:
+
+    def __init__(self, args):
+        self.args = args
+        self.small_model = Model(model_name=str(args.small))
+        self.big_model = Model(model_name=str(args.big))
+
+    def resample_ffmpeg(self):
+        cmd = shlex.split("ffmpeg -nostdin -loglevel quiet "
+                "-i \'{}\' -ar {} -ac 1 -f s16le -".format(str(self.args.input), SAMPLE_RATE))
+        stream = subprocess.Popen(cmd, stdout=subprocess.PIPE)
+        return stream
+
+    def format_fragments(self, byte_list, res):
+        fragment = dict.fromkeys(["byte_list", "res"])
+        fragment["byte_list"] = byte_list
+        fragment["res"] = res
+        return fragment
+
+    def prepare_fragments(self):
+        rec = KaldiRecognizer(self.small_model, SAMPLE_RATE)
+        rec.SetWords(True)
+        stream = self.resample_ffmpeg()
+        result = []
+        byte_list = []
+        while True:
+            data = stream.stdout.read(4000)
+            if len(data) == 0:
+                break
+            if rec.AcceptWaveform(data):
+                res = rec.Result()
+                fragment = self.format_fragments(byte_list, res)
+                result.append(fragment)
+                byte_list = []
+            else:
+                byte_list.append(data)
+        res = rec.FinalResult()
+        if json.loads(res)["text"] != "":
+            fragment = self.format_fragments(byte_list, res)
+            result.append(fragment)
+        return result
+
+    def get_srt_result(self, result, words_per_line=7):
+        subs = []
+        for res in result:
+            jres = json.loads(res)
+            if not "result" in jres:
+                continue
+            words = jres["result"]
+            for j in range(0, len(words), words_per_line):
+                line = words[j : j + words_per_line]
+                s = srt.Subtitle(index=len(subs),
+                        content=" ".join([l["word"] for l in line]),
+                        start=datetime.timedelta(seconds=line[0]["start"]),
+                        end=datetime.timedelta(seconds=line[-1]["end"]))
+                subs.append(s)
+        return srt.compose(subs)
+
+    def process_fragments(self, fragment):
+        logging.info("Process file fragment")
+        rec = KaldiRecognizer(self.big_model, SAMPLE_RATE)
+        rec.SetWords(True)
+        results = []
+
+        for data in fragment["byte_list"]:
+            if rec.AcceptWaveform(data):
+                rec.Result()
+        results.append(rec.FinalResult())
+        return results
+
+    def format_result(self, small_model_results, big_model_results):
+        result = []
+        for elem in big_model_results:
+            result.append(elem[0])
+        return result
+
+    def process_file(self):
+        small_model_results = self.prepare_fragments()
+        logging.info("File fragments are ready")
+
+        big_model_results = []
+        with Pool() as pool:
+            for fragment in pool.map(self.process_fragments, small_model_results):
+                big_model_results.append(fragment)
+        if self.args.output == "srt":
+            result = self.format_result(small_model_results, big_model_results)
+            print(self.get_srt_result(result))
+        else:
+            [print(json.loads(fragment[0])["text"]) for fragment in big_model_results]
+
+def main():
+
+    args = parser.parse_args()
+    log_level = args.log_level.upper()
+    logging.getLogger().setLevel(log_level)
+
+    if args.list_model_pairs:
+        list_model_pairs(args.lang)
+        return
+
+    if args.list_models:
+        list_models()
+        return
+
+    if args.list_languages:
+        list_languages()
+        return
+
+    if not args.input:
+        logging.info("Please specify input file")
+        sys.exit(1)
+
+    small_model_lang = split(r"(-\d.+)", split(r"vosk-model-(small-)*", args.small)[-1])[0]
+    big_model_lang = split(r"(-\d.+)", split(r"vosk-model-(small-)*", args.big)[-1])[0]
+    if not small_model_lang == big_model_lang:
+        logging.info("You have to use both models for the same language, try again.")
+        sys.exit(1)
+
+    if args.output not in ["txt", "srt"]:
+        logging.info("Wrong output format, it has to be txt(by default) or srt as optional, "\
+        "please try again.")
+        sys.exit(1)
+
+    processor = BigFileProcessor(args)
+
+    start_time = timer()
+
+    logging.info("File processing started")
+    processor.process_file()
+
+    elapsed = timer() - start_time
+    logging.info("Execution time: {:.3f}".format(elapsed))
+
+if __name__ == "__main__":
+    main()
diff --git a/python/vosk/__init__.py b/python/vosk/__init__.py
index a20a2fe5..49c66ab8 100644
--- a/python/vosk/__init__.py
+++ b/python/vosk/__init__.py
@@ -35,6 +35,19 @@ def open_dll():
 
 _c = open_dll()
 
+def list_model_pairs(lang, small_model_name=None, big_model_name=None):
+    response = requests.get(MODEL_LIST_URL, timeout=10)
+    for model in response.json():
+        if model["obsolete"] == "false" and model["type"] == "small" and model["lang"] == lang:
+            small_model_name = model["name"]
+        if model["obsolete"] == "false" and model["type"] == "big" and model["lang"] == lang:
+            big_model_name = model["name"]
+    if small_model_name != None and big_model_name != None:
+        print(small_model_name, big_model_name)
+    else:
+        print("There is no small or big model for this language")
+        sys.exit(1)
+
 def list_models():
     response = requests.get(MODEL_LIST_URL, timeout=10)
     for model in response.json():
@@ -44,7 +57,7 @@ def list_languages():
     response = requests.get(MODEL_LIST_URL, timeout=10)
     languages = {m["lang"] for m in response.json()}
     for lang in languages:
-        print (lang)
+        print(lang)
 
 class Model:
     def __init__(self, model_path=None, model_name=None, lang=None):