Skip to content

Releases: wangzhaode/mnn-llm

internlm-chat-7b-mnn

23 Dec 07:30

Choose a tag to compare

internlm-chat-7b导出onnx转换得到的int4量化版本mnn模型。

模型列表:

  • tokenizer.txt
  • embedding.mnn
  • lm.mnn
  • block_[0-31].mnn

phi2-mnn-int4

22 Dec 09:38

Choose a tag to compare

phi-2导出onnx转换得到的int4量化版本mnn模型。

模型列表:

  • tokenizer.txt
  • embedding.mnn
  • lm.mnn
  • block_[0-31].mnn

qwen-1.8b-mnn-int8

05 Dec 09:04

Choose a tag to compare

Qwen-1_8B-Chat导出onnx转换得到的int8量化版本mnn模型。

模型列表:

  • tokenizer.txt
  • embedding.mnn
  • lm.mnn
  • block_[0-23].mnn

qwen-1.8b-mnn

05 Dec 08:55

Choose a tag to compare

Qwen-1_8B-Chat导出onnx转换得到的int4量化版本mnn模型。

模型列表:

  • tokenizer.txt
  • embedding.mnn
  • lm.mnn
  • block_[0-23].mnn

qwen-1.8b-apk

06 Dec 08:30

Choose a tag to compare

基于mnn-llmqwen-1.8b-int4模型构建的完全离线的安卓聊天程序。

chatglm3-6b-mnn

27 Oct 12:30

Choose a tag to compare

chatglm3-6b导出onnx转换得到的int4量化版本mnn模型。

模型列表:

  • tokenizer.txt
  • embedding.mnn
  • lm.mnn
  • block_[0-27].mnn

llama2-7b-chat-mnn

20 Sep 12:37

Choose a tag to compare

Llama-2-7b-chat-ms导出onnx转换得到的int4量化版本mnn模型。

模型列表:

  • tokenizer.txt
  • embedding.mnn
  • lm.mnn
  • block_[0-31].mnn

qwen-7b-chat-mnn

14 Sep 13:35

Choose a tag to compare

Qwen-7B-Chat导出onnx转换得到的int4量化版本mnn模型。

模型列表:

  • tokenizer.txt
  • embedding.mnn
  • lm.mnn
  • block_[0-31].mnn

codegeex2-6b-mnn

14 Sep 14:13

Choose a tag to compare

codegeex2-6b导出onnx转换得到的int4量化版本mnn模型。

模型列表:

  • tokenizer.txt
  • embedding.mnn
  • lm.mnn
  • block_[0-27].mnn

chatglm2-6b-mnn

14 Sep 13:20

Choose a tag to compare

chatglm2-6b导出onnx转换得到的int4量化版本mnn模型。

模型列表:

  • tokenizer.txt
  • embedding.mnn
  • lm.mnn
  • block_[0-27].mnn