Releases · wangzhaode/mnn-llm

14 Sep 13:17

wangzhaode

chatglm-6b-mnn

7768cf0

chatglm-6b-mnn

chatglm-6b导出onnx转换得到的int4量化版本mnn模型。

模型列表：

tokenizer.txt
embedding.mnn
lm.mnn
block_[0-27].mnn

Assets 33

14 Sep 13:35

wangzhaode

baichuan2-7b-chat-mnn

d06597d

baichuan2-7b-chat-mnn

Baichuan2-7B-Chat导出onnx转换得到的int4量化版本mnn模型。

模型列表：

tokenizer.txt
embedding.mnn
lm.mnn
block_[0-31].mnn

Assets 37

30 Mar 03:50

wangzhaode

v0.5

e737eb0

Linux/Android预编译包 Pre-release

Pre-release

Linux与Android的预编译包

Assets 4

29 Mar 03:17

wangzhaode

v0.4

6229dc3

ChatGLM-6B ONNX Models Pre-release

Pre-release

ChatGLM-6B导出的ONNX模型，权重使用fp32保存；使用顺序如下：

embedding -> block_0 -> ... -> block_27 -> lm_head

提供ONNX便于在其他框架上进行部署与测试。

onnx模型转移到 https://github.com/wangzhaode/llm-export 项目中。

Assets 2

24 Mar 12:23

wangzhaode

v0.1

fea1c61

ChatGLM-MNN fp16 models

ChatGLM-MNN models with fp16 weight.

-权值使用fp16存储，相比fp32模型降低一半；推理时precision=Low则使用fp16；否则使用fp32。

fp16权值会相比于fp32基本无损。

Assets 34

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Uh oh!

Choose a tag to compare

Sorry, something went wrong.

Sorry, something went wrong.

Uh oh!

No results found

Uh oh!

Choose a tag to compare

Sorry, something went wrong.

Sorry, something went wrong.

Uh oh!

No results found

Uh oh!

Choose a tag to compare

Sorry, something went wrong.

Sorry, something went wrong.

Uh oh!

No results found

Uh oh!

Choose a tag to compare

Sorry, something went wrong.

Sorry, something went wrong.

Uh oh!

No results found

Uh oh!

Choose a tag to compare

Sorry, something went wrong.

Sorry, something went wrong.

Uh oh!

No results found

Uh oh!

Releases: wangzhaode/mnn-llm

chatglm-6b-mnn

Uh oh!

baichuan2-7b-chat-mnn

Uh oh!

Linux/Android预编译包

Uh oh!

ChatGLM-6B ONNX Models

Uh oh!

ChatGLM-MNN fp16 models

Uh oh!