软件环境 <div class="highlight highlight-text-md notranslate position-relative overf

[Bug]: AutoModelForCausalLM.from_pretrained 转换 huggingface 模型显存不足 about paddlenlp HOT 2 CLOSED

sanbuphy commented on September 27, 2024

[Bug]: AutoModelForCausalLM.from_pretrained 转换 huggingface 模型显存不足

from paddlenlp.

Comments (2)

DrownFish19 commented on September 27, 2024 1

后续会支持自动转换模型参数，当前先给出转换脚本，临时使用。具体使用步骤根据模型不同，需要进行修改，请参考以下说明：

模型前缀。paddlenlp中使用的模型前缀为模型名称，例如Qwen2使用qwen2.，LLaMA使用llama.，HF使用的model.或者transformer.。可查看paddlenlp.transformers.XXX.modeling.LlamaPretrainedModel中的base_model_prefix。
linear参数转置。Paddle和torch的linear实现不同，参数互为转置关系。需根据不同模型进行判断，具体可查找paddlenlp.transformers.XXX.modeling.XXXPretrainedModel中的mappings参数，其标注了需要进行转置的参数。例如llama模型为paddlenlp.transformers.llama.modeling.LlamaPretrainedModel

脚本：https://gist.github.com/DrownFish19/80b43383c9205ee1cf7cf35445009488

from paddlenlp.

sanbuphy commented on September 27, 2024

后续会支持自动转换模型参数，当前先给出转换脚本，临时使用。具体使用步骤根据模型不同，需要进行修改，请参考以下说明：

模型前缀。paddlenlp中使用的模型前缀为模型名称，例如Qwen2使用qwen2.，LLaMA使用llama.，HF使用的model.或者transformer.。可查看paddlenlp.transformers.XXX.modeling.LlamaPretrainedModel中的base_model_prefix。

linear参数转置。Paddle和torch的linear实现不同，参数互为转置关系。需根据不同模型进行判断，具体可查找paddlenlp.transformers.XXX.modeling.XXXPretrainedModel中的mappings参数，其标注了需要进行转置的参数。例如llama模型为paddlenlp.transformers.llama.modeling.LlamaPretrainedModel

脚本：https://gist.github.com/DrownFish19/80b43383c9205ee1cf7cf35445009488

Thanks !

from paddlenlp.

[Bug]: AutoModelForCausalLM.from_pretrained 转换 huggingface 模型显存不足 about paddlenlp HOT 2 CLOSED

Comments (2)

Related Issues (20)

Recommend Projects

React

Vue.js

Typescript

TensorFlow

Django

Laravel

D3

Recommend Topics

javascript

web

server

Machine learning

Visualization

Game

Recommend Org

Facebook

Microsoft

Google

Alibaba

D3

Tencent