一、qwen_7b_chat_int8

git clone https://github.com/modelscope/swift.git

1,swift框架下文件路径:
/swift/examples/pytorch/llm/scripts/qwen_7b_chat_int8/qlora/sft.sh
/swift/swift/llm/utils/dataset.py
/swift/swift/llm/sft.py
2,训练:
bash scripts/qwen_7b_chat_int8/qlora/sft.sh
3,推理:
需要修改infer.sh中路径为训练模型的输出路径----ckpt_dir "/mnt/workspace/swift/examples/pytorch/llm/output/qwen-7b-chat-int8/v0-20240906-094214/checkpoint-100" \


bash scripts/qwen_7b_chat_int8/qlora/infer.sh

Logo

尧米是由西云算力与CSDN联合运营的AI算力和模型开源社区品牌,为基于DaModel智算平台的AI应用企业和泛AI开发者提供技术交流与成果转化平台。

更多推荐