Llama-Factory微调

Llama-Factory 是一个开源项目，专注于大语言模型进行高效微调（Fine-tuning）。它提供了一套简洁易用的工具和框架，帮助研究者和开发者快速实现大模型在特定任务或垂直领域的适配与优化。本文主要介绍使用medical-o1-reasoning-SFT数据集对Qwen2.5-1.5B-Instruct模型进行LoRa微调的过程。

继续阅读