使用LLaMA-Factory进行大模型微调

平台选择

选用的平台是阿里云人工智能平台PAI，新人注册有免费使用额度，配置是8CPU/32G内存以及一个V100显卡，用来跑一些参数来较小的模型是足够的。主要任务是LLM-as-Judge，也就是使用大模型作为裁判评判其余模型结果的好坏。
开通PAI平台的过程就不说了，这个是配环境的代码，需要注意的是torch的版本，下错了版本cuda没法用

git clone https://github.com/hiyouga/LLaMA-Factory.git
cd LLaMA-Factory
pip install -e .[torch,metrics]
pip install torch==2.1.2 torchvision==0.16.2 torchaudio==2.1.2 --index-url https://download.pytorch.org/whl/cu118

模型选择

模型选择最开始尝试了chatGLM6B的模型，但是后来意识到参数量依旧过高，而且动不动系统盘就爆满，因此转向使用小模型，尝试了Qwen1.5-1.8B模型，最开始在PandaLM数据集上的效果惊为天人，20轮Tuning后在测试集上的准确率高达78%，但是后来尝试了其余数据集，准确率都在50%左右徘徊，效果不甚理想。于是转为使用Phi3模型。

LLaMA-Factory自带一个UI界面，不用自己写代码，只需要调配一下参数就可以自动微调。