跳至主要內容
微调

微调

  • 模型微调流程
  • LoRA
  • Llama-factory
  • 基础开源模型
  • MoE 混合专家模型
  • RLHF 基于人类反馈的强化学习

Liz大约 12 分钟LLMFine-tuning