微调
-
如何选择适合的深度学习迁移学习模型与方法
迁移学习是一种机器学习方法,它通过将在一个任务上学到的知识应用到另一个相关任务上,来提升模型的学习效率和性能。其核心思想是利用预训练模型的特征提取能力,避免从零开始训练模型,这在数据稀缺或计算资源有限的情况下尤为重要。 一个典型的迁移学习流程包含三个关键部分:源任务、预训练模型和目标任务。源任务通常是大型数据集上的训练任务,例如在ImageNet数据集上训练…
-
LORA大模型原理详解与应用实战指南
在大语言模型(LLM)飞速发展的今天,全参数微调(Full Fine-Tuning)面临着巨大的计算成本和存储开销挑战。LoRA(Low-Rank Adaptation,低秩自适应)作为一种高效的参数微调方法,巧妙地解决了这一痛点。其核心思想在于:冻结预训练模型的权重,并在原始模型旁边引入一个可训练的“旁路”矩阵,通过低秩分解来模拟参数更新的过程。 想象一下…