Tag Archives: 微调

Python用LoRA微调与ISMOTE过采样实现社交媒体文本情感多标签识别|附AI智能体、代码和数据

本文围绕小语言模型在社交媒体文本多标签情感识别中的应用,系统阐述了从不平衡数据处理到模型微调的完整技术链路。本文重点回答了以下问题:(1)如何处理多标签情感分类中的严重类别不平衡问题?(2)如何利用改进的过采样算法合成高质量的少数类样本?(3)如何在有限算力下高效微调24B参数级语言模型?(4)如何通过加权损失函数优先保障目标情感类别的识别性能?文中构建了一个基于LoRA低秩适配与焦点损失函数的Mistral Small 3.1微调方案,在15类情感标签上取得了多数类别F1超过0.7的效果。

Python用LoRA微调Gemma4视觉模型用于放射学医学影像问答|附AI智能体、代码和数据

本文系统梳理了使用Unsloth工具链对Gemma4视觉语言模型进行LoRA参数高效微调的完整流程,并将其应用于放射学医学影像问答任务。文章回答了以下核心问题:(1)如何基于Unsloth库加载并微调Gemma4

Python和Lag-Llama金融时序预测收益率零样本与微调对比回测实证研究|附代码数据

我们频繁遇到一个核心挑战:如何在不具备充足历史数据或模型训练成本过高的情况下,依然能对高度不确定的市场(如金融、零售、能源)做出精准的预测。

JupyterLab+PyTorch:LoRA+4-bit量化+SFT微调Llama 4医疗推理应用|附代码数据

在大语言模型(LLM)落地医疗推理场景的过程中,Meta推出的Llama 4系列(含Scout与Maverick两个开源权重模型)因性能优异备受关注,但该系列模型微调门槛极高——Llama 4 Scout需4张H100 GPU,Maverick需8张,高额硬件成本让多数企业与学生望而却步。

关注我们,永远不要错过任何见解。


技术干货二维码

技术干货

最新洞察二维码

最新洞察

视频号二维码

视频号

This will close in 0 seconds

拓端AI助手