LLM--微调(Adapters，Prompt，Prefix)

张

张建站

2026/4/4 8:30:02

10分钟阅读

文章目录适配器(Adapters)Prompt-Tuning提示词工程Prompt Engineering什么是提示词工程提示词工程作用提示词工程关键要素提示词微调(Prompt-tuning)Prefix-Tuning参考资料任务了解思想核心掌握下一节LoRA微调适配器(Adapters)提出背景谷歌针对“BERT”的微调谷歌工程师认为仅仅微调后面几层参数效果很不好。解决思想不更新全部参数微调的时候在Transformer编码层上添加几层“神经网络层”微调的时候其他参数冻结只更新“新添加的网络结构参数”Prompt-Tuning提示词工程Prompt Engineering什么是提示词工程先看一个小demo。假设询问大模型一个问题“为什么天空是蓝色”对比三种方式的大模型回答。模糊无引导大模型。大模型可能回答因为太阳光是蓝色的因为空气中有蓝色气体结构化角色设定你是一位中学物理老师请用通俗易懂的语言向初中生解释“为什么晴朗的天空是蓝色的”。要求 1. 基于瑞利散射原理 2. 不超过150字 3. 避免使用复杂公式。这个时候可能就会输出这是因为太阳光进入大气层时遇到空气分子会发生“瑞利散射”。蓝光波长较短比红光更容易被散射到各个方向所以我们抬头看天空时就看到一片蓝色啦显得很专业。思维链引导请逐步推理并回答为什么晴朗的天空是蓝色的步骤1太阳光由哪些颜色组成步骤2光进入大气层后会发生什么现象步骤3不同颜色的光散射程度有何不同步骤4人眼看到的是哪种光的散射结果输出示例太阳光是由红、橙、黄、绿、蓝、靛、紫等多种颜色组成的白光。当阳光穿过地球大气层时会与空气中的分子和微粒发生散射。根据瑞利散射定律波长越短的光如蓝光、紫光散射越强。虽然紫光散射更强但人眼对蓝光更敏感且部分紫光被臭氧吸收因此我们看到的天空呈蓝色。逻辑很清楚也有利于防止回答错误。所以总的来说**提示词工程就是对模型思考回答的引**如果没有提示词模型回答可能会变得很模糊加提示词是为了让模型更准确的回答问题。提示词工程作用对普通用户可以更好的获得AI的服务对开发者构建AI应用的基础提示词工程关键要素一句话角色任务约束格式角色“我是谁”任务“需要做什么”约束“需要做的目标是谁”格式输出格式如字数约束提示词微调(Prompt-tuning)提出微软提出的一种高效微调方法。先来看传统微调方法思想在预训练的模型基础上针对不同任务分别训练从而获得专有模型。Prompt-tuning方法思想将多种任务进行混合结合“提示词”思想在每个任务前加一个“提示词”以区分不同任务。实现这个“提示词”是可学习的在Prompt-tuning中他是作为embedding参数的一部分随着模型训练的时候一起学习。参数更新在进行微调的时候预训练权重基本不更新只更新可学习的 prompt 向量缺点小数据下不够好Prefix-Tuning作者斯坦福研究人员思想与prompt-tuning类似Prefix思路是在输入的开头增加一段“virtual token”作为输入的prefix模型微调的时候只更新Prefix参数。与Prompt区别“virtual-token”会被增加每一层的输入层中prompt-tuning是只在embedding时候添加。为了防止直接跟新Prefix的参数导致训练不稳定在Prefix前加入MLP结构。在encoder-decoder模型中encoder、decoder架构中输入均需要加prefix参考资料https://www.qianwen.com/chat/35ae59d6fac447e68aa5289d28532b11?sourcetongyigwhttps://www.runoob.com/ai-agent/prompt-engineering.htmlK同学笔记

3dsconv终极指南：5步轻松掌握3DS游戏格式转换

3dsconv终极指南：5步轻松掌握3DS游戏格式转换【免费下载链接】3dsconv Python script to convert Nintendo 3DS CCI (".cci", ".3ds") files to the CIA format 项目地址: https://gitcode.com/gh_mirrors/3d/3dsconv 你是否曾遇到过下…...

2026/4/4 8:27:36 阅读更多 →

SPIRAN ART SUMMONER高算力适配：4090D显存优化与GPU利用率提升方案

SPIRAN ART SUMMONER高算力适配：4090D显存优化与GPU利用率提升方案 "这就是你的故事。让幻光虫指引你的灵感，在斯皮拉的尽头凝结成永恒的画面。" SPIRAN ART SUMMONER 是一款将顶尖图像生成模型（Flux.1-Dev）与《最终幻想…...

2026/4/4 8:25:17 阅读更多 →

手机号查QQ号：3步找回遗忘账号的智能方案

手机号查QQ号：3步找回遗忘账号的智能方案【免费下载链接】phone2qq 项目地址: https://gitcode.com/gh_mirrors/ph/phone2qq 你是否曾经因为忘记QQ号而无法登录重要的聊天群组？或者在新设备上需要重新登录QQ，却怎么也想不起自己的账…...

2026/4/4 8:22:40 阅读更多 →

【技术干货】GLM 5.1 + 开源 Agent：从模型到长跑智能体的完整实战思路

摘要本文从工程视角拆解 GLM 5.1 在智能体（AI Agent）场景中的优势，对比纯聊天模式与工具调用/长任务工作流的差异，并给出基于 OpenAI 兼容接口的实战示例。文末附上基于（xuedingmao.com）的统一多模型接入方…...

2026/3/29 0:01:51 阅读更多 →

Audio Pixel Studio部署案例：树莓派4B轻量部署Audio Pixel Studio可行性验证

Audio Pixel Studio部署案例：树莓派4B轻量部署Audio Pixel Studio可行性验证 1. 项目背景与目标 Audio Pixel Studio作为一款轻量级音频处理工具，其设计初衷就是为开发者提供简单易用的语音合成与人声分离功能。本次验证旨在探索在树莓派4B这样的低功耗…...

2026/3/29 0:03:10 阅读更多 →

电子课本下载工具：高效赋能教育资源获取的技术革新

电子课本下载工具：高效赋能教育资源获取的技术革新【免费下载链接】tchMaterial-parser 国家中小学智慧教育平台电子课本下载工具项目地址: https://gitcode.com/GitHub_Trending/tc/tchMaterial-parser 在数字化教育快速发展的今天，教育资源的…...

2026/3/29 0:03:12 阅读更多 →