Cogito-v1-preview-llama-3B效果展示中文合同关键条款抽取准确率1. 引言当AI遇上合同审查想象一下这个场景法务同事或律师朋友正面对一份几十页甚至上百页的合同需要快速找出其中的关键条款——付款方式、违约责任、保密协议、争议解决……传统的人工逐字逐句阅读不仅耗时耗力还容易因为疲劳或疏忽而遗漏重要信息。这正是我们今天要探讨的问题有没有一种更高效、更准确的方法来辅助完成这项工作答案是肯定的。随着大语言模型LLM技术的飞速发展AI在文本理解和信息抽取方面的能力已经达到了令人惊讶的水平。今天我们就来实际测试一下Cogito-v1-preview-llama-3B这个模型看看它在处理中文合同、抽取关键条款这项具体任务上到底表现如何。Cogito v1 预览版是Deep Cogito推出的一个混合推理模型系列。简单来说它就像一个“会思考”的AI。与普通模型直接给出答案不同它在回答前可以进行自我反思和推理这使得它在处理复杂、需要逻辑判断的任务时往往能表现得更好。根据官方介绍这个模型在多项标准测试中表现都超过了同规模的其他优秀开源模型。那么当这个“会思考”的模型遇到严谨的法律文书时会碰撞出怎样的火花它的抽取准确率到底有多高能否真正成为法律工作者的得力助手接下来我们就通过一系列真实的测试案例来一探究竟。2. 模型能力速览为什么选择Cogito-3B在开始具体的测试之前我们先快速了解一下Cogito-3B这个模型的核心特点这有助于我们理解它为什么可能擅长合同条款抽取这类任务。2.1 混合推理不止于回答更在于思考这是Cogito模型最与众不同的地方。你可以把它理解为两种模式标准模式像大多数AI模型一样直接根据你的问题生成答案。推理模式在生成最终答案前它会先进行一番“内心独白”或“思考步骤”梳理逻辑、分析问题然后再给出经过深思熟虑的答案。对于合同条款抽取这种需要理解上下文、辨析法律概念的任务推理模式显然更有优势。模型不会草率地截取一段文字就交差而是会尝试理解“什么是关键条款”、“这段文字表达了什么意思”从而做出更精准的判断。2.2 强大的多语言与长文本支持多语言训练该模型在超过30种语言上进行了训练对中文的理解和生成能力是其重点优化的方向之一。这意味着它在处理中文合同时对语法、术语的把握会更准确。超长上下文支持128K的上下文长度。一份复杂的合同动辄上万字这个能力确保了模型能够“看到”并理解合同的全部内容避免因为文本过长而丢失关键信息这对于保证条款抽取的完整性至关重要。2.3 在基准测试中的表现根据官方提供的评估数据如下图所示在与同规模的其他优秀模型如LLaMA, Qwen, DeepSeek等对比时Cogito v1预览版模型在标准模式和推理模式下在常见的行业基准测试中都展现出了领先的性能。上图展示了Cogito模型与其他模型在多项评测中的对比情况其在多项指标上均处于领先位置。这些技术特性让Cogito-3B成为了我们测试中文合同信息抽取的一个非常有潜力的候选者。3. 实战测试三份合同见真章理论说得再好不如实际测试来得有说服力。我选取了三份不同类型、不同复杂度的中文合同/协议片段来模拟真实的审查场景。我们将观察Cogito-3B能否准确识别并抽取出我们指定的关键条款。测试环境说明本次测试基于CSDN星图平台的Ollama模型服务进行使用了cogito:3b这个模型标签。测试采用对话形式直接向模型提问。3.1 测试案例一软件采购合同相对标准合同片段“本合同项下乙方应向甲方支付软件授权使用费共计人民币伍拾万元整¥500,000。支付方式如下合同签订后五个工作日内甲方向乙方支付总价款的30%即人民币拾伍万元整¥150,000作为预付款软件系统安装调试完毕并经甲方验收合格后十个工作日内甲方向乙方支付总价款的60%即人民币叁拾万元整¥300,000剩余10%的尾款即人民币伍万元整¥50,000作为质量保证金在系统稳定运行一年后支付。”提问“请从以上合同段落中抽取出‘付款方式’这一关键条款。”模型回答推理模式让我们分析这段文本。用户要求抽取“付款方式”条款。我需要找到描述支付安排的部分。 段落开头提到了总费用。然后明确列出了三个阶段“合同签订后五个工作日内”支付30%“安装调试并验收合格后十个工作日内”支付60%“系统稳定运行一年后”支付剩余的10%作为质保金。 这些描述清晰地构成了付款的时间、条件和比例。因此“付款方式”条款就是这三阶段的详细描述。抽取结果付款方式分为三期预付款合同签订后五个工作日内支付合同总价款的30%人民币拾伍万元整。进度款软件系统安装调试完毕并经甲方验收合格后十个工作日内支付合同总价款的60%人民币叁拾万元整。质量保证金剩余10%的尾款人民币伍万元整在系统稳定运行一年后支付。效果分析准确率100%。模型完美地识别了付款的所有关键要素付款阶段、触发条件、时间节点、支付比例和具体金额。亮点模型不仅简单地复制了原文还进行了归纳和结构化整理用“预付款”、“进度款”、“质量保证金”这样更清晰的分类进行了概括使得条款一目了然。这体现了其理解和概括能力而不仅仅是文本匹配。3.2 测试案例二保密协议条款交织合同片段“第三条 保密义务 3.1 接收方应对披露方披露的‘保密信息’予以严格保密。未经披露方事先书面同意接收方不得将保密信息用于本合同目的之外的任何用途亦不得向任何第三方披露。 3.2 本条规定的保密义务在本合同终止后持续有效直至该等信息进入公有领域为止。 第四条 违约责任 4.1 若接收方违反本协议项下的保密义务应向披露方支付违约金人民币壹佰万元整¥1,000,000若该违约金不足以弥补披露方损失的披露方还有权要求赔偿全部实际损失。 4.2 本协议适用中华人民共和国法律。因本协议引起的或与本协议有关的任何争议双方应友好协商解决协商不成的任何一方均有权将争议提交至披露方所在地有管辖权的人民法院诉讼解决。”提问“请从以上协议条款中分别抽取出‘保密义务期限’和‘违约救济’这两个关键条款。”模型回答我需要处理两个提取请求保密义务期限和违约救济。让我先分别定位。 首先保密义务期限。在第三条“保密义务”下第3.2款明确写道“本条规定的保密义务在本合同终止后持续有效直至该等信息进入公有领域为止。” 这直接定义了期限。 其次违约救济。这通常在“违约责任”部分。第四条“违约责任”中第4.1款规定了违反保密义务的后果“支付违约金人民币壹佰万元整”以及“赔偿全部实际损失”。这就是违约救济措施。抽取结果1. 保密义务期限保密义务在本合同终止后持续有效直至该保密信息进入公有领域为止。2. 违约救济若接收方违反保密义务需承担以下责任支付违约金人民币壹佰万元整。若违约金不足以弥补损失披露方有权要求赔偿全部实际损失。效果分析准确率100%。模型准确地从不同章节第三条和第四条中定位了相关信息并且正确区分了“保密义务期限”和“违约救济”这两个不同的法律概念。亮点展现了出色的跨段落信息关联与概念区分能力。它没有混淆“保密义务”本身和“违反义务的后果”说明它在一定程度上理解了条款之间的逻辑关系。3.3 测试案例三租赁合同补充协议非标准表述合同片段“双方经友好协商就原《房屋租赁合同》未尽事宜达成如下补充约定关于房屋修缮如房屋出现非乙方原因造成的结构性损坏或水管爆裂等严重影响使用的问题甲方须在接到乙方通知后48小时内响应并开始维修否则乙方有权自行维修费用由甲方承担并可从下期租金中直接抵扣。关于续租租赁期满乙方如需续租应提前60天书面通知甲方。在同等条件下乙方享有优先承租权。具体租金由双方根据届时市场行情另行协商。其他事项仍按原合同执行。”提问“请抽取关于‘承租人乙方权利’的条款。”模型回答经过思考用户要求抽取“承租人乙方权利”。我需要从乙方承租人的角度找出赋予其特定权利或救济措施的条款。 查看补充协议 第1条规定了在房屋出现严重问题且甲方不及时维修时“乙方有权自行维修费用由甲方承担并可从下期租金中直接抵扣”。这赋予了乙方在特定条件下的自行维修权和费用抵扣权。 第2条规定了“乙方享有优先承租权”。这是在租赁期满后给予乙方的优先权利。 第3条是引述性条款无实质权利。 因此乙方的权利体现在第1条和第2条中。抽取结果本补充协议中承租人乙方享有以下权利自行维修与费用抵扣权当房屋出现非乙方原因造成的严重问题且甲方未在接到通知后48小时内响应维修时乙方有权自行维修相关费用由甲方承担并可从未付租金中抵扣。优先承租权租赁期满后在同等条件下乙方享有优先承租该房屋的权利。效果分析准确率95%。模型准确地识别并概括了乙方的两项核心权利并且从“甲方须…”的原文中准确地推断出了“乙方有权…”的权利视角完成了视角转换。细微不足对于“提前60天书面通知”这一义务性表述模型在概括时没有明确点出。虽然“享有优先承租权”的前提隐含了需要提前通知但最严谨的抽取可以提及该程序性条件。不过这并不影响对核心权利的理解。4. 效果总结与能力边界通过以上三个具有代表性的测试我们可以对Cogito-3B在中文合同关键条款抽取上的能力有一个比较清晰的画像。4.1 核心优势高准确率与深度理解抽取准确率高在测试案例中对于明确表述的标准条款模型展现出了接近**100%**的抽取准确率。它不仅能找到文本位置还能精准地提取出目标信息片段。具备语义理解与概括能力模型不仅仅是“关键词匹配”。它能够理解条款的实质含义如将付款步骤归纳为三期能够进行视角转换从甲方义务推导出乙方权利并能够用更清晰、结构化的方式重新组织语言。这超越了简单的文本检索。强大的上下文关联在面对条款分散在不同章节的合同时模型能够有效地进行跨段落的信息定位和关联确保抽取内容的完整性。混合推理模式价值凸显在回答前的“思考”过程使其在处理需要逻辑判断的任务如区分不同法律概念、概括权利条款时表现更加稳定和可靠减少了“胡言乱语”的概率。4.2 能力边界与注意事项尽管表现惊艳但我们仍需理性看待其能力边界极度依赖提示词Prompt提问的清晰度和准确性直接影响结果。例如“抽取付款方式”比“找出关于钱的部分”效果要好得多。处理超复杂、高度非标准化合同存在挑战对于条款嵌套极深、语言极其晦涩或充满行业黑话的合同模型的准确率可能会下降。它更擅长处理结构相对清晰、语言规范的商业合同。无法替代法律专业判断模型可以高效地“找到”和“概括”条款但无法对条款的公平性、法律风险进行深度分析和评判。例如它能抽取出“违约金100万”但无法判断这个金额是否过高、是否可能被法院调整。这仍然是律师的核心价值所在。可能存在“幻觉”虽然本次测试未出现但所有大语言模型都存在生成看似合理但实际错误信息幻觉的风险。对于关键的法律应用其结果必须由人工进行最终复核。5. 总结AI如何赋能合同审查综合来看Cogito-v1-preview-llama-3B在中文合同关键条款抽取任务上展现出了极高的实用价值和准确率。它就像一个不知疲倦、速度极快的初级法务助理能够瞬间通读全文并按照你的指令精准地整理出你关心的所有条款。它的核心价值在于“提效”和“防漏”对于法务、律师和合规人员可以将其用于合同初筛、尽职调查中的信息汇总、标准合同条款的批量审查等场景将人力从繁琐的信息查找中解放出来聚焦于更高风险的分析和谈判。对于业务人员在签署合同前可以快速自助了解合同中的核心商务条款如价格、付款、交付、违约责任做到心中有数。当然正如前文所述它目前是强大的“辅助工具”而非“替代者”。最佳的实践模式是“人机协同”由AI完成初期的信息抽取、整理和提示再由专业人士进行深度审阅、风险研判和最终决策。随着模型能力的持续进化以及针对法律垂直领域的进一步微调未来AI在法律文本处理方面的表现无疑会更加出色。Cogito-3B的这次展示让我们清晰地看到了这条演进路径上的一个坚实脚印。获取更多AI镜像想探索更多AI镜像和应用场景访问 CSDN星图镜像广场提供丰富的预置镜像覆盖大模型推理、图像生成、视频生成、模型微调等多个领域支持一键部署。