TextIn xParse Skill上架ClawHub,行业标杆级文档解析免费用!
TextIn xParse 文档解析 Skill 正式上架 ClawHub。在 OpenClaw 里和 Agent 说一句话你就能把 PDF、Word、PPT、Excel 甚至长截图各种真实场景下复杂的文档变成干净的 Markdown。即刻体验TextIn xParse Document Parse — ClawHub免费可用❗每日 1000 页额度零门槛上手。01 瓶颈Agent缺的不是思考是高精度的上下文Agent 正在成为新的应用范式。OpenClaw 生态里上万 Skills 的涌现说明了方向开发者们把能力拆解成可插拔、可复用的单元Agent 按需加载写代码、查资料、调 API 越来越像一个能自主行动的“数字员工”。但这里有一个被反复低估的问题Agent 进入企业和真实业务时真正的瓶颈不是模型会不会思考而是苦于没有高精度的上下文。企业沉淀了大量非结构化资料 —— PDF里的合同条款、Word 里的产品手册、Excel 里的经营数据、PPT里的战略规划这些文档承载着真正有价值的信息而 Agent 用不上。格式不统一、结构不稳定、字段不规范对模型来说这是一大段昂贵又“读不透”的上下文。为了解决这个问题Karpathy 构建了 LLM.Wiki把这个过程称为“编译”。概念很精准。但从原始文档到 Agent 真正可用的输入中间缺的这一步远比想象中更难填。这也是我们今天想聊的方向。02 Skill让Agent具备企业级能力智能文字识别合合信息做了19年。在文档解析上我们一直做得比较深只是过去这些能力是闭源的、商用的。去年以来开源 OCR 大模型百花齐放。生态在往前走我们也在想当 Agent 这个新范式正在成型我们能贡献点什么。TextIn xParse 文档解析Skill是第一个答案。它的核心能力很简单却很扎实全格式兼容支持PDF、Word、Excel、PPT、图片等十余种格式的输入结构完整还原跨页表格、目录层级、页眉页脚、标题结构……完整保留文档骨架极速解析百页文档约1.5秒完成从容应对企业大规模文档批处理Markdown 输出输出保留文档层级与语义的 Markdown 格式这是目前最受LLM和Agent欢迎的知识形态精确坐标回显返回块级及字符级坐标信息代表解析结果在原文档中的精确位置方便前端可视化展示和后续审核校对。对企业级开发者和 OpenClaw 深度玩家来说商业级的稳定性、可用性和效果是能把产品真正跑在生产环境里的保障。现在我们把过去 19 年沉淀在企业场景里的能力以最轻量、最友好的方式压缩成一个 Skill交到开发者手里。03 使用两种方式零门槛让Agent读懂文档不用写代码、不用调 API。在 OpenClaw、ZeroClaw、Claude Code等 Agent 平台装上 xparse-parse Skill只需要说一句话它就能自动完成文档解析、格式转换全部流程。你可以这样说帮我读一下这份PDF合同提取关键条款 把这个报告转成Markdown保存到桌面 这份加密PDF密码是123456帮我解析前10页 提取这张表格图片里的内容输出JSON …… # 更多高阶玩法等你探索支持格式PDF、图片jpg/png/bmp/tiff/webp免登录免费使用每日上限1000页更多用量或更多格式 Word/Excel/PPT/HTML/OFD 等20常见格式可在配置 TextIn 账户凭证后解锁。安装方式二选一方式一通过各类Agent或Claw安装在 Agent 对话框直接说帮我从 技能市场 安装 intsig-textin/xparse-parser 如果技能市场里没有则通过npx安装npx skills add intsig-textin/xparse-skills --yes -textin/xparse-skillshttps://gitee.com/intsig-textin/xparse-skills方式二手动安装从以下任一地址下载 zip 文件解压后放到 agent 对话框让模型使用解压里面的 skill.md 文件即可GitHub:https://github.com/intsig-textin/xparse-skillsGitee:https://gitee.com/intsig-textin/xparse-skillsClawHub:https://clawhub.ai/intsig-textin/xparse-parser04 信号Agent的知识入口回到开头 Karpathy “编译”的概念。TextIn xParse 做的不只是OCR意义上的“识别”。它更像是一个知识接入的过程——把原始文档编译成 Markdown把混乱格式编译成结构化信息把非结构化资料编译成 Agent 的知识入口。经过这个过程PDF、Word、PPT 这些原始文档就成为了一套可以被 Agent 持续消费、反复调用、不断演化的知识资产而 Agent 可以基于这套资产做检索、做问答、做分析、做报告不管后面接的是知识库、Wiki、RAG 还是多 Agent 协作工作流。这也是 xParse 真正想站的位置不是 OCR 的终点 而是 Agent 接入知识的起点。这次上线是一个信号我们将把过去19年沉淀在企业场景里的智能文档能力逐步转成真正服务 Agent 生态的基础组件。对开发者来说这意味着能省去文档解析层的长期技术积累直接获得企业级的稳定性保障。而这个开放刚刚开始。接下来我们会围绕“Agent 需要什么样的文档能力”继续迭代不是堆功能是补能力。