OmniAgent · 不止于回答，而是执行

读取你的文件 · 接管你的浏览器 · 操作你的软件 —— 从指令到交付，全程自主完成

不止于对话

打开你的共享盘、遍历本地目录、批量处理文件 —— 不是"帮你想"，是直接上手替你做

不止于文本

VL 视觉理解扫描件、拍照件、合同与发票 —— 看懂版面结构、印章位置、手写批注，不只是逐行读字

不止于建议

接管浏览器登录企业系统、RPA 操作财务软件、自动填报表单 —— 直接输出可交付的成果文件

Omni｜核心能力架构

部署在你的设备上，而非云端对话框。
拥有与你相同的系统操作权限——
读取文件 · 操控软件 · 登录系统 · 填写表单。
你描述目标，Agent 完成交付。

任务驱动执行引擎

CORE

Task-Driven Execution

描述目标，Agent 自动规划路径、拆解步骤、逐一执行并验证结果——你收到的不是建议清单，而是已完成的交付物。

多模态视觉理解

HOT

Visual Language Model

不依赖固定模板 OCR，VL 模型直接「看懂」扫描件与复杂表单——版面层级、印章位置、手写批注一并语义理解。

无接口跨系统操控

HOT

API-Free Automation

目标系统没有开放 API？Agent 像人一样操作浏览器、登录企业软件、填写表单——全程无需二次开发与系统对接。

多 Agent 协同调度

Multi-Agent Orchestration

超大任务自动拆分为并行子流程，由专长各异的 Agent 协同推进——审计 Agent 整理底稿的同时，核对 Agent 已在比对流水。

持续记忆与上下文

Persistent Memory

跨任务记住你的科目体系、文件命名规则与操作习惯——第二次执行同类任务时自动复用经验，而非每次从零开始。

行业场景深度适配

PRO

Industry-Grade Skills

内置审计、财务、法律、申报等行业专属工作流与合规规则——不是通用模型套壳，是真正理解你行业逻辑的专属 Agent。

真实场景与效果

审计底稿整理 Agent300+ 文件 × 17 类单据 → VL 批量识别 → 多层台账 → 科目勾稽场景 1 / 3

智能审计

用户指令

含共享目录、系统地址、账号与浏览器/客户端接管（示意），非纯网页对话

Agent 任务

刚接到的这个年审项目有点头疼——客户把一年的东西一股脑全丢过来了，300 多个文件、1200 多页，银行对账单、回单、增值税发票、合同、出入库单、固定资产卡片、费用报销单、关联方清单……总共 17 种单据全混在一起，有的是 PDF 有的是扫描图片还有几份是拍照的。全堆在项目 NAS `\\审计NAS\2024年审\A科技\01-原始资料\`，客户后来又补了一批放在百度企业网盘 `https://pan.example.com/s/xxxx`（示意），说让我们自己下载。项目经理让我明天出底稿初稿，根本来不及一张一张看。你先把网盘那批下载到 `02-补资料\`，然后把 300 多个文件全过一遍，按类型和期间分拣清楚，该识别的识别、该汇总的汇总，最后建出凭证级到科目级的多层台账，跟账面数对一下看差多少。拿不准的你标出来我复核就行。

Agent 执行步骤

1**环境准备与补充资料拉取**：确认 NAS 路径可访问（312 个文件 · 1,236 页），同时用浏览器下载客户补充资料 ZIP（38 个文件 · 142 页）解压至 `02-补资料\`，合并得到 **350 个文件 · 1,378 页**待处理
2**大规模 VL 分类引擎**：对全部 1,378 页启动 VL 语义理解（非逐字 OCR）——先按首页版式做粗分类（银行回单 vs 发票 vs 合同 vs 费用单据），再按内页特征细分为 17 类；处理过程中修正 48 处旋转 / 倾斜 / 骑缝章遮挡问题，23 处手写批注做联合推理识别
3**结构化字段批量抽取**：每类单据执行专属抽取模板——发票抽取票号/税率/金额/购销方、银行回单抽取流水号/收付方/金额/日期、合同抽取编号/甲乙方/标的/履约节点……共产出 **5,200+ 条结构化记录**，19 处低置信度条目进入复核队列
4**多层台账构建**：① 原始凭证与影像索引台账（文件→页→字段三维索引）→ ② 明细分类台账（按客户/供应商/项目/期间切面）→ ③ 科目余额衔接表（12 个审计科目）→ ④ 试算平衡与交叉勾稽层
5**科目级汇总与勾稽比对**：将台账第③层与客户提供的总账 / 明细账做多轮比对——货币资金核银行流水、应收核发票与合同与对账函、存货核出入库与成本结转、固定资产核卡片与折旧测算；输出 6 大科目的差异明细
6**异常标记与复核清单**：汇总 3 类典型异常（应付差异 ¥12,300 / 发票时点异常 2 笔 / 大额无凭证流出 ¥380,000），生成带穿透链接的复核清单供项目经理签字确认

示例输出清单

版式与字段为示意；附件名、页数与指标为演示数据。

审计底稿汇编（多科目多层）12 科目 · 4 层台账 · 含汇总/明细/勾稽XLSX

VL 结构化数据包350 文件 · 1,378 页 · 字段级溯源ZIP

异常与复核清单3 类异常 · 19 处低置信度PDF

📊 审计底稿自动整理报告（演示）

说明： 以下为演示数据，用于展示 Agent 对海量混合单据的 VL 分类、结构化抽取与多层台账自动构建能力；正式审计底稿以注册会计师复核签署为准。

被审计单位： A 科技有限公司 · 审计期间： 2024-01 ~ 2024-12 资料体量： 350 个文件 · 1,378 页 · 17 类单据 处理方式： 多模态 VL 批量语义理解（非传统 OCR）

一、资料识别与分类总览

文档类型	文件数	页数	VL 准确率	提取记录数	典型字段
银行对账单 / 回单	68	302	99.5%	4,860 条流水	流水号/收付方/金额/日期/摘要
增值税发票（专票+普票）	92	438	99.1%	412 张	票号/税率/金额/购销方/货物名
合同 / 订单	45	210	98.8%	62 份	编号/甲乙方/标的/履约节点/付款条件
费用报销单	38	76	98.2%	38 笔	报销人/日期/金额/审批人/附件数
出入库单	32	96	97.9%	128 条	物料/数量/单价/出入方向/仓库
固定资产卡片	18	54	98.5%	18 项	资产名/编号/原值/折旧方法/残值率
关联方清单及其他	57	202	97.3%	若干	关联方名称/关系/交易内容/金额
合计	350	1,378	平均 98.8%	5,200+ 条	—

Agent 在 VL 过程中自动修正了 48 处版式问题（旋转/倾斜/骑缝章遮挡），23 处手写批注通过 VL 联合推理识别为审批意见或金额修正；19 处低置信度条目已标注进入复核队列。

二、多层台账结构

台账采用 4 层递进架构，每层可穿透至下层原始影像坐标：

层级	名称	记录量	说明
L1	原始凭证与影像索引	5,200+ 行	文件→页→字段三维索引，支持点击跳转至扫描件坐标
L2	明细分类台账	约 2,800 行	按客户/供应商/项目/期间多维切面汇总
L3	科目余额衔接表	12 科目 × 14 期间	借/贷发生额、期初/期末余额、与总账轧差
L4	试算平衡与交叉勾稽	6 组对照	收入↔应收↔税金、采购↔应付↔存货等交叉校验

三、科目级汇总与比对

审计科目	底稿编号	台账汇总金额	账面金额	差异	状态
货币资金	A1-1	¥18,456,230.00	¥18,456,230.00	—	✅ 核对一致
应收账款	A2-1	¥5,832,100.00	¥5,832,100.00	—	✅ 核对一致
存货	A3-1	¥3,215,680.00	¥3,215,680.00	—	✅ 核对一致
固定资产	A4-1	¥2,180,000.00	¥2,180,000.00	—	✅ 核对一致
应付账款	B1-1	¥4,139,800.00	¥4,127,500.00	¥12,300	⚠️ 需穿透
营业收入	C1-1	¥24,680,000.00	¥24,680,000.00	—	✅ 核对一致

四、异常发现

⚠️ 在多层级汇总与交叉核对中发现 3 类典型异常：

异常类型	具体描述	涉及金额	穿透路径	建议处理
应付差异	台账与账面差 ¥12,300	¥12,300	L3 → L2 → L1 定位至 12 月暂估入库凭证	追查暂估冲回分录
发票时点异常	2 张进项票开票日早于合同签署日	¥86,500	L1 发票影像 ↔ 合同影像对比	触发穿行测试
大额无凭证流出	银行流出 ¥380,000 未找到匹配凭证	¥380,000	L1 银行回单 → L3 科目台账无对应	向客户函证确认

五、成果小结

整理耗时

约 5 分钟

人工平均 2~3 天

VL 准确率

98.8%

350 文件 · 1,378 页

结构化记录

5,200+

17 类单据

异常 / 复核

3 类 + 19 处

需项目经理确认

台账层级

4 层

凭证→明细→科目→勾稽

科目覆盖

12 个

5/6 已核对一致

以上为演示数据 · 不替代注册会计师的专业审计意见

演示数据页面中的数值、图表与附件名为效果示意；关键节点支持人工复核与覆盖。不替代注册会计师、律师等专业人士的签字与法定意见。

产品矩阵｜文档理解与系统操控

两大引擎协同，覆盖从「看懂」到「执行」的完整链路

文档智能引擎处理你的纸质与电子材料，超级自动化操控你的软件与系统——两者协同，构成 Agent 的眼睛和双手。

文档智能识别

不是传统 OCR 的逐字识别——VL 模型直接理解版面结构、表格层级与印章位置，对扫描件、拍照件、合同发票做语义级结构化抽取。

超级自动化

无需目标系统开放 API——Agent 像人一样操作浏览器、登录财务软件、填写政务表单，从数据获取到结果归档全链路自动化。

免费或付费，按需选择

社区版

个人首选 · 永久免费

适合初尝试 Agent 自动化的用户，用自然语言描述任务即可体验。

¥0/永久

一键启动 AI Agent（开箱即用）无需复杂配置，安装即可使用，3分钟上手你的第一个 Agent
内置基础 Skills 与插件开箱即用常用能力，覆盖日常办公与简单自动化需求
支持接入主流模型（可扩展）可自由配置 API Key，按需使用不同模型能力
完全免费使用（无时间限制）无试用期、无功能锁定，长期免费使用核心能力

最受欢迎

专业版

专业版订阅 · 支持多档选择

适合已经决定长期使用 Agent 的专业用户，可根据单台设备的预计用量选择合适的订阅档位。

¥500起

高阶 Skills 能力体系覆盖文档生成、数据处理、批量任务、自动整理等真实业务场景
长任务持续运行（自动产出结果）支持长时间任务执行，无需人工干预，适合复杂业务流程
高额度 Tokens 与稳定算力满足高频使用与复杂任务需求，无需频繁充值或中断
一对一技术支持（直连工程师）针对实际问题提供解决方案，而非标准化客服回复
企业级合规支持（发票与采购）支持正规发票与企业采购流程，适配公司报销与合规要求

企业版

大中型企业 · 深度落地

覆盖从业务流程到落地支持的全栈能力。

联系我们/单独报价

私有化部署 & 数据主权支持本地/专有云部署，数据、模型、流程全链路可控
深度系统集成能力（ERP / CRM / 行业系统）打通企业核心系统，实现AI“可执行”，而非仅对话
行业能力定制（MCP / Skill Graph）基于行业图谱构建专属能力，而非单点工具
AI落地咨询 + 流程重构从业务流程出发，设计可持续的AI应用体系

搜索文档