搜索文档

输入关键词,回车打开结果

OmniAgent · 不止于回答,而是执行

· ·

不止于对话

打开你的共享盘、遍历本地目录、批量处理文件 —— 不是"帮你想",是直接上手替你做

Feature 1

不止于文本

VL 视觉理解扫描件、拍照件、合同与发票 —— 看懂版面结构、印章位置、手写批注,不只是逐行读字

Feature 2

不止于建议

接管浏览器登录企业系统、RPA 操作财务软件、自动填报表单 —— 直接输出可交付的成果文件

Feature 3

Omni|核心能力架构

OmniAgent Features

部署在你的设备上,而非云端对话框。
拥有与你相同的系统操作权限——
读取文件 · 操控软件 · 登录系统 · 填写表单。
你描述目标,Agent 完成交付。

任务驱动执行引擎

任务驱动执行引擎

CORE
Task-Driven Execution

描述目标,Agent 自动规划路径、拆解步骤、逐一执行并验证结果——你收到的不是建议清单,而是已完成的交付物。

多模态视觉理解

多模态视觉理解

HOT
Visual Language Model

不依赖固定模板 OCR,VL 模型直接「看懂」扫描件与复杂表单——版面层级、印章位置、手写批注一并语义理解。

无接口跨系统操控

无接口跨系统操控

HOT
API-Free Automation

目标系统没有开放 API?Agent 像人一样操作浏览器、登录企业软件、填写表单——全程无需二次开发与系统对接。

多 Agent 协同调度

多 Agent 协同调度

Multi-Agent Orchestration

超大任务自动拆分为并行子流程,由专长各异的 Agent 协同推进——审计 Agent 整理底稿的同时,核对 Agent 已在比对流水。

持续记忆与上下文

持续记忆与上下文

Persistent Memory

跨任务记住你的科目体系、文件命名规则与操作习惯——第二次执行同类任务时自动复用经验,而非每次从零开始。

行业场景深度适配

行业场景深度适配

PRO
Industry-Grade Skills

内置审计、财务、法律、申报等行业专属工作流与合规规则——不是通用模型套壳,是真正理解你行业逻辑的专属 Agent。

真实场景与效果

审计底稿整理 Agent300+ 文件 × 17 类单据 → VL 批量识别 → 多层台账 → 科目勾稽场景 1 / 3
智能审计

用户指令

含共享目录、系统地址、账号与浏览器/客户端接管(示意),非纯网页对话

Agent 任务

刚接到的这个年审项目有点头疼——客户把一年的东西一股脑全丢过来了,300 多个文件、1200 多页,银行对账单、回单、增值税发票、合同、出入库单、固定资产卡片、费用报销单、关联方清单……总共 17 种单据全混在一起,有的是 PDF 有的是扫描图片还有几份是拍照的。全堆在项目 NAS `\\审计NAS\2024年审\A科技\01-原始资料\`,客户后来又补了一批放在百度企业网盘 `https://pan.example.com/s/xxxx`(示意),说让我们自己下载。项目经理让我明天出底稿初稿,根本来不及一张一张看。你先把网盘那批下载到 `02-补资料\`,然后把 300 多个文件全过一遍,按类型和期间分拣清楚,该识别的识别、该汇总的汇总,最后建出凭证级到科目级的多层台账,跟账面数对一下看差多少。拿不准的你标出来我复核就行。

Agent 执行步骤

  1. 1**环境准备与补充资料拉取**:确认 NAS 路径可访问(312 个文件 · 1,236 页),同时用浏览器下载客户补充资料 ZIP(38 个文件 · 142 页)解压至 `02-补资料\`,合并得到 **350 个文件 · 1,378 页**待处理
  2. 2**大规模 VL 分类引擎**:对全部 1,378 页启动 VL 语义理解(非逐字 OCR)——先按首页版式做粗分类(银行回单 vs 发票 vs 合同 vs 费用单据),再按内页特征细分为 17 类;处理过程中修正 48 处旋转 / 倾斜 / 骑缝章遮挡问题,23 处手写批注做联合推理识别
  3. 3**结构化字段批量抽取**:每类单据执行专属抽取模板——发票抽取票号/税率/金额/购销方、银行回单抽取流水号/收付方/金额/日期、合同抽取编号/甲乙方/标的/履约节点……共产出 **5,200+ 条结构化记录**,19 处低置信度条目进入复核队列
  4. 4**多层台账构建**:① 原始凭证与影像索引台账(文件→页→字段三维索引)→ ② 明细分类台账(按客户/供应商/项目/期间切面)→ ③ 科目余额衔接表(12 个审计科目)→ ④ 试算平衡与交叉勾稽层
  5. 5**科目级汇总与勾稽比对**:将台账第③层与客户提供的总账 / 明细账做多轮比对——货币资金核银行流水、应收核发票与合同与对账函、存货核出入库与成本结转、固定资产核卡片与折旧测算;输出 6 大科目的差异明细
  6. 6**异常标记与复核清单**:汇总 3 类典型异常(应付差异 ¥12,300 / 发票时点异常 2 笔 / 大额无凭证流出 ¥380,000),生成带穿透链接的复核清单供项目经理签字确认

示例输出清单

版式与字段为示意;附件名、页数与指标为演示数据。

审计底稿汇编(多科目多层)12 科目 · 4 层台账 · 含汇总/明细/勾稽XLSX
VL 结构化数据包350 文件 · 1,378 页 · 字段级溯源ZIP
异常与复核清单3 类异常 · 19 处低置信度PDF

📊 审计底稿自动整理报告(演示)

说明: 以下为演示数据,用于展示 Agent 对海量混合单据的 VL 分类、结构化抽取与多层台账自动构建能力;正式审计底稿以注册会计师复核签署为准。

被审计单位: A 科技有限公司 · 审计期间: 2024-01 ~ 2024-12 资料体量: 350 个文件 · 1,378 页 · 17 类单据 处理方式: 多模态 VL 批量语义理解(非传统 OCR)


一、资料识别与分类总览

文档类型 文件数 页数 VL 准确率 提取记录数 典型字段
银行对账单 / 回单 68 302 99.5% 4,860 条流水 流水号/收付方/金额/日期/摘要
增值税发票(专票+普票) 92 438 99.1% 412 张 票号/税率/金额/购销方/货物名
合同 / 订单 45 210 98.8% 62 份 编号/甲乙方/标的/履约节点/付款条件
费用报销单 38 76 98.2% 38 笔 报销人/日期/金额/审批人/附件数
出入库单 32 96 97.9% 128 条 物料/数量/单价/出入方向/仓库
固定资产卡片 18 54 98.5% 18 项 资产名/编号/原值/折旧方法/残值率
关联方清单及其他 57 202 97.3% 若干 关联方名称/关系/交易内容/金额
合计 350 1,378 平均 98.8% 5,200+ 条

Agent 在 VL 过程中自动修正了 48 处版式问题(旋转/倾斜/骑缝章遮挡),23 处手写批注通过 VL 联合推理识别为审批意见或金额修正;19 处低置信度条目已标注进入复核队列。


二、多层台账结构

台账采用 4 层递进架构,每层可穿透至下层原始影像坐标:

层级 名称 记录量 说明
L1 原始凭证与影像索引 5,200+ 行 文件→页→字段三维索引,支持点击跳转至扫描件坐标
L2 明细分类台账 约 2,800 行 按客户/供应商/项目/期间多维切面汇总
L3 科目余额衔接表 12 科目 × 14 期间 借/贷发生额、期初/期末余额、与总账轧差
L4 试算平衡与交叉勾稽 6 组对照 收入↔应收↔税金、采购↔应付↔存货等交叉校验

三、科目级汇总与比对

审计科目 底稿编号 台账汇总金额 账面金额 差异 状态
货币资金 A1-1 ¥18,456,230.00 ¥18,456,230.00 ✅ 核对一致
应收账款 A2-1 ¥5,832,100.00 ¥5,832,100.00 ✅ 核对一致
存货 A3-1 ¥3,215,680.00 ¥3,215,680.00 ✅ 核对一致
固定资产 A4-1 ¥2,180,000.00 ¥2,180,000.00 ✅ 核对一致
应付账款 B1-1 ¥4,139,800.00 ¥4,127,500.00 ¥12,300 ⚠️ 需穿透
营业收入 C1-1 ¥24,680,000.00 ¥24,680,000.00 ✅ 核对一致

四、异常发现

⚠️ 在多层级汇总与交叉核对中发现 3 类典型异常:

异常类型 具体描述 涉及金额 穿透路径 建议处理
应付差异 台账与账面差 ¥12,300 ¥12,300 L3 → L2 → L1 定位至 12 月暂估入库凭证 追查暂估冲回分录
发票时点异常 2 张进项票开票日早于合同签署日 ¥86,500 L1 发票影像 ↔ 合同影像对比 触发穿行测试
大额无凭证流出 银行流出 ¥380,000 未找到匹配凭证 ¥380,000 L1 银行回单 → L3 科目台账无对应 向客户函证确认

五、成果小结

整理耗时
约 5 分钟
人工平均 2~3 天
VL 准确率
98.8%
350 文件 · 1,378 页
结构化记录
5,200+
17 类单据
异常 / 复核
3 类 + 19 处
需项目经理确认
台账层级
4 层
凭证→明细→科目→勾稽
科目覆盖
12 个
5/6 已核对一致

以上为演示数据 · 不替代注册会计师的专业审计意见

演示数据页面中的数值、图表与附件名为效果示意;关键节点支持人工复核与覆盖。不替代注册会计师、律师等专业人士的签字与法定意见。

产品矩阵|文档理解与系统操控

两大引擎协同,覆盖从「看懂」到「执行」的完整链路

文档智能引擎处理你的纸质与电子材料,超级自动化操控你的软件与系统——两者协同,构成 Agent 的眼睛和双手。

文档智能识别

文档智能识别

不是传统 OCR 的逐字识别——VL 模型直接理解版面结构、表格层级与印章位置,对扫描件、拍照件、合同发票做语义级结构化抽取。

超级自动化

超级自动化

无需目标系统开放 API——Agent 像人一样操作浏览器、登录财务软件、填写政务表单,从数据获取到结果归档全链路自动化。

Product Process

免费或付费,按需选择

社区版

社区版

个人首选 · 永久免费

适合初尝试 Agent 自动化的用户,用自然语言描述任务即可体验。

¥0/永久

  • 一键启动 AI Agent(开箱即用)无需复杂配置,安装即可使用,3分钟上手你的第一个 Agent
  • 内置基础 Skills 与插件开箱即用常用能力,覆盖日常办公与简单自动化需求
  • 支持接入主流模型(可扩展)可自由配置 API Key,按需使用不同模型能力
  • 完全免费使用(无时间限制)无试用期、无功能锁定,长期免费使用核心能力
最受欢迎
专业版

专业版

专业版订阅 · 支持多档选择

适合已经决定长期使用 Agent 的专业用户,可根据单台设备的预计用量选择合适的订阅档位。

¥500

  • 高阶 Skills 能力体系覆盖文档生成、数据处理、批量任务、自动整理等真实业务场景
  • 长任务持续运行(自动产出结果)支持长时间任务执行,无需人工干预,适合复杂业务流程
  • 高额度 Tokens 与稳定算力满足高频使用与复杂任务需求,无需频繁充值或中断
  • 一对一技术支持(直连工程师)针对实际问题提供解决方案,而非标准化客服回复
  • 企业级合规支持(发票与采购)支持正规发票与企业采购流程,适配公司报销与合规要求
企业定制版

企业版

大中型企业 · 深度落地

覆盖从业务流程到落地支持的全栈能力。

联系我们/单独报价

  • 私有化部署 & 数据主权支持本地/专有云部署,数据、模型、流程全链路可控
  • 深度系统集成能力(ERP / CRM / 行业系统)打通企业核心系统,实现AI“可执行”,而非仅对话
  • 行业能力定制(MCP / Skill Graph)基于行业图谱构建专属能力,而非单点工具
  • AI落地咨询 + 流程重构从业务流程出发,设计可持续的AI应用体系

零配置、低门槛、输入需求即可开启智能体协作