免邀请码!实在智能发布通用智能体,可操作一切软件/APP完成工作

2023 年,人工智能产业迎来里程碑式突破,开源智能体 Auto-GPT 以 7.28 万个 GitHub 星标的耀眼成绩,首次将大模型从概念验证推向商业落地的产业思考。同年 8 月,国内 AI 领军企业实在智能率先推出行业首个“大模型+RPA”智能体产品 TARS-RPA-Agent,实现从 “工具型” 问答到 “伙伴型” 执行的范式革命。

历经 20 个月的迭代优化,融合 4000+客户的行业 Know-How,全新智能体焕新而来。2025 年 3 月 20 日,实在智能召开第八次新品发布会,正式推出 “自主感知环境、规划路径、自动操作一切软件/APP,支持端到端全流程商业场景闭环” 的通用智能体——实在 Agent。

下面,小编将通过典型场景案例与详实数据,带您沉浸式体验基于大模型的 “企业大脑+实在Agent” 所带来的 “智能化+自动化+知识技能沉淀” 三位一体的企业新质生产力体系。

实在智能RPA

免邀请码!实在智能发布通用智能体,可操作一切软件/APP完成工作

与AI共舞,掌控万物

新品发布会开场致辞中,实在智能创始人兼 CEO 孙林君(阿宝)表示,大模型与智能体技术的深度融合正在重构技术与社会的交互范式。通过整合多模态交互、自动化工具矩阵(如 RPA)及垂直领域知识沉淀,智能体系统已实现从“需求理解” 到 “任务执行” 的全流程闭环。“实在智能通过三大核心技术突破,构建起具备自主决策能力的数字生命体 —— 实在 Agent,为企业智能化转型提供可落地、可进化、可扩展的全栈式解决方案。”

针对通用智能体的技术标准,孙林君提出两项核心指标:首先是基础大模型需实现多模态语义理解与行业知识图谱的深度融合;其次是底层工具链要具备操作系统级的全场景覆盖能力。

“实在智能的愿景是让每个人、每家企业都拥有专属的数字员工,无需依赖 API 即可实现跨系统协作。” 他强调,随着智能体技术的持续进化,未来将构建 “与 AI 共舞,掌控万物” 的智能生态,推动人机协作进入决策协同的新纪元。

实在Agent推理底座——TARS大模型

在新品发布会上,实在智能合伙人兼核心算法部负责人欧阳小刚(新一)系统性阐述了构建通用智能体的三大核心技术体系——「理解和推理能力」、「链接能力」、「适应能力」。

① 类人级的语言理解和逻辑推理能力

TARS 大模型作为实在 Agent 的推理能力底座,提供了趋近人类思维的理解能力,无论是清晰的用户命令,还是简单的一句描述,实在 Agent 都可以将其拆分成多个可以执行的子任务或者步骤。

  • 在步骤拆解和组件生成能力上,TARS 大模型的准确率超过了 GPT-4 和 DeepSeek;
  • 在中文理解能力上,TARS 大模型与各个 SOTA 模型旗鼓相当并在部分领域保持领先;
  • 实现全栈国产化适配,支持英伟达、昇腾及国产自主架构的训练与微调部署

② 支持操作任意工具的无限链接能力

实在智能自研的流程自动化引擎和多模态大模型 TARS-VL,提供了对数字化办公世界的网页、软件、接口、文档、SDK 等任意工具的链接能力。

同时,实在智能构建了规模庞大、设计精妙的 GUI Agent 流程数据集用于模型训练和微调,并通过引入视觉 CoT 策略,进一步促进大模型思考推理能力与实际应用的深度融合,大幅提升模型的智能化水平与执行效能。,时长00:35

在技术攻坚与创新层面,实在智能还引入 “可变形矩形卷积和卷积核分配” 等创新性技术理念,并以此为基础成功训练出多个辅助检测模型。

在针对各类屏幕 GUI 元素理解和定位能力的测试集中,TARS-VL 的卓越性能得以充分彰显。

经测试比对,TARS-VL 准确率相较于 GPT-4o 高出 4%,与其他开源模型相比,更是领先达 10%,以绝对优势在同类型模型中脱颖而出。

此外,在另外两个开源的 benchmark 数据集—— mind2web 和 screenspot 上进行测试,效果同样令人振奋:

  • 在 mind2web 数据集上,TARS-VL 在 Task、Domain 和 Web 三个场景上的元素匹配准确率,比 GPT-4o、Ominiparser、Claude 等模型高出 10%;
  • 在 screenspot 数据集上,TARS-VL 的元素匹配准确率也保持遥遥领先。

③ 快速落地实际场景的适应能力

区别于常见的端到端或大模型+API 的解决方案,实在智能通过自动仿真技术开展特定场景的强化训练,显著优化了识别与拆解效果。

具体来说,围绕超 1000 款常用软件,实在智能试验了自动化构建与强化训练的技术路线,同时运用自动仿真技术,高效模拟用户行为,详实记录环境信息。

依托这些技术,实在 Agent 将特定软件的构建周期大幅缩短至 3 – 5 天,有力提升了其在真实业务场景中的落地应用能力。

在增强实在 Agent 稳定性与实用性上,实在智能同样开展了诸多工程创新:运用多模型混合策略,有效应对企业长尾需求,降低企业对硬件资源的依赖;训练不同参数规模的模型,适配客户在端侧与云侧的不同硬件配置;整合 DeepSeek、企业大脑以及实在 Agent,推出软硬件一体化解决方案。

  • 多参数模型:高配版 67B 模型适用于私有云、机房集群、高性能服务器等中心化部署的需求,轻量版 7B 轻量版模型则支持 AIPC、智能手机、智能车机等端侧部署的需求;
  • 软硬件整体解决方案:
    • 一体机支持:涵盖通用环境与国产信创环境,包括华为昇腾、鲲鹏系列一体机;
    • 其他一体机:与天翼云、拓维信息、浪潮信息、首都在线等合作推出的一体机产品;
    • 个人 PC 和服务器一体机:与惠普联合打造的 Z 系列数字员工 Agent 及数字员工一体机;
    • 云电脑解决方案:携手天翼云推出实在 Agent 云电脑解决方案,该方案将同步上架天翼云电脑平台。

,时长00:26

通用智能体——实在Agent

从零创业六年以来,实在智能始终专注于将 AI 技术与超自动化产品(RPA /IPA)深度融合,并不断创新迭代,助力人机协同。

公司在业内首创的 “一种 RPA 元素智能融合拾取的方法与系统(专利号:ZL202110944521.2)” 荣获中国专利奖,实现了对所有软件的精细化操控。围绕该技术,实在智能进一步首创 “智能屏幕语义理解” 技术(ISSUT),大幅提升了屏幕识别的精准度与效率,成功突破了 “人人可用” 以及 “数字员工大规模可靠应用” 的行业壁垒。

步入智能体时代,实在智能不断探索 “智能体产品如何能够让用户直观上手、简单易用,同时又具备可控、稳定、高效的特性,以便可以在真实商业应用场景实现端到端落地价值”。

经过持续迭代优化,全新的实在 Agent 智能体带来了使用范式的全面革新。在发布会上,实在智能 Agent 首席产品专家张译颢(拓海)对产品创新特性与亮点进行了详细解读。

① 低门槛使用

  • 零配置启动:无需安装复杂插件或特定浏览器(如Chrome扩展),仅需下载单一客户端(支持Windows/Linux),安装后直接登录即可使用;
  • 账号无缝衔接:新用户注册即享完整功能,老用户账号自动同步历史数据与配置。

② 简单交互设计

  • 全场景入口:通过快捷键(如Ctrl+SPACE)一键唤起智能体,支持语音输入、文本输入、文件拖拽(如Excel/PDF)三种交互方式;
  • 意图精准解析:基于自然语言处理(NLP)技术,支持模糊指令(如“帮我整理上周销售数据”)自动拆解为任务步骤(数据采集→清洗→生成报表)。

③ 实时过程掌控

  • 透明化执行:任务执行中实时显示进度条与操作日志(如“正在登录系统→提取数据→生成图表”);
  • 动态干预:用户可随时暂停任务、修改参数(如调整筛选条件)、切换执行路径,无需从头开始;
  • 独立沙盒环境:智能体在隔离桌面环境中运行,避免与用户当前工作冲突,支持并行操作(如边写文档边让Agent处理数据)。

,时长00:13

实在 Agent 并非仅仅局限于作为单一的使用终端,更是一个功能完备的创作平台。用户在运用实在 Agent 的过程中,能够以其生成的产物为基础,借助全新封装的模型技能库与便捷的编排工具,开发契合自身专属业务需求的 AI 智能体。

实在 Agent 智能体搭建平台具备以下多元功能:

① RPA与AI深度融合

  • 画布升级:传统RPA流程画布升级为“智能体画布”,新增自然语言节点(用户语音指令)、大模型推理节点(自动生成代码)、API调用节点(集成外部服务);
  • 一键迁移:存量RPA流程(如财务对账、订单处理)可一键转换为智能体形态,保留原有逻辑并增强AI能力。

,时长00:16

② 灵活开发与协作

技能库开放:提供预训练模型技能库(如 OCR 识别、情感分析、数据预测),支持用户自定义技能封装(如企业专用审批流程);

智能体网络:企业内多个智能体可相互调用(如 HR 智能体调用财务智能体生成薪资报表),形成业务闭环。

企业级智能体解决方案——企业大脑

实在Agent智能体,不仅是个人助理,更支持通过沉淀知识和技能,打造企业级智能体解决方案——企业大脑。

具备“信息查询、深度思考、联网搜索、文案生成、代码生成”等能力的智能体可以支持 C 端用户完成某项工作,或者执行其中某个环节。但面对多人协作、链路长环节重的真实商业场景,多系统多平台复杂的企业生产环境,这类智能体很难发挥作用,满足实际商业需求。

在本次发布会上,实在智能产品创新负责人周春照(索隆)深度解读了「企业大脑」,其具备以下四大核心能力与服务:

① 专属的知识库RAG

企业可以将文档(产品说明、公司规章)、数据(经营数据、绩效数据)、系统(CRM、ERP)以及业务操作的“技能”,沉淀到企业大脑。同时,每位员工也都很方便地在企业大脑中贡献岗位知识、工作技能为其他同事所调用。

② 专属业务系统操作知识

不同企业可依托自身已有系统(业务系统、管理系统、客户系统、运营系统等),构建、生成与自身业务相关的自动化操作流程(数字员工、软件机器人),每个员工通过实在 Agent 可随时轻松调用。

③ 支持模型接入

实在Agent具备成本可控、安全可用、灵活接入等特点,企业可根据自身业务特性选择最适合的大模型,或接入根据自身业务微调过的各种大模型。

④ 支持私有化部署

与实在Agent配套的数字员工运营管理平台可在多种环境中私有化部署,支持国产化适配,具备账号授权、角色管理、同步企业组织结构等多种功能。,时长00:58

口袋AI助手——手机端Agent

除了在 PC 端的广泛应用,AI 正朝着 “口袋化” 方向大步迈进。

早在 2024 年 2 月,实在智能便率先开启探索之旅,将实在 Agent的强大能力拓展至手机端、平板、车机等移动设备领域。从 “你说 PC 做,所说即所得” 进化为 “你说,手机做” ,用户仅需简单一句话,实在 Agent就能迅速响应,自动操作电脑、手机中的各类软件。

历经一年多持续技术迭代,手机端的实在 Agent也迎来了意义非凡的重磅更新。在发布会上,实在智能创新研发负责人赵明(鸣人)现场展示了创新技术与实用功能 :

① 新技术

  • 原子技能架构,重构手机操作逻辑:基于 PC 端屏幕语义理解技术 ISSUT,重构手机端元素识别能力,并从底层进行原子化封装,为“手机 TARS 助手”(手机端实在Agent)交互、流程调度提供技术依赖;
  • 模型驱动决策,智能体持续进化:通过模型驱动决策的方式,实现手机 TARS 助手“需求拆解、路径规划、反馈学习”的完整闭环;
  • 双模交叉执行,智能体运行更顺畅:基于视觉理解+UI 结构分析,智能体大模型和视觉理解小模型交叉执行,让智能体流程运行更顺畅。

② 新功能

  • 流程市场:提供了丰富的自动化流程,用户可以根据需要自主调用
  • 任务调度:通过定时执行、API 触发等方式,满足 B 端用户使用手机智能体辅助办公的需求
  • 云端控制:手机 TARS 助手可以控制云端智能体运行 PC 端的任务,实现智能体 7×24 小时永不掉线

从 2020 年发出第一声 “Hello,数字员工” 的问候,到 2025 年推出 “你说 PC / 手机 / 车机做,所说即所得” 的实在 Agent,短短五年间,实在智能在通过数字员工助力客户提质降本增效、解决真实商业场景痛点堵点的过程中,始终坚持产品迭代和技术创新,不断推动 AI 实实在在的落地应用。

被需要的智能才是实在的智能!

此刻,没有内测、无需邀请码,实在智能面向个人用户、企业用户、生态伙伴全面开启实在 Agent 体验通道:

即刻体验

  • 个人用户:下载客户端即享 30 天高级功能试用(含流程市场全技能),下载链接:https://www.ai-indeed.com/downloadCenter
  • 企业用户:申请免费 POC 测试,提供专属部署方案与技术支持,申请链接:https://www.ai-indeed.com/caseOfClients?applySource

生态合作

  • 一体机解决方案:如,联合华为推出 “实在Agent+昇腾芯片” 一体机,性能较通用服务器提升 40%;联合惠普(HP)推出真正的“AI PC”;
  • 开发者激励:开放 API 与技能开发工具包,优秀开发者可获最高 10 万元奖励。

后续,实在智能将逐步开放实在Agent在各类智能硬件(人形机器人、机器狗、车机、智能家居、VR 眼镜……)上的使用功能。届时,实在 Agent 将全方位融入生活工作,用AI掌控万物。

按照惯例,我们不说再见,下一次实在智能产品发布会,与您在更高峰相见!

1.本内容作为作者独立观点,不代表RPA学习天地立场,RPA学习天地仅提供信息存储空间服务。

2.如果对本稿件有异议或投诉,请联系客服微信号。