Copilot 中的 Analyst 分析师代理

admin 2025年6月1日17:39:23评论5 views字数 2010阅读6分42秒阅读模式

昨天我们介绍了 Researcher 和 Analyst 代理已在 Copilot 中可用:

Researcher 和 Analyst 代理已在 Copilot 中可用

今天继续详细阐述 Analyst 分析师代理的强大功能。

数据分析推理触手可及

Copilot 中的 Analyst 分析师代理

当大语言模型(LLM)和多模态系统不断革新信息工作,打通语言、代码、图像和语音的界限时,大量结构化的表格数据却仍未被充分利用——例如 Excel 表格、数据库、CSV 文件以及 Power BI 报告。这类数据往往不像文本或图像那样直观。想象一下,一位项目经理急需整理散落在多个 Excel 表中的季度绩效数据,还要从一份格式混乱的演示文稿中提取信息——部分关键指标隐藏在工作表中间,还有些 TSV 文件因导出错误,分隔符变成了逗号。这对不擅长数据处理的人而言,往往意味着数小时的困扰与错失洞察。而对掌握数据处理技能的人来说,这些杂乱的数据可以迅速被解析、提炼为关键洞察,形成竞争优势。

如果每个人都能拥有这种能力,会怎样?这正是我们推出 Analyst 的初衷。它是 Microsoft 365 Copilot 中首批智能推理代理之一,基于我们在 OpenAI 的 o3-mini 模型上微调的高级推理模型构建,扮演你的“虚拟数据科学家”,将强大的数据分析能力集成于 Microsoft 365,让数据洞察触手可及。

渐进式推理与问题解决的时代

传统 LLM 往往会过快地从问题跳到答案,难以灵活应对复杂情境或自我纠错。而 Analyst 背后的推理模型 借助 OpenAI o3-mini 的链式思维架构(Chain-of-Thought, CoT),通过“假设—测试—修正—适应”的方式逐步推进,模拟人类的分析思维。在每一步中生成并运行代码,使其能够不断探索信息、构建假设并自动纠错。

真实案例:杂乱数据的挑战

现实中的数据通常很混乱。假设你手头有两份数据集:

  • 数据集 A:一个 Excel 文件,包含多个工作表,关于全球互联网使用情况,关键数据位于第二个工作表的中间;

  • 数据集 B:一个 TSV 文件,表面上是制表符分隔,但由于导出错误,实际上用的是逗号。

任务很模糊:“帮我找出并可视化这两个数据集间有趣的洞察”。传统工具往往在这种情况下出错或卡顿。

Copilot 中的 Analyst 分析师代理

而 Analyst 的表现如下:

  • 快速识别 Excel 中隐藏的数据区域;

    Copilot 中的 Analyst 分析师代理
  • 自动列出所有工作表名称;

    Copilot 中的 Analyst 分析师代理
  • 识别并修复 TSV 文件中的分隔符问题;

    Copilot 中的 Analyst 分析师代理
  • 通过迭代假设验证,逐步探索数据,提炼出可操作洞察;

    Copilot 中的 Analyst 分析师代理
  • 自动生成分析结论和可视化图表,几乎无需人为引导。

    Copilot 中的 Analyst 分析师代理

如何实现:强化学习、结构化推理与动态代码执行

Analyst 的推理能力主要源自 强化学习(Reinforcement Learning) 的应用。我们在 OpenAI o3-mini 基础上进行后训练,引入规则奖励机制,强化其应对多步推理、信息递进发现和动态代码执行的能力。模型在训练过程中表现出“思考越多,表现越好”的特点。

它集成了 Python 代码的动态生成、执行与验证能力,在控制环境中实现“写—测—改”的闭环流程,逼近人类数据分析的工作逻辑。

数据与奖励体系的多样性设计

模型的表现离不开真实世界数据的支撑。我们设计了涵盖多种企业场景的数据集,覆盖的文件类型包括:Excel、CSV、TSV、JSON、XML、SQLite、PPT 等,任务种类从简单计算到预测建模再到假设构建。为防止强化学习中出现“奖励操控”(reward hacking)问题,我们采用更先进的评估机制,确保模型在探索过程中注重真实、准确的推理结果。

评测结果

我们在多个严苛的基准上测试了 Analyst 的能力,表现优异:

DABStep(多步数据推理测试集)

该测试集包含 450+ 个结构化与非结构化任务,分为简单与复杂任务。Analyst 模型在所有已知基准中表现最优,尤其在复杂推理任务中领先明显。

Copilot 中的 Analyst 分析师代理

注:当前 Analyst 以“Test1”匿名提交出现在 DABStep 公布榜单,我们已联系官方以更新命名为来自 Microsoft 的 Analyst 模型。

商业应用测试

相比传统 Copilot Chat(无深度推理能力),Analyst 在处理 Excel、CSV、PDF、XML、PPT 等常见企业文件时,在洞察生成、结构化查询与数据解读方面准确率显著更高,展现出变革性的价值。

Copilot 中的 Analyst 分析师代理

展望未来

我们对 Analyst 的潜力充满期待,致力于让每位 Microsoft 365 用户都能轻松拥有高级数据分析能力。未来我们将持续改进模型、提升与 Office 应用的融合度,优化交互体验,拓展支持的分析场景范围。

我们的目标是明确的:让每一位信息工作者都能成为数据分析高手,让“虚拟数据科学家”真正成为你的贴身助手,助你做出更快、更明智的决策。

如何快速开始享用 Copilot for Microsoft 365

端午节超级优惠活动,扫码添加微信,暗号:copilot

本文的两个代理,只能通过购买方案2或方案3固定账号来实现。

Copilot 中的 Analyst 分析师代理

原文始发于微信公众号(AI技术笔记):Copilot 中的 Analyst 分析师代理

免责声明:文章中涉及的程序(方法)可能带有攻击性,仅供安全研究与教学之用,读者将其信息做其他用途,由读者承担全部法律及连带责任,本站不承担任何法律及连带责任;如有问题可邮件联系(建议使用企业邮箱或有效邮箱,避免邮件被拦截,联系方式见首页),望知悉。
  • 左青龙
  • 微信扫一扫
  • weinxin
  • 右白虎
  • 微信扫一扫
  • weinxin
admin
  • 本文由 发表于 2025年6月1日17:39:23
  • 转载请保留本文链接(CN-SEC中文网:感谢原作者辛苦付出):
                   Copilot 中的 Analyst 分析师代理https://cn-sec.com/archives/4121201.html
                  免责声明:文章中涉及的程序(方法)可能带有攻击性,仅供安全研究与教学之用,读者将其信息做其他用途,由读者承担全部法律及连带责任,本站不承担任何法律及连带责任;如有问题可邮件联系(建议使用企业邮箱或有效邮箱,避免邮件被拦截,联系方式见首页),望知悉.

发表评论

匿名网友 填写信息