跳到主要内容

3 篇博文 含有标签「automation」

查看所有标签

构建软件“超级工厂 (Gigafactory)”

· 阅读需 2 分钟

1. 结果导向:闭环自愈 (Autonomous Debugging)

交付结果,而非过程。 AI 必须具备从发现漏洞到自我修复的完整闭环。无论是调用 curl 诊断还是检索日志,AI 应独立解决故障并生成测试用例证明其正确性。管理者只看最终产出,不介入中间逻辑。

2. 效率度量:Token 吞吐量 (Token-Measured Productivity)

消耗即产出。 重新定义生产力:每个月消耗的 Token 数量是衡量效率的唯一硬指标。通过衡量单人支撑的 $200/mo 订阅数或同时驱动的 Agent 集群规模,实现生产力的指数级跃迁。

3. 驱动模式:从响应到自发 (Proactive Autonomy)

打破“指令-响应”循环。 顶级的 AI 系统不应等待人类唤醒。它应当具备自主观察、自主决策和自发执行的能力,在无人监督的真空期内持续创造价值。

4. 容错架构:混沌中的秩序 (Resilient Architecture)

以架构约束灵活性。 构建“容错性”极强的底层架构。即便 AI 在局部逻辑上“乱搞”,也会被稳固的系统框架限制在安全区内。好的架构赋予 AI 犯错的自由,同时确保系统整体不崩盘。

5. 资产形态:可堆叠的能力模块 (Modular Progress)

能力即资产。 AI 的能力必须数字化、可测量、可进化。通过模块化设计,确保每一项新开发的能力都能像积木一样被复用、组合,形成不断叠加的竞争壁垒。

6. 边界扩张:全栈数字化劳动力 (Omni-Agent Factory)

无边界替代。 压榨 AI 的每一滴潜力。从代码编写到视频生产,再到社交媒体自动化管理。目标是将公司转型为一个高度自动化的超级工厂,人类则是这座工厂的首席架构师。

7. 演进逻辑:先实现,再简化 (Invent and Simplify)

以终为始,暴力突破。 不为过度设计买单。先用最直接(甚至笨拙)的方式发明出服务客户的产品,在跑通商业闭环后,再通过技术手段进行精简与重构。

AI 销售开发代表的承诺与痛苦:实地报告

· 阅读需 5 分钟

在不断优化销售渠道的过程中,AI 销售开发代表(AI SDRs)已成为 2025 年最热门的工具之一。它们承诺通过自动化潜在客户开发和大规模个性化外联,在不增加人力的情况下,将合格的会议安排到你的日历上。

但它们真的兑现了承诺吗?

在与数十位销售领导者交谈并深入研究 G2、Reddit 和 Slack 社区的数百条评论后,我发现了一个比炒作更复杂的故事。

AI 销售开发代表

11 倍问题:高期望,混合结果

11x.ai 已成为这一领域的典型代表,声称可以让 SDRs 的生产力提高“11 倍”。这是一个大胆的承诺,并设定了很高的标准。

“一位销售总监告诉我:‘我期望 AI 能像初级代表一样研究每个潜在客户,但我得到的只是填入公司名称的填空游戏。’”

这并不是个例。在论坛和客户聊天中,一个共同的主题浮现:邮件感觉自动化、模板化,往往过于通用而无法奏效。

而当潜在客户回复时?AI 往往会出错。正如一位 Reddit 用户所说:

“它可以整天发送邮件,但一旦有人说出意料之外的话,它就短路了。”

这留下了一个奇怪的交接体验——潜在客户以为他们在与人类聊天,但当实际代表在对话中途介入时,他们感受到了变化。

实际有效的地方

尽管有挫折,AI SDRs 在某些方面确实表现出色:

  • 外联量:团队一致报告说,漏斗顶端活动大幅增加。一支欧洲团队告诉我,他们现在可以通过 AI 代表“全天候”跨时区进行外联。
  • 潜在客户开发帮助:像 11x.ai 这样的工具在寻找潜在客户方面表现不错。“它找到的联系人列表比预期的要好,”一位德国用户说。
  • 个性化见解:Humantic AI 以惊人的准确个性化档案给多个团队留下了深刻印象。“就像为第一次通话准备了作弊码,”一位 G2 评论者说。
  • 实时辅导:Cresta 采取不同的方法——实时辅导人类 SDRs,而不是取代他们。这对于新代表的入职培训或提高通话质量特别有用,而无需聘请全职培训师。

超越性能:隐藏的痛点

超越功能问题,更深层次的结构性问题开始浮现:

  • 锁定合同:大多数平台要求每年 35,000 至 60,000 美元的承诺,几乎没有试用的机会。“我们被一个对我们不起作用的工具困住了,”一位买家说。
  • 技术故障:从错误到延迟的仪表板,用户——尤其是在欧洲——报告了破坏工作流程的可靠性问题。
  • 定制限制:如果你的受众是小众或信息复杂,AI 往往会遇到困难。“我们调整了好几周,”一位 B2B SaaS 高管说。“邮件仍然感觉很通用。”
  • 数据安全担忧:随着敏感客户数据流经这些系统,几家大公司对其信息可能如何使用或重用表示担忧。

战略困境:构建、购买还是增强?

鉴于权衡,销售领导者以三种方式接近 AI SDRs:

  • 全力以赴者:通常是快速移动、高量的组织,优先考虑规模。他们愿意接受 AI 的粗糙边缘。
  • 增强者:使用 AI 支持(而不是取代)代表的团队。他们使用像 Regie.ai 这样的工具来撰写邮件,使用 Humantic 来准备通话,并让人类控制对话。
  • DIY 构建者:技术娴熟的组织在 GPTs 和内部数据之上构建自定义工作流程。虽然工作量更大,但这让他们拥有控制权并避免供应商锁定。

需要改进的地方

要从“有趣”变为不可或缺,AI SDR 供应商需要在几个方面取得实质性进展:

  1. 处理对话,而不仅仅是介绍——最大的差距在于后续。如果 AI 无法自然回应,幻觉就会破裂。
  2. 超越模板——真正的个性化应该参考真实的业务背景,而不仅仅是职位和公司名称。
  3. 使定价更灵活——团队希望在承诺六位数之前进行试验。
  4. 修复用户体验——更好的入职培训、更快的加载时间和更少的错误将大有帮助。
  5. 允许更深层次的定制——为公司提供工具,以教授 AI 他们的价值主张、信息框架和产品细微差别。

未来发展方向

市场似乎正在分裂为两个方向:

  • 垂直 AI SDRs:针对医疗、金融或制造业语言、工作流程和法规进行培训的行业特定工具。
  • 轻量级助手:支持代表撰写、潜在客户开发和通话准备的更实惠工具——而不是假装取代他们。 a 那些倾向于增强而非自动化的公司可能最终会建立更可持续的业务。

底线

AI SDRs 是企业 AI 炒作周期的经典例子。其推销——一个无限可扩展的数字销售团队——是不可抗拒的。但现实仍在追赶。

对于大多数团队来说,今天的明智之举是有针对性的增强: 让 AI 做它擅长的事情——潜在客户开发、撰写、支持——同时让人类参与处理异议、关系建立和成交。

因为在销售中,就像在生活中一样,人情味仍然很重要。也许现在比以往任何时候都更重要。

你使用过 AI SDRs 吗?你的体验如何——值得炒作还是为时过早?

企业工作流代理

· 阅读需 3 分钟

关键主题和背景

企业工作流

  • 自动化水平从脚本化工作流(变化最小)到代理工作流(自适应和动态)。
  • 企业环境,如由 ServiceNow 支持的环境,涉及复杂的重复性任务,如 IT 管理、CRM 更新和日程安排。
  • 采用 LLM 驱动的代理(例如,API 代理Web 代理)通过利用多模态观察动态行动等能力来改造这些工作流。

用于企业工作流的 LLM 代理

  • API 代理
    • 利用结构化的 API 调用提高效率。
    • 优点:低延迟,结构化输入。
    • 缺点:依赖预定义的 API,适应性有限。
  • Web 代理
    • 模拟人在网页界面上的操作。
    • 优点:更大的灵活性;可以与动态 UI 交互。
    • 缺点:高延迟,容易出错。

WorkArena 框架

  • 真实的企业工作流设计的基准。
  • 任务范围从IT 库存管理预算分配员工离职管理
  • BrowserGymAgentLab 支持,在模拟环境中进行测试和评估。

技术框架

代理架构

  • TapeAgents 框架

    • 将代理表示为可恢复的模块化状态机
    • 具有结构化日志(“磁带”)用于记录动作、思考和结果。
    • 促进优化(例如,从教师到学生代理的微调)。
  • WorkArena++

    • 扩展 WorkArena,增加更多组合性和挑战性的任务。
    • 评估代理的能力,如长期规划多模态数据集成

基准

  • WorkArena:约 20k 个独特的企业任务实例。
  • WorkArena++:专注于组合工作流和数据驱动的推理。
  • 其他工具:MiniWoB、WebLINX、VisualWebArena。

评估指标

  • GREADTH(扎根、响应、准确、纪律、透明、帮助)
    • 优先考虑现实世界代理的性能指标。
  • 任务特定成功率
    • 例如,通过微调的学生评估表单填写助手的成本比 GPT-4 低 300 倍

工作流中代理的挑战

  • 上下文理解
    • 企业任务需要理解信息的深层层次结构(例如,仪表板、知识库)。
    • 基准中的稀疏奖励使学习复杂化。
  • 长期规划
    • 子目标分解和多步骤任务执行仍然困难。
  • 安全和对齐
    • 来自恶意输入的风险(例如,对抗性提示、隐藏文本)。
  • 成本和效率
    • 缩小上下文窗口和模块化架构是降低计算成本的关键。

未来方向

增强模型

  • Centaur 框架
    • 将 AI 与人类任务分开(例如,AI 负责内容收集,人类负责最终编辑)。
  • Cyborg 框架
    • 促进 AI 和人类之间的紧密合作。

统一评估

  • 呼吁建立一个元基准来整合跨平台的评估协议(例如,WebLINX、WorkArena)。

代理优化的进展

  • 利用 RL 启发的技术进行微调。
  • 模块化学习框架以提高泛化能力。

知识工作的机会

  • 自动化重复的、低价值的任务(例如,日程安排、报告生成)。
  • 将多模态代理集成到企业环境中以支持决策和战略任务。
  • 通过人机协作模型提高生产力。

这一综合内容连接了企业工作流代理的理论和实践元素,展示了其变革潜力,同时解决了当前的局限性。