从 Demo 到上线:Agent 还差一套工程化底座

时间:2026-07-02 08:53:48 来源:互联网

当前团队在模型与框架方面已有诸多积累,但Agent从Demo走向生产仍需完整的工程化底座作为支撑。EdgeOne Makers将Agent runtime、沙箱工具、认证方案等能力整合于一体,为开发者提供了应用部署的集成交付方案。

从官方文档来看,它覆盖了Agent runtime、沙箱工具、会话存储、调用追踪、模型接入、Serverless Functions、Git部署和认证方案,更像一套Agent应用部署底座。

先说结论

目前搭建Agent Demo已经相对便捷。只要一个前端界面、一个模型API、若干提示词以及数个工具调用,即可快速启动。但后续面临的工程挑战更为复杂:

  1. Agent应该在何处运行?
  2. 如何维持多轮任务的会话连续性?
  3. 如何避免长任务因普通请求超时而中断?
  4. 工具执行是否需要沙箱隔离?
  5. 模型密钥应如何管理?
  6. 调用链路是否可追踪?
  7. 用户能否绕过前端直接调用Agent API?
  8. Git提交后能否自动触发部署?
  9. 模型供应商变更时,业务代码是否需要调整?

这些问题的对应能力在EdgeOne Makers官方文档中有明确描述:

能力官方文档中的定位
Managed Runtime负责LLM调用、Agent loop编排和业务逻辑,依会话路由并自动扩缩容
Sandbox Tool在隔离环境中运行浏览器、代码执行、Shell和文件操作
Conversation Storage兼容多种Agent框架,提供会话与消息管理
Observability自动收集调用链路,支持在本地或云端面板查看trace数据
Built-in Models自动注入模型密钥,并附有限时每月免费模型额度

由此可见,EdgeOne Makers并非关注单次模型调用,而是侧重Agent上线后的运行、工具、状态、观测和权限边界。

img_6a45b69c1ef4930.webp

项目模型

EdgeOne Makers将普通Web应用与Agent应用纳入同一项目结构。官方文档指出,同一个项目下有两种后端运行模式:

目录运行模式适用场景
agents/Session modeLLM调用、Agent loop、长任务编排
cloud-functions/Request mode非LLM业务逻辑、数据查询、辅助API

cloud-functions/采用普通Serverless请求模型。agents/则更适用于长任务:它根据conversation_id进行会话粘性路由,将同一会话的请求定向到同一实例,从而复用上下文、缓存和连接。官方文档还明确指出,单次执行最长可配置至60分钟,适用于多轮Agent loop、频繁工具调用和深度研究。

这一设计的核心在于,Agent不再被视作旁路服务。

以往许多团队在开发AI应用时,会将前端、后端API、Agent服务、模型调用层、工具执行服务、任务队列和日志系统各自独立。初期看似灵活,后期却容易造成运维与权限管理的负担。EdgeOne Makers的思路与Vercel、Cloudflare近期方向趋同:开发者平台不再仅托管静态页面或函数,而是逐步补齐AI应用所需的运行原语。

沙箱边界

Agent与Chatbot的核心差异之一在于动作执行能力。Agent可能需要:

  1. 打开网页;
  2. 读写文件;
  3. 执行代码;
  4. 运行Shell;
  5. 分析CSV、PDF、图片;
  6. 修改项目并返回预览结果。

这些动作一旦进入真实环境,其风险远超普通问答。沙箱并非锦上添花,而是基础设施中的关键一层。

EdgeOne Makers官方文档提到,Sandbox Tool同时供LLM与开发者使用,浏览器、代码执行、Shell、文件操作均运行在隔离沙箱环境中。

其重点并非“Agent终于能执行命令”,而是将工具执行从开发者主机、业务后端和真实生产环境中分离,为Agent的动作划定明确边界。

img_6a45b69c346a731.webp

EdgeOne Makers免费版额度文档中也列出了资源边界,例如Agents每月执行次数、单次请求最长运行时间,以及Sandbox单实例最大运行时间、默认超时等限制。具体额度未来可能调整,但可以看出平台已将“Agent长任务”和“沙箱资源管理”纳入产品化范畴。

记忆与追踪

普通接口通常是一次请求即一次返回。Agent则更像一个循环:

  1. 接收目标;
  2. 调用模型;
  3. 判断下一步;
  4. 执行工具;
  5. 读取结果;
  6. 再次调用模型;
  7. 继续推进或停止。

因此,Agent应用需要观测的不是HTTP状态码,而是一条任务链路。

EdgeOne Makers的context.store提供会话级对话存储,依据conversation_id进行关联,并兼容多种Agent框架的消息模型。

context.tracer支持手动埋点,可与平台自动采集的trace串联至同一条链路中。

这类能力对生产环境至关重要。Agent出错时,团队需要了解它所看到的内容、采取的动作以及决策依据:

  1. 当时模型观察到什么上下文;
  2. 它调用了哪个工具,工具返回了什么;
  3. 哪一步开始偏离目标;
  4. 是否需要重试、回滚或人工介入。

Agent进入平台化后,可观测性需要从“查看接口耗时和错误率”升级到“审视任务过程与动作链路”。

img_6a45b69c4809f32.webp

API认证

EdgeOne Makers官方文档专门介绍了Agent Authentication,明确指出缺乏登录认证时,任何人可直接访问Agent API,可能导致资源滥用,并可能绕过前端页面直接请求/agents/*等接口。

官方提供的示例方案包括:

  1. 利用Cloud Functions处理注册、登录、登出和当前用户查询;
  2. 登录后签发JWT;
  3. 将JWT置于HttpOnly Cookie;
  4. 在边缘节点通过middleware提前拦截未认证请求;
  5. 在Agent入口中进行签名校验。

该方案虽不复杂,但十分必要。Agent API被滥用不仅消耗流量,还会占用模型额度、沙箱资源和工具调用次数,甚至可能触发外部系统动作。认证、限流、权限和审计都必须落实到真实接口层。

模型接入

EdgeOne Makers还提供一项Models服务。官方文档将其描述为部署在EdgeOne边缘节点上的统一模型接入服务,可通过统一的endpoint和一个API Key调用多个主流模型供应商。

它支持以下特性:

  1. 统一的endpoint,切换模型时只需修改model参数;
  2. 兼容OpenAI SDK、Anthropic SDK、Vercel AI SDK,以及cURL、fetch等HTTP调用方式;
  3. 支持托管供应商Key,调用时仅需携带网关自身的API Key;
  4. 内置模型可直接使用,适合Demo和技术验证;
  5. 支持SSE流式输出。

官方示例展示了如何通过OpenAI JS SDK进行调用:

import OpenAI from "openai";const client = new OpenAI({
  apiKey: process.env.MAKERS_MODELS_KEY,
  baseURL: "https://ai-gateway.edgeone.link/v1",
});const completion = await client.chat.completions.create({
  model: "@makers/deepseek-v4-flash",
  messages: [{ role: "user", content: "What can you do?" }],
});

这一功能便于平台内应用快速起步,开发者无需从一开始就编写模型适配层,也无需将不同供应商的Key分散在业务代码中。

img_6a45b69c5c4f533.webp

Git部署

在部署体验上,EdgeOne Makers与现代Web平台类似。官方文档指出,它支持导入Git仓库,目前可集成GitHub、GitLab、Bitbucket、Gitee等Git providers。

基本流程如下:

  1. 登录控制台;
  2. 绑定Git平台;
  3. 选择仓库;
  4. 配置构建命令;
  5. 选择加速区域;
  6. 开始部署;
  7. 后续推送到部署分支时,平台自动拉取并部署最新提交。

此外,它还支持基于模板创建项目。官方文档说明,基于模板创建项目时,会在用户的GitHub账号下自动创建一个仓库,后续可clone到本地继续开发,并通过push触发部署。

这表明Agent应用正在复用Web应用过去十年形成的交付路径:如果Agent应用无法融入标准工程流程,团队将难以长期维护,最终可能沦为各类临时项目而无人敢动。

适合场景

从当前官方文档来看,EdgeOne Makers适用于以下场景:

场景适合理由
Agent原型和轻量产品Web、Functions、Agents、模型入口和部署流程整合一体,启动成本低
多轮对话和长任务AgentSession mode、会话粘性和较长执行时间更贴近Agent loop
需要工具执行的AgentSandbox Tool提供浏览器、代码、Shell、文件操作的隔离环境
需要公网访问的AI应用提供认证方案参考,避免Agent API裸露
小团队快速验证无需自行拼装runtime、trace、storage、model gateway

它并非万能方案。若团队已拥有成熟的Kubernetes、私有云、内部权限系统、统一日志体系和模型网关,则直接迁移未必合适。若模型供应商选择、预算核算和审计要求复杂,则可能需要独立的AI Gateway来承接。

此外,官方文档提到,当前免费版额度是生效的限制,商业版正在规划中,后续价格和配额将通过控制台公告更新。因此,它更适合用于验证、原型开发、轻量应用和平台能力评估,而非立即确定生产成本。

小结

对于Agent的工程化部署,运行、权限、成本和观测等各方面都需要系统性的解决方案。EdgeOne Makers通过整合runtime、沙箱、认证等能力,让团队能够聚焦业务逻辑,而不必分心于底层运维。

资料来源

  1. Makers Agents 官方文档:pages.edgeone.ai/document/ag…
  2. Makers Models 官方文档:pages.edgeone.ai/document/mo…
  3. Git 仓库导入部署文档:pages.edgeone.ai/document/im…
  4. Agent Authentication 官方文档:pages.edgeone.ai/document/ag…
  5. 免费版额度限制:pages.edgeone.ai/document/li…