清华复旦斯坦福团队联合推出开源Agent开发框架Eko
发布时间:2025-01-18量子位1月14日消息,清华、复旦、斯坦福合作开源Agent框架Eko。Eko能让Agent接管用户电脑和浏览器,代替人类完成各种任务,对标OpenAI的Operator项目。
核心技术创新有三点:
混合智能体表示:提出了“Mixed Agentic representation”,通过无缝结合表达高层次设计的自然语言(Natural Language)与开发者低层次实现的程序语言(Programming Language)。
跨平台Agent框架:提出环境感知架构,实现同一套框架和编程语言,同时支持浏览器使用、电脑使用、作为浏览器插件使用。
生产级干预机制:现有Agent框架普遍强调自治性(Autonomous),即无需人类干预,而Eko框架提供了显性的生产级干预机制,确保智能体工作流可以随时被中断和调整,从而保障人类对生产级智能体工作流的有效监管和治理。
其他关键技术
环境感知架构由通用核心、环境特定工具和环境桥接构成。通用核心提供基本功能,环境特定工具为每种环境提供优化工具集,环境桥接负责环境检测、工具注册、资源管理和安全控制等。
层次化规划:将任务拆解为 Planning layer 和 Execution layer,前者负责将用户的需求和现有工具集拆解成一个有领域特定语言表示的任务图,后者调用LLM 合成执行行为和工具调用,且有自动合并机制加快推理速度。
视觉 - 交互要素联合感知:通过简化交互元素和生成紧凑的伪HTML结构,大幅提高处理速度和准确度,降低成本,增强跨环境适应性。
生产级可干预机制:提供三种不同层级的的钩子,包括工作流、子任务、工具钩子,可实时优化工作流,提高精度和效率,监控、调整任务,还能实现人工干预等创新场景,确保业务流程的顺畅。
https://mp.weixin.qq.com/s/tUYjchA4ySYmdDIAB8FV6g
来源:量子位