微软发布新模型LAM,让大模型真正具有行动力!
发布时间:2025-01-18近日,微软推出一款名为“LAM”(Large Action Model)的大模型产品,可独立运行Windows程序。与GPT-4o等主要处理和生成文本的传统语言模型不同,LAM能够将用户请求转化为实际行动,如操作软件或控制机器人。LAM可以从文本、语音或图像等类型的输入中了解用户需求,将用户请求转化为详细、逐步的操作步骤,并可根据实时发生的情况自动调整行动策略。在实验中,微软以Mistral-7B为基础构建了一个LAM模型,并在微软Word中进行测试。结果显示,LAM成功完成任务的概率为71%,GPT-4o的成功率为63%。此外,LAM任务执行速度快,每个任务仅需30秒,而GPT-4o则需要86秒。
https://the-decoder.com/microsofts-new-large-action-model-can-perform-some-tasks-in-word/
https://arxiv.org/pdf/2412.10047
https://microsoft.github.io/UFO/dataflow/overview/
来源:国防科技要闻