0°

OpenAI的CEO都在谈的 AI Agent,到底是什么?

  作为AI应用落地的方向之一,AI Agent这一概念受到了不少企业和从业人员的关注,那么,AI Agent究竟是什么?AI Agent又是如何开展工作的?不妨来看看本文的分析和解读。

  为什么要了解 AI Agent ,因为投资者当前只关注 AI Agent公司,OpenAI 等 AI 前沿公司都在研究它。

  AI Agent 是AI应用落地的一个方向。

  创业圈有个玩笑话,我有一个很牛的idea,但就差一个程序员了。未来,AI Agent 就是帮你实现idea的「程序员」。

  读完本文,你会理解 AI Agent 是什么,它是怎么工作的。

  一、AI Agent 是什么

  AI Agent是指人工智能代理(Artificial Intelligence Agent),是一种能够感知环境、进行决策和执行动作的智能实体。

  举个例子,AI Agent 就像是一个小爱同学,住在你的手机或电脑里,有智慧和观察能力。

  当你对它说:“小爱同学,我有点不舒服。”

  它会像魔法一样,通过观察你的状态、体温,还有最近 24 小时的行动轨迹,并结合互联网上的数据和信息,通过一系列眼花缭乱的分析,在 1s 钟后得出结论,你「阳」了。

  然后主动给你生成请假条,你点点头请假单就发给你 leader 了。

  还贴心的告诉你,家里布洛芬和矿泉水已经不够了,已经帮你选好商品,只要你一声令下,30分钟后会送到家门口。

  它感知到,现在开车并不是一个好的想法,就顺手把你回家的车也叫好了,10分钟后就到楼下,赶紧撤吧。

  这就是一系列的 Agent 协同工作的结果。

  二、这么优秀,它是怎么工作的

  一图告诉你 AI agent 是怎么工作的。这张图描述了一个智能体如何处理、分析和响应外部信息的流程。

  有点不太明白,是吧,那我来拆解下。

  AI Agent 分为 4 个部分:

  1. 感知(Perception)

  这是流程的第一步。AI 通过传感器、摄像头、麦克风等,建立起对外部世界进行感知。

  输入(Inputs):感知到的信息被输入到系统中。在这个例子中,输入是:“我有点不舒服”、我的体温、精神状态、睡眠时间等

  外部环境(Environment):系统所在的环境或上下文。比如“我有点不舒服”这件事,会涉及到天气、环境(比如是不是在有花粉过敏的场所)等。

  2. 信息处理(Agent的大脑(Brain))

  可以说是通用大模型+N多知识库,用来处理信息。包含以下系统:

  1)信息存储相关

  记忆系统:包括 Storage 和 Memory ,用来存储长期和短期的数据。

  比如长期数据是我这个人的基本信息、爱好、基础疾病等;

  短期数据比如我家的矿泉水只剩下1瓶了,购买之后这个记忆就可以删除了。

  知识库(Knowledge):包括医学知识库、商品库等,用来诊断我当前的状态,以及后续治疗、生活所需的管理。

  2)大模型对信息进行处理

  基于感知的信息(input + Environment )、记忆、知识库等信息,进行加工处理,得出结论(Decision Making):“我生病了,而且是「阳」了这种情况”。

  3)然后制定下一步计划(Planning)。

  Action/Reasoning 是基于其决策的具体动作,但还没有实行。

  要帮我写好请假条、帮我买药、买水、叫车等。

  3. 执行(Action)

  基于 Barin 一系列眼花缭乱的操作,得出了结论,制定了下一步计划,那就需要执行(Action)。

  大模型本身不能完成这些任务,需要调用外部的工具。

  这时候就会用调用第三方的工具(Tools 和Calling API),通过接口或者应用,与其他App进行互动,达到最终效果。

  4. 输出(output)

  执行之后,需要一个出口,告诉你执行结果。比如我的小爱同学。它告诉你:“你阳了,已经帮你写好请假条、叫好车.”

  以上就是AI Agent的工作原理。

  总的来说,这个系统描述的是一个简化的模型,展示了是一个 AI agent 如何从感知信息开始,经过一系列内部处理和决策,最终做出响应的过程。

  三、总结

  AI Agent 是未来 AI 发展的方向之一(另外一个方向下篇写)。

  它可以是私人助手,也可以是你工作的帮手,他能放大你的能力。补齐你的短板,让你成为超级个体。

0 条回复 A 作者 M 管理员
    所有的伟大,都源于一个勇敢的开始!
欢迎您,新朋友,感谢参与互动!欢迎您 {{author}},您在本站有{{commentsCount}}条评论