人工智能和区块链技术代表着两股正在重塑我们世界的变革力量。人工智能通过机器学习和神经网络增强人类的认知能力,而区块链技术引入了可验证的数字稀缺性,并实现了新的无信任协调形式。随着这些技术的融合,它们正在为互联网的下一次迭代奠定基础——一个自主代理与去中心化系统互动的网络。这个“智能体网络”引入了一类新的数字公民:能够独立导航、谈判和交易的人工智能代理。这一变革重新分配了数字领域的权力,使个体能够重新掌控自己的数据主权,同时促进了一个人类与人工智能前所未有地协作的生态系统。
网络的演变
为了理解我们未来的方向,让我们首先回顾网络的演变过程,通过其主要的迭代,每个阶段都具有独特的功能和架构范式:
前三代网络专注于信息传播,而后两代则实现了信息的增强。Web 3.0通过代币引入了数据所有权,而现在的Web 4.0则通过大型语言模型(LLM)赋予了智能。
从大型语言模型(LLMs)到智能体:一种自然的进化
大型语言模型(LLMs)代表了机器智能的一次飞跃,作为动态的模式匹配系统,它们通过概率计算将庞大的知识转化为上下文理解。然而,它们的真正潜力在于被构建为智能体——从纯粹的信息处理器进化为可以感知、推理和行动的目标导向实体。这一转变创造了一种涌现的智能,能够通过语言和行动进行持续且有意义的协作。
“智能体”这一术语引入了人类与人工智能互动的新范式,超越了传统聊天机器人所面临的局限性和负面联想。这一转变不仅仅是语义上的变化,它代表着人工智能系统在保持与人类有意义的合作的同时,如何实现自主运作的根本性再概念化。从根本上说,智能体工作流使市场围绕解决特定用户意图而形成。
最终,智能体网络不仅仅是一个新的智能层,它根本上改变了我们与数字系统的互动方式。与之前的网络迭代依赖静态界面和预定义用户路径不同,智能体网络引入了一个动态的运行时基础设施,在这里,计算和界面实时适应用户的上下文和意图。
传统网站作为当今互联网的原子单位,提供固定的界面,用户通过预定的路径阅读、写作和与信息互动。虽然这种模型功能性强,但它将用户限制在为一般用途设计的界面上,而非满足个人需求。智能体网络通过上下文感知计算、适应性界面生成、通过RAG和其他实时信息检索创新解锁的预测性动作流程,打破了这些限制。
考虑一下TikTok如何通过实时适应用户偏好的个性化推荐流,彻底改变了内容消费。智能体网络将这一概念扩展到整个界面生成,而不仅仅是内容推荐。用户不再是通过固定的网页布局进行导航,而是与动态生成的界面互动,这些界面能够预测并促进他们的下一步行动。这种从静态网站到动态、智能体驱动界面的转变,代表了我们与数字系统互动方式的根本性进化——从基于导航的交互模型转向基于意图的交互模型。
智能体的结构
智能体架构一直是研究人员和开发者探索的重要领域。为了增强推理和问题解决能力,不断有新方法被开发出来。链式思维(Chain-of-Thought, CoT)、树形思维(Tree-of-Thought, ToT)和图形思维(Graph-of-Thought, GoT)等技术,是旨在通过模拟更为细致、类人认知过程来改善大型语言模型(LLM)处理复杂任务的创新典型例子。
链式思维(CoT)提示鼓励大型语言模型将复杂任务分解为更小、更易管理的步骤。这种方法对于需要逻辑推理的问题特别有效,例如编写简短的Python脚本或解决数学方程式。
树形思维(ToT)在链式思维(CoT)的基础上,通过引入树形结构,允许探索多个独立的思维路径。这一增强使得大型语言模型(LLM)能够处理更为复杂的任务。在ToT中,每个“思维”(LLM的文本输出)仅与其前后紧接的思维直接连接,形成一个局部链条(树枝)。虽然这种结构比CoT更具灵活性,但它仍然限制了思想交叉传播的潜力。
图形思维(GoT)通过将经典数据结构与LLM结合,进一步发展了这一概念。这一方法在ToT的基础上扩展,允许任何“思维”与图形结构中的其他思维相连接。这个思想的互联网络更接近人类的认知过程。
GoT的图形结构可能比CoT或ToT更准确地反映人类思维,尤其在大多数情况下。虽然我们的思维模式有时可能像链条或树状结构(例如在制定应急预案或标准操作程序时),但这些情况是例外,而非常态。这个模型更好地模拟了人类思维,后者通常跨越各种思维,而不是遵循严格的顺序。尽管某些场景(如制定应急预案或标准程序)仍可能遵循链式或树状结构,但我们的思维通常会形成复杂的、相互连接的思想网络,更符合图形结构的特点。
GoT中的这种图形化方法允许更动态和灵活的思想探索,可能会使LLM在问题解决方面具备更具创意和更全面的能力。
这些基于递归图形的操作只是智能体工作流的一个起步。显而易见的下一步进化是多个具有自身专长的智能体被协调以实现特定目标。智能体的美妙之处在于它们的组合。
智能体让你通过多智能体协调,实现LLM的模块化和并行化。
多智能体系统
多智能体系统的概念并不新鲜。它的根源可以追溯到Marvin Minsky的《心灵的社会》,该书提出多个模块化的思维单元通过协作能够超越单一的整体思维。ChatGPT和Claude是单一智能体。Mistral推广了专家混合模型。进一步扩展这一思想,我们认为,智能体网络架构是这种智能拓扑的最终形态。
从仿生学的角度来看,不同于AI模型中数十亿个相同的神经元以均匀、可预测的方式连接起来,人类大脑(本质上是一个有意识的机器)在器官和细胞层面上具有极大的异质性。神经元通过复杂的信号进行通信,涉及神经递质梯度、细胞内级联反应和各种调节系统,使其功能远比简单的二进制状态更加细致。
这表明,在生物学中,智能不仅仅来源于组件的数量或训练数据集的大小,而是来源于多样化、专业化单元之间复杂的相互作用——这是一种本质上模拟的过程。
因此,开发数百万个较小模型,而不仅仅是少数几个大模型,并且能够在所有这些智能体之间进行协调,更有可能带来认知架构方面的创新,类似于多智能体系统。
多智能体系统设计相比单一智能体系统有多个优势:它更易于维护、更容易理解,并且在扩展时更具灵活性。即便在仅需要单一智能体界面的情况下,将其实现为多智能体框架也能使系统更加模块化,简化开发人员根据需要添加或移除组件的过程。必须认识到,多智能体架构即使用于构建单一智能体系统,也是一个极为有效的方法。
尽管大型语言模型(LLM)展示了非凡的能力——例如生成类人文本、解决复杂问题和处理广泛的任务——单一LLM智能体面临的局限性可能会阻碍其在实际应用中的效果。
以下,我们将探讨与智能体系统相关的五个关键挑战,并探讨如何通过多智能体协作克服这些障碍,释放LLM的全部潜力。
克服幻觉通过交叉验证 -单个LLM智能体常常产生幻觉,生成不准确或荒谬的信息。尽管经过大量训练,输出看起来可能合理,但缺乏事实准确性。多智能体系统允许智能体交叉验证信息,减少错误的风险。通过在不同领域的专业化,智能体能够确保提供更可靠和准确的回答。
通过分布式处理扩展上下文窗口 LLM的上下文窗口有限,难以处理长篇文档或对话。在多智能体框架中,智能体可以分担处理负载,每个智能体处理一部分上下文。通过智能体之间的通信,它们可以保持整个文本的一致性,实际上扩展了上下文窗口。
通过并行处理提高效率 单一LLM通常一次处理一个任务,导致响应时间较慢。多智能体系统支持并行处理,允许多个智能体同时处理不同任务。这提高了效率,缩短了响应时间,使得企业能够在不延迟的情况下处理多个查询。
促进复杂问题解决的协作 单个LLM难以解决需要多样化专长的复杂问题。多智能体系统促进协作,每个智能体贡献独特的技能和视角。通过共同努力,智能体能够更有效地解决复杂挑战,提供更全面和创新的解决方案。
通过资源优化提高可及性 先进的LLM需要大量的计算资源,这使得它们昂贵且难以普及。多智能体框架通过将任务分配给不同的智能体来优化资源使用,降低整体计算成本。这使得AI技术更加经济实惠,能够为更多的组织所用。
尽管多智能体系统在分布式问题解决和资源优化方面提供了令人信服的优势,但它们的真正潜力在于当我们考虑将其实现于网络边缘时展现出来。随着AI的不断发展,多智能体架构与边缘计算的融合创造了强大的协同效应——不仅能实现协作智能,还能在无数设备之间实现本地化、高效的处理。这种分布式的AI部署方式自然延伸了多智能体系统的优势,将专业化、合作智能带到最需要的地方:最终用户。
边缘智能
人工智能在数字领域的普及正在推动计算架构的根本重构。随着智能逐渐融入我们日常数字互动的方方面面,我们正在见证计算的自然分化:专门化的数据中心处理复杂的推理和特定领域任务,而边缘设备则在本地处理个性化、上下文敏感的查询。这一向边缘推理的转变不仅仅是架构偏好的选择,它是由多个关键因素驱动的必然性。
首先,人工智能驱动的交互量巨大,会使集中式推理提供商不堪重负,带来不可持续的带宽需求和延迟问题。
其次,边缘处理使得对实时响应的需求得以满足,这对自动驾驶、增强现实和物联网设备等应用至关重要。
第三,本地推理通过将敏感数据保存在个人设备上,从而保护了用户隐私。
第四,边缘计算通过最小化数据在网络中的流动,大幅减少能源消耗和碳足迹。
最后,边缘推理支持离线功能和韧性,确保即使网络连接受损,人工智能能力依然存在。
这一分布式智能范式不仅是我们当前系统的优化,更是对如何在日益互联的世界中部署和互动人工智能的根本重构。
此外,我们还见证了大语言模型(LLMs)计算需求的根本转变。过去十年,训练大语言模型的庞大计算需求占据了主导地位,而如今,我们进入了推理时计算的时代,推理时计算成为了中心。这一转变在具有代表性的智能代理人工智能系统的出现中表现得尤为明显,例如OpenAI的Q*突破,它展示了动态推理需要大量的实时计算资源。
与训练时计算不同,后者是模型开发中的一次性投资,推理时计算则是支持自主代理推理、规划和适应新情境所需的持续计算对话。这一从静态模型训练到动态代理推理的转变要求我们对计算基础设施进行根本性的重新思考——在这种新的架构中,边缘计算不仅仅是有利的,它是必不可少的。
随着这一转型的展开,我们正在见证对等边缘推理市场的兴起,其中数十亿连接设备——从智能手机到智能家居系统——形成了动态的计算网络。这些设备能够无缝地交换推理能力,创造一个有机的市场,在这个市场中,计算资源流向最需要它们的地方。空闲设备的计算能力成为了一个宝贵的资源,可以实时交易,从而比传统的集中式系统提供更高效、更具韧性的基础设施。
推理计算的这种民主化不仅优化了资源的利用率,而且在数字生态系统中创造了新的经济机会,在这个系统中,每个连接设备都可能成为人工智能能力的微型供应商。因此,人工智能的未来不仅仅由单个模型的力量决定,而是由互联边缘设备形成的全球、去中心化推理市场的集体智能决定,这个市场类似于基于供需关系的可验证推理现货市场。
智能体中心交互
LLMs 现在使我们可以通过对话访问大量信息,而不是传统的浏览方式。这种对话式的方式将很快变得更加个性化和本地化,随着互联网转变为 AI 智能体的平台,而非人类用户的平台。
从用户的角度来看,焦点将从寻找“最佳模型”转向获得最个性化的答案。更好的答案的关键在于将用户自身的数据与互联网的通用知识相结合。最初,更大的上下文窗口和检索增强生成(RAG)将帮助整合个人数据,但最终,个人数据将比互联网通用数据更为重要。
这将导致一个未来,我们每个人都有个人 AI 模型与更广泛的互联网专家模型互动。最初,个性化会依赖远程模型,但隐私和响应速度的担忧将推动更多的交互转移到本地设备上。这将创造一个新的边界——不是人类与机器之间的边界,而是个人模型与互联网专家模型之间的边界。
传统的互联网访问原始数据的模型将变得过时。相反,您的本地模型将与远程专家模型通信以收集信息,并以最个性化、最高带宽的方式呈现给您。这些个人模型将变得越来越不可或缺,因为它们会更了解您的偏好和习惯。
互联网将转变为一个互联模型的生态系统:本地的高上下文个人模型和远程的高知识专家模型。这将涉及像联邦学习这样的新技术来更新这些模型之间的信息。随着机器经济的发展,我们将不得不重新构想这种计算环境的基础,主要是在计算、可扩展性和支付方面。这将导致信息空间的重组,变得以智能体为中心、主权化、高度可组合、自学习和不断演变。
智能体协议的架构
在智能体网络中,人类与智能体的互动演变为一个复杂的智能体间通信网络。这种架构重新定义了互联网的基本结构,在这个结构中,主权智能体成为数字互动的主要接口。以下是智能体协议所需的核心原语。
主权身份
数字身份从传统的IP地址转变为由智能体参与者拥有的加密公钥对
基于区块链的命名空间系统取代传统DNS,消除中心化的控制点
声誉系统跟踪智能体的可靠性和能力指标
零知识证明实现隐私保护的身份验证
身份组合性使智能体能够管理多个上下文和角色
自主智能体
自我导向的实体,能够:
理解自然语言和解决意图
进行多步骤规划和任务分解
资源管理和优化
从互动和反馈中学习
在定义的参数内做出自主决策
智能体专业化和专用能力市场
内置安全机制和对齐协议
数据基础设施
实时数据摄取和处理能力
分布式数据验证和验证机制
结合传统训练数据集和:zkTLS
实时网络抓取和数据合成
协作学习网络
RLHF(基于人类反馈的强化学习)网络 分布式反馈收集
质量加权共识机制
动态模型调整协议
计算层
可验证推理协议确保: 计算完整性
结果可重复性
资源效率
去中心化计算基础设施,包括: 点对点计算市场
计算证明系统
动态资源分配
边缘计算集成
模型生态系统
层次化模型架构: 任务特定的SLM(小型语言模型)
通用LLM(大型语言模型)
专用的多模态模型
多模态LAM(大型行动模型)
模型组合和编排
持续学习和适应能力
标准化的模型接口和协议
协调框架
加密协议用于智能体间的安全互动
数字产权管理系统
经济激励结构
治理机制: 争议解决
资源分配
协议更新 并行执行环境,支持: 并发任务处理
资源隔离
状态管理
冲突解决
智能体市场
链上原语用于身份(Gnosis、Squad多重签名)
智能体间的经济和贸易
智能体持有流动性 智能体在创世时持有其代币供应的一部分
通过流动性支付的聚合推理市场
控制链下账户的链上密钥
智能体成为收益-bearing资产 智能体DAO
治理和股息
创建智能的超结构
现代分布式系统设计为智能体协议提供了独特的灵感和原语,特别是事件驱动架构,以及更直接的计算演员模型。
演员模型为实现智能体系统提供了优雅的理论基础。这个计算模型将“演员”视为计算的基本原语,每个演员可以:
处理消息
做出本地决策
创建更多演员
向其他演员发送消息
决定如何响应接收到的下一个消息
演员模型在智能体系统中的关键优势包括:
隔离性:每个演员独立操作,保持自己的状态和控制流
异步通信:演员之间的消息是非阻塞的,实现高效的并行处理
位置透明性:演员可以在网络中任意位置之间进行通信
容错性:通过演员隔离和监督层次结构提高系统的韧性
可扩展性:天然支持分布式系统和并行计算
我们提出了Neuron,一个通过多层分布式架构实现这一理论智能体协议的实际方案,该架构结合了区块链命名空间、联合网络、CRDTs和DHTs,每一层在协议栈中承担不同的职能。我们受到Urbit和Holochain的启发,它们是p2p操作系统设计的早期先驱。
在Neuron中,区块链层提供可验证的命名空间和身份,实现智能体的确定性地址和发现,同时保持能力和声誉的加密证明。在此之上,DHT层促进智能体和节点的高效发现,以及内容路由,具有O(log n)的查找时间,减少链上操作,同时实现基于位置的对等节点查找。联邦节点之间的状态同步通过CRDTs进行,使智能体和节点能够保持共享状态的一致视图,而无需对每次交互进行全局共识。
这种架构自然地映射到一个联合网络,其中自主智能体作为主权节点在设备上运行,设备通过本地边缘推理实现演员模型模式。联邦域可以根据智能体的能力进行组织,DHT提供域内外高效的路由和发现。每个智能体作为独立的演员运行,拥有自己的状态,同时CRDT层确保联邦内的最终一致性。这种多层次的方案实现了几个关键能力:
去中心化协调
区块链用于可验证的身份和主权全球命名空间
DHT用于高效的对等节点和节点发现及内容路由,查找时间为O(log n)
CRDT用于并发状态同步和多智能体协调
可扩展操作
基于区域的联邦拓扑
分层存储策略(热存储/温存储/冷存储)
基于位置的请求路由
基于能力的负载分配
系统韧性
没有单点故障
在分区期间继续运行
自动状态调解
用于容错的监督层次结构
这种实施方案为构建复杂的智能体系统提供了坚实的基础,同时保持了主权、可扩展性和韧性等关键属性,这些属性对于有效的智能体间互动至关重要。
最后的想法
智能体网络标志着人机互动的关键进化,它超越了以往时代的顺序发展,建立了一个全新的数字存在范式。与以往仅仅改变我们消费或拥有信息方式的版本不同,智能体网络将互联网从以人为中心的平台转变为一个智能底层结构,其中自主智能体成为主要的行动者。这一转变得益于边缘计算、大型语言模型和去中心化协议的融合,创造了一个生态系统,在这个生态系统中,个人AI模型与专用的专家系统无缝对接。
随着我们迈向这个以智能体为中心的未来,人类与机器智能之间的边界开始模糊,取而代之的是一种共生关系,在这种关系中,个性化的AI智能体作为我们的数字延伸,理解我们的上下文,预见我们的需求,并自主地在广阔的分布式智能景观中导航。因此,智能体网络不仅仅是一次技术进步,而是对数字时代人类潜力的根本重新构想,在这个时代,每一次互动都是增强智能的机会,每一台设备都成为全球协作AI系统中的一个节点。
正如人类在物理空间和时间维度中导航,自主智能体也栖息在自己的基本维度中:区块空间作为存在的基础,推理时间作为思考的基础。这种数字本体论与我们的物理现实相呼应——在人类穿越距离并经历时间流动的同时,智能体则通过加密证明和计算周期穿行,创造出一个算法存在的平行宇宙。
可以预见的是,潜在空间中的实体将运行在去中心化的区块空间上。
声明:本网站所有相关资料如有侵权请联系站长删除,资料仅供用户学习及研究之用,不构成任何投资建议!