首页>>资讯>>产业

分布式革命:加密与人工智能的融合探讨

2024-09-24 11:21:07 39

人工智能(AI)可以说是历史上最重大的技术革命,已经在全球引发了空前的技术军备竞赛。当前,AI 模型在大多数标准化大学考试中的得分已跻身前 10%,并且在许多任务上超过了人类,包括对 AI 研究本身的挑战。即使在现阶段,AI 已经在搜索引擎、客户服务、内容创作、编程、教育等多个领域产生了深远的变革。


我们预计 AI 的能力、资金投入以及其对社会的影响只会进一步加快。所有的大型科技公司都意识到 AI 对其业务的生存至关重要,并正在相应地进行投资。NVIDIA 的收入可以说是 AI 资本支出的最佳风向标,预计 2024 年将超过 1000 亿美元,比 2023 年翻了一番,且是前一年的四倍多。


Google 首席执行官 Sundar Pichai 在谈到 AI 投资时说道:“在这种情况下,风险主要在于投资不足,而非投资过度。”


与此同时,初创公司也感受到 AI 的颠覆性力量,能够推翻数十年来的行业领导者。过去 18 个月,估计有 830 亿美元投资进入了 AI 初创企业。


鉴于 AI 能力通常与投入的计算资源呈指数级增长,我们很可能在未来十年内达到类似 AGI (通用人工智能)的水平。

24.png

在本文中,我们论证了竞争动态将导致一个拥有数百万模型的世界,而加密技术是这种多模型世界的理想基础。首先,我们讨论为什么我们认为多模型世界是人工智能(AI)的逻辑终局。接着,我们分析了加密技术为 AI 提供的独特优势。最后,我们介绍了我们所认为的「加密 x AI 堆栈」,并举例具体介绍了一些我们感兴趣的项目。


从哲学和道德角度来看,开源 AI 和「加密 x AI」的结合对人类而言是一种更好的状态,且这些论述在其他地方已得到充分探讨。虽然我们完全同意这些观点,这也是激励我们在此领域构建的部分原因,但在本文中,我们将重点探讨「加密 x AI」在实际层面的成功原因,而非其在道德层面的应然性。


神级模型 vs 多模型


目前,我们正朝着一个“神级模型”主导一切的世界迈进,这个模型由少数大型垂直整合科技公司生产。

24.png

然而,我们并不认为这是最终结局,原因有以下几点:


拉地毯风险: 在 AI 之上构建体验的组织、企业家和开发者,不希望依赖于一家单一的封闭源公司,这家公司可能随时改变模型、修改使用条款,甚至完全停止服务。


成本-性能权衡: 大型科技公司青睐的超大规模通用模型,无论是在训练还是运行上,必然要耗费更多成本。因此,这些模型对于许多用例来说过于昂贵且性能过剩。虽然目前利润问题还没有引起足够重视,但随着 AI 规模的扩大,人们会对齐优化,以尽可能降低所需性能的成本。对于许多任务来说,大型模型在这一点上将不具备竞争力。有大量研究表明,规模更小、更专业的模型在医疗影像诊断、欺诈检测、语音识别等各方面都能超越通用模型。


垂直整合: 苹果已多次证明,最好的产品往往来自于对整个技术堆栈的垂直整合。目标宏远的企业家在构建 AI 驱动的产品时,将寻求通过专有的模型来获得竞争优势。这些产品还将会捕获更多价值,吸引更多投资等。


隐私问题: AI 将以一种其他技术无法企及的方式,成为组织工作流程的核心。许多组织不愿将其敏感数据托付给这些模型。


基于以上原因,我们认为更有可能出现的是一个由众多小型、专业模型组成的世界,这些模型能针对特定用例定进行制且具备成本效益。应用开发者和用户将利用诸如 LLaMA 或 @MistralAI的开源模型,在这些模型的基础上进行微调,通常使用专有数据。许多模型将继续运行在服务器上,但较小、更注重隐私的应用程序会在客户端设备本地运行,而那些需要抗审查的应用则可能使用去中心化的计算网络。


这是一个模块化 AI 的世界,在这个世界里,开发者和企业家通过提供有价值的服务展开竞争,用户能够根据其特定需求选择、组合不同的服务。为了打破“神级模型”的垄断,并服务于这个新兴的 AI 经济,路由、编排、合成、支付等基础设施将需要被重新构建。


这个世界,恰好也是加密技术蓬勃发展的世界。


加密 x AI


加密技术在这个多模型世界中直观上似乎具有广泛的应用潜力。然而,这种热潮吸引了大量资本进入该领域,许多投资者对其了解尚浅。正如之前基础设施泡沫那样,很多项目虽然获得了资金和开发,但可能并不值得如此大的投入。因此,辨别加密与 AI 领域中哪些子领域真正具备价值并不容易,这导致许多人将整个领域视为毫无实质价值的迷因风潮。


我们不认为这只是迷因风潮,但确实可以理论上存在一个没有加密技术的多模型世界。因此,对我们来说,重点是关注加密技术的独特优势,这些优势能让我们创建出根本上更好的产品,或者理想情况下,创建那些没有它无法建造的产品,就显得尤为重要。为此,我们首先识别加密技术的独特属性及其如何应用于AI,从而创造更好的产品。接下来,我们将讨论「加密 x AI」的技术栈,并提供我们认为适用的用例示例。


协调层: 加密技术的基础设施在促进集体协调方面表现出色,无需集中控制。它在克服大多数市场固有的“鸡蛋与鸡”问题方面尤其成功,能够通过加密原生激励在一夜之间迅速建立大型用户基础。


小型团队在构建内部模型时,可能无法直接访问所有所需的资源。例如,尽管大型科技公司 AI 实验室可能拥有自己的计算资源,但小型团队则没有。同样,这些团队需要获取数据,或许还需要招募各种人群提供人类反馈。这些需求非常适合通过专业化市场来满足,我们相信,利用加密基础设施的市场将比不利用的市场具有竞争优势。


开放的、无需许可的API: 加密技术的基础设施作为一种开放、无需许可的 API 运作——任何人都能在任何地方访问,无需 KYC、信用卡或任何第三方的批准。这对 AI 代理尤为重要,因为为了完全自主行动,它们需要能够在没有人为干预的情况下访问服务、部署代码和转移价值。这使得像代理集体、代理间为服务支付、承担债务甚至筹集资金等科幻般的行为得以实现。


去信任化: 加密技术的基础设施通常是去信任化的,这意味着你可以获得加密保证,确保其不会被更改、访问不会被意外撤回,并且可以验证执行是否如预期。这对模块化 AI 技术栈非常重要,因为,与集成的方法不同,构建者需要与他们无法控制的一系列原语进行组合,用户则需要内在地信任许多他们甚至不了解的服务。


抗审查: 如果作为不可变的智能合约部署,运行在加密技术基础设施上的应用势必发生。即使可以升级,通常也由需要代币持有者达成共识的 DAO 来执行。假设 AI 变得如我们预期的那样强大,政府很可能会想要控制并影响它。事实上,我们已经看到这种情况发生。正如比特币和加密技术提供了超越系统的货币/金融基础设施,「加密 x AI」提供了不可阻挡的智能。


加密 x AI 技术堆栈


鉴于这些优势,我们认为在加密技术与人工智能交集处有哪些应用特别值得关注呢?

24.png

数据中心与计算


模型计算的功能大致分为两个类别:训练和推理。我们认为在这两个领域中使用去中心化计算都是有意义的,下面我们将对此进行详细介绍。


去中心化计算的训练


在训练过程中,节点之间具有高通信和延迟需求,这导致分布式计算目前仍然难以实现。许多团队正在尝试解决这一问题,鉴于奖赏之大和从业人才的质量,我们相信这一问题很可能会得到解决。一些有前景的方案有 @NousResearc 的 DisTrO 和 @PrimeIntellect的 OpenDiLoCo。


除了需要解决分布式训练的技术难题并构建一个抽象化的产品之外,成功者还需要弄清楚:


如何在无需许可的网络上确保质量和问责制

如何启动供给端,最好是数据中心和集群,而非消费级硬件


代币激励可能会成为激励供给端的基础,更多创造性的方式可能包括给予计算提供者对最终模型的所有权


从根本上讲,分布式计算市场的优势在于能够利用全球最低的边际计算成本。随着现有服务提供商的成本上升,越来越多的公司和组织将寻求成本更低的替代方案,这一点变得越来越重要。劣势则包括延迟、异构硬件以及缺乏建立和运营自己数据中心所需要的优化和规模经济。如何解决这些问题尚待观察。


可验证的推理


总体来看,我们认为可验证推理的用例在于扩展带有 AI 能力的信任最小化系统。将模型嵌入到智能合约中并不切实际,但可以在链下运行模型,并在链上发布一些声明或证明,证明其运行正常。例如,项目可以去信任地将治理决策(例如有关货币市场的风险参数的决策)委托给链下模型。


这个概念也可以更广泛地应用于开放或闭源模型,向用户保证输出来自他们预期的模型。随着应用和用户越来越多地利用 AI 执行关键任务,这一点将变得重要。包括 Delphi Ventures 的投资组合公司 Inference Labs在内的许多项目正在以不同的方式处理这个问题。


数据


今天训练大型语言模型(LLMs)是一个多步骤的过程,需要各种数据和人工干预。这个过程从预训练开始,LLMs 在经过清理和策划的公共抓取数据和其他免费数据集上进行训练。在后续训练阶段,模型会在较小、更具体、标注过的数据集上进行训练,以使其成为特定领域(如化学)的能手,通常还需要专家的帮助。


为了确保数据的时效性和/或专属性,人工智能实验室通常会与大型数据源的拥有方达成合作协议。例如,OpenAI 和 Reddit 签署了一笔据传价值 6000 万美元的交易。同样,《华尔街日报》报道称 News Corp 与 OpenAI 的交易价值超过 2.5 亿美元,期限为五年。显然,数据比以往任何时候都更加宝贵。


我们认为,加密网络在帮助团队获取每个阶段所需的数据和资源方面具有良好的优势。最值得关注的领域可能是数据收集,我们相信加密激励能够有效启动数据收集的供给端,并解锁大量重要的数据源长尾。


例如,Grass AI 通过激励用户分享闲置的互联网带宽,帮助抓取网络数据,然后将这些数据进行结构化、清理,并使其可供 AI 训练使用。如果 Grass 能够成功启动足够的供给端,它实际上可以充当一个 API 密钥,为模型提供具有时效性的互联网数据。


@Hivemapper是另一个很好的例子——该网络于 2022 年 11 月推出,每周收集数百万公里的道路图像,目前已映射了全球 25% 的区域。很容易看出,类似的模型可以应用于其他形式的多模态数据,并通过出售给 AI 实验室来实现货币化。


正如 NewsCorp/Reddit 的交易所示,许多公司拥有有价值的数据,但许多公司要么太小,要么缺乏与 AI 实验室的联系以进行货币化的功能。同样,AI 实验室与个别小型提供商达成交易可能不值得付出这些努力。一个设计良好的数据市场可以通过以较为统一的方式将提供商与 AI 实验室连接起来,从而缓解这一问题。这里面有一些挑战,主要是解决数据质量问题,以及 API 和数据的可替代性问题。


最后,数据准备是一个重要的任务集,包括标注、清理、增强、转换等。一个小团队可能不具备所有这些技能,就需要外包。Scale AI 是一家提供这些服务的中心化公司——目前估计年收入约为 7 亿美元,并且增长迅速。我们认为,基于加密技术设计良好的市场和工作流系统在这一领域表现良好。Lightworks 是 Delphi Ventures 投资的一个项目,还有其他几个——目前都处于相对早期的阶段。


模型


用 Delphi Digital 报告《The Tower & The Square》的话来说,人工智能模型的生产和控制几乎完全掌握在“塔楼”——即大型科技公司和政府手中。这种情况可以说比政府控制货币更加反乌托邦。因为这不仅使他们能够控制最重要的经济资源,还能通过审查和操控信息来控制叙事,完全切断某些“不可接受”的人的系统访问,利用人们的私人 AI 互动来对付他们,或者仅仅利用 AI 最大化广告收入。


许多聪明的人正在努力创建“广场”——一个去中心化的网络,目标是生产一个完全中立、不受审查的模型,供所有人使用。因此,正如比特币和加密货币提供了超越系统的钱/金融通道,Crypto x AI 将提供超越系统的智能。


这类项目旨在将每个模型的创建过程去中心化,以创建一个可与 GPT 和 LLaMA 相媲美的“神模型”——网络提供数据来源和准备,利用去中心化计算进行训练,在相同的计算资源上进行推理,并通过去中心化治理协调整个过程。过程中的每个部分都不是中心化的,从而使模型真正由社区拥有,且无法被“塔楼”控制。


显然,创建一个接近于前沿模型的去中心化模型将是极其困难的。我们不能期望大量用户会因为道德原因容忍一个较差的产品。我们将这类项目视为“登月计划”,本质上不太可能成功,但如果成功,将会极其有价值——我们真心希望它们能够成功。


同样值得一提的是那些接受加密理念并可能拥有代币或以其他方式利用加密技术的中心化 AI 实验室。@NousResearch、@PondGNN 和 @PondGNN 都是 Delphi Ventures 已投资的一些项目。


最后,像 @opentensor"">@opentensor 的 Bittensor 这样的模型创建基础设施属于这个模型堆栈的一部分。已有文章充分讨论了 Bittensor,因此我们在此不会深入探讨其优缺点。


应用领域


埃里克·施密特(Eric Schmidt)在最近的一次演讲中提到:


“如果 TikTok 被禁,我建议你们每个人都这么做:对你们的大语言模型(LLM)下达指令——‘给我复制一个 TikTok,吸引所有用户,抓取所有音乐,加上我的偏好,在接下来的 30 秒内完成程序并发布。如果一小时内没有火爆,就根据相同思路做一些调整。’”


这段话说明了我们对智能代理未来潜力的期望。但要实现完全自主,这些代理需要能够在没有人工干预的情况下访问服务——进行价值转移和经济关系的建立,无需许可地部署和执行代码。


传统的银行应用程序、KYC 和注册流程并不适合它们。不可避免地,它们会遇到一个为人类设计的系统,而在没有帮助的情况下它们无法访问该系统。

24.png

加密基础设施提供了完美的平台。它们为智能代理提供了一个无需许可、去信任且抗审查的基础。如果代理需要部署应用程序,它们可以在链上部署。如果需要支付费用,它们可以发送代币。链上服务的代码和数据都是开放且统一的,因此代理可以理解和交互,而不需要 API 或文档。


代理还可以以其他方式作为链上活动的催化剂。从用户点击网站按钮的传统 UX 模式转变为通过我们的 AI 个人助理进行交互,可以抽象掉加密技术众所周知的入门复杂性,从而降低门槛,更好地吸引新用户。


像 Wayfinder、Autonolas 、DAIN和 Almanak 这样的项目都在朝着这个未来发展,值得我们关注。


结语


人工智能正慢慢成为 21 世纪最强大、最重要的资源,深刻影响着社会。由大型科技公司和国家完全控制的未来是我们不愿看到的反乌托邦未来。本文旨在展示加密技术如何阻止这种垄断的路径。我们的重点不在于希望人们因哲学理念而采用这些解决方案,而是通过提供真正优越的选择来帮助开发者和用户。


我们仍处于人工智能时代的初期阶段,尤其是在去中心化 AI 领域。要从当前的起点达到本文所讨论的理想状态,仍需大量努力。在 Delphi Labs,我们对加密技术与 AI 的未来充满信心,并希望通过与该领域的顶尖创新者合作,共同积极塑造这一未来。


鉴于这一领域仍处于早期阶段,我们认为加速器是探索设计空间、并与导师和专家合作实现创意的理想平台。今天,我们正式启动了全新的 NEAR x Delphi Labs AI Accelerator 加速器,现已开放申请,截止日期为 2024 年 10 月 4 日。如果你是一位对 AI 与 Web3 的未来充满信心的创业者或创始人,欢迎加入我们,共同将这一愿景变为现实。


特别感谢 @Redphonecrypto、@Bitcoin_Sage、@KSimback、@Kevin_Kelly_III)、@Shaughnessy119和 @CannnGurel 的编辑支持和反馈。


Delphi Labs 的使命是加速和优化加密技术的发展。我们凭借在 Thorchain、AAVE 和 Synthetix 等顶尖加密协议上的丰富实战经验,为创业者提供从零到一的支持。欲了解更多信息,请访问 delphilabs.io。

声明:本网站所有相关资料如有侵权请联系站长删除,资料仅供用户学习及研究之用,不构成任何投资建议!