智能体时代:AI与加密货币的未来融合
微小发报道:
一、注意力的游戏与新鲜感
在过去的一年,加密领域变成了争夺注意力的竞技场,原因在于应用层的故事跟不上基础设施的飞速发展。从 Silly Dragon 到 Goat,再到 Pump.fun 和 Clanker,注意力的变化让这场竞争愈发内卷。最初是单纯的吸引眼球,慢慢演变为一个注意力需求者与供给者共存的平台,硅基生物也成为了新兴的内容供应者。Meme Coin 里终于出现了一个能让散户与 VC 达成共识的角色:AI Agent。
注意力本质上是一场零和博弈,尽管投机行为确实能促进事物的狂野生长。我们在 UNI 的讨论中回顾了区块链辉煌时代的开端,DeFi 的快速崛起源于 Compound Finance 启动的 LP 挖矿时代。在那段时间,各种矿池的 APY 高得离谱,成为链上最原始的博弈方式,尽管最终矿池崩塌,满地狼藉。但黄金矿工的扎堆确实给区块链带来了前所未有的流动性,DeFi 也从单纯投机走向了一个成熟的领域,满足了用户在支付、交易、套利、质押等方面的金融需求。而如今,AI Agent 也正经历着这样的狂野阶段,我们正探索 Crypto 如何更好地融合 AI,并助力应用层迈向新的高度。
二、智能体的自主性
在之前的文章中,我们提到了 AI Meme 的起源:Truth Terminal,以及对 AI Agent 的未来展望。今天的重点是 AI Agent 本身。
先来聊聊 AI Agent 的定义。Agent 在人工智能领域是个有点古老却模糊的概念,主要强调自主性(Autonomous)。任何能够通过感知环境并作出反应的 AI 都被称为 Agent。如今的定义中,AI Agent 更加接近于智能体,即为大模型设定一套模仿人类决策的系统,这在学术界被认为是通往 AGI(通用人工智能)的最有希望的途径。 在早期的 GPT 版本中,大家都能感觉到大模型就像个小人儿,但在面对复杂问题时,它的回答常常是那些似是而非的“妙语”。其实,问题出在它的基础上,毕竟那时候的大模型是靠概率在运作,而不是因果推理。而且,它还缺乏人类的工具使用、记忆和规划能力。于是,AI Agent 应运而生,完美弥补了这些短板。用个简单公式来总结一下:AI Agent(智能体)= LLM(大模型)+ Planning(规划)+ Memory(记忆)+ Tools(工具)。
基于提示词的大模型就像一个静态的人,只有在我们输入的时候它才“活”过来,而智能体的目标是成为一个更真实的人。现在圈子里的智能体主要是基于 Meta 开源的 Llama 70b 或 405b 版本的微调模型,具备记忆和通过 API 接入工具的能力。不过,其他方面还得人类来帮忙,尤其是在与其他智能体的互动上。因此,现在的智能体多以 KOL 的形式出现在社交网络上。想让智能体更像人,需要加入规划和行动能力,其中思维链就是关键。
思维链(Chain of Thought, CoT)
思维链(Chain of Thought, CoT)这个概念最早在 2022 年 Google 发布的论文《Chain-of-Thought Prompting Elicits Reasoning in Large Language Models》中提出。论文指出,通过生成一系列中间推理步骤,可以增强模型的推理能力,帮助它更好地理解和解决复杂问题。
一个典型的 CoT Prompt 包括三个部分:任务描述(指令明确)、逻辑依据(支持任务的理论基础或原理)、示例解决方案(具体的解决方案展示)。这种结构化的方式有助于模型理解任务要求,通过逻辑推理逐步接近答案,从而提升解决问题的效率和准确性。CoT 特别适合需要深入分析和多步骤推理的任务,比如数学问题求解、项目报告撰写等。对于简单任务,CoT 可能不会有明显优势,但在复杂任务中,它能显著提高模型的表现,通过分步解决策略减少错误率,提升任务完成的质量。✨ 在构建 AI Agent 时,CoT(Chain of Thought)可谓是扮演了超级重要的角色。为了让 AI Agent 理解接收到的信息并做出明智的决策,CoT 提供了一种有序的思考方式,帮助 Agent 更高效地处理和分析输入信息。这样一来,解析结果就能转化为具体的行动指南。✅ 这种方法不仅提升了 Agent 决策的可靠性和效率,还让决策过程变得透明,Agent 的行为也因此更加可预测和可追踪。
通过将任务拆解成多个小步骤,CoT 使得 Agent 能够细致地考虑每一个决策点,降低因信息过载而导致的错误决策概率。🤔 结果是,用户更容易理解 Agent 的决策依据,决策过程变得更加透明。而在与环境互动的过程中,CoT 允许 Agent 不断学习新信息,调整其行为策略。
作为一种有效策略,CoT 不仅提升了大型语言模型的推理能力,还在打造更智能、可靠的 AI Agent 方面发挥了重要作用。借助 CoT,研究人员和开发者能够创建出更加适应复杂环境、具备高度自主性的智能系统。💡 在实际应用中,CoT 显示出其独特优势,尤其是在处理复杂任务时。通过把任务分解为一系列小步骤,不但提升了解决任务的准确性,还增强了模型的可解释性和可控性。🎯 这种逐步解决问题的方法,大大降低了面对复杂任务时因信息过多而导致的错误决策风险,同时提高了解决方案的可追踪性和可验证性。
最核心的功能在于将计划、行动与观察相结合,弥补推理与行动之间的差距。🛠️ 这种思考模式让 AI Agent 能够在预测潜在异常情况时制定有效对策,同时在与外部环境交互时积累新信息、验证预先设定的预测,从而提供新的推理依据。CoT 就像是一个强大的精确度和稳定性引擎,帮助 AI Agent 在复杂环境中保持高效的工作效率。
关于 Crypto 与 AI 的结合
Crypto 究竟要与 AI 技术栈中的哪些方面融合呢?在去年的文章中,我提到算力与数据的去中心化是帮助小企业和个人开发者节省成本的关键步骤。而今年,Coinbase 整理的 Crypto x AI 细分赛道为我们提供了更清晰的划分:
- 计算层:专注于为 AI 开发者提供图形处理单元(GPU)资源的网络。
- 数据层:支持 AI 数据管道去中心化访问、编排和验证的网络。
- 中间件层:支持 AI 模型或智能体的开发、部署和托管的平台或网络。 在应用层方面,主要指的是利用链上 AI 机制所开发的用户产品,无论是面向企业还是个人用户。
这四个层级的每一部分都有着宏伟的目标,旨在抗衡硅谷巨头对互联网未来的垄断。就像我去年提到的,难道我们真的要屈服于这些巨头对算力和数据的独占吗?在他们封闭的大模型下,我们所信仰的科学变成了黑盒。未来,这些模型所输出的每句话都可能被视为真理,但这样的真理又能如何验证?按照硅谷的设想,智能体将掌控惊人的权限,比如你的钱包支付权、终端使用权,怎么确保人性不作恶呢?
去中心化是唯一的解药。不过,有时候我们得考虑一下,这些宏伟愿景背后,实际的买单者有多少?过去我们可以不太在意商业闭环,通过 Token 来修补理想与现实的差距。但如今的情况却极为严峻,Crypto x AI 需要更加务实的设计。例如,在算力层面,如何在性能损失和不稳定的情况下,平衡供给两端的需求?如何提升与中心化云的竞争力?数据层的项目又能吸引多少真实用户?如何验证提供的数据的有效性?还有谁会真正需要这些数据?其他层级同样如此,在这个时代,似乎并不需要那么多看似合理的伪需求。
Meme 跑出了 SocialFi
正如我在开头提到的,Meme 已经以飞快的速度走出了一种符合 Web3 的 SocialFi 形态。Friend.tech 是这一轮社交应用的先锋 Dapp,但由于急于求成的 Token 设计,最终未能成功。相比之下,Pump.fun 则验证了纯平台模式的可行性,它不依赖任何 Token 或规则。注意力的供给者和需求者在此融合,你可以在平台上发布梗图、直播、发币、留言和交易,一切都随心所欲,Pump.fun 只收取服务费。这种模式与如今的 YouTube 和 Instagram 等社交媒体的注意力经济相似,只是在收费对象上有所不同,而玩法上 Pump.fun 更贴近 Web3。 在生态系统的舞台上,Base 的 Clanker 就像个全能选手,凭借自家生态的精心打造,配合社交 Dapp,形成了一个闭环的内圈。智能体 Meme 则是 Meme Coin 的升级版本,人们总是追求新鲜感,而 Pump.fun 目前正好在浪尖上,从趋势来说,硅基生物的奇思妙想终将取代碳基生物的俗套,时间问题而已。
关于 Base,我已经提了无数次,尽管每次说的焦点都不同。纵观历史,Base 从未是“先行者”,但总能笑到最后。
智能体的未来可能是什么样?
从实际出发,智能体在可预见的未来都难以实现去中心化。以传统 AI 领域的构建来看,智能体并非单纯的推理过程,去中心化和开源无法解决所有问题,它需要通过各种 API 访问 Web2 的内容,运行成本高昂,思维链的设计和多智能体的协作往往依赖于人类作为中介。我们将经历漫长的过渡期,直到找到合适的融合形态,或许会像 UNI 一样。但如前文所述,我依然认为智能体将对行业造成重大冲击,正如 Cex 在这一领域的存在一样,虽然不完美却极其重要。
斯坦福与微软上个月发布的《AI Agent 综述》详细探讨了智能体在医疗、智能机器及虚拟世界中的应用,而文末附录中列举了许多 GPT-4V 参与顶级 3A 游戏开发的实验案例。
不必过于追求智能体与去中心化的结合速度,我更希望它能优先补充自下而上的能力与速度。我们有那么多叙事的废墟以及空白的元宇宙等待填补,待时而动再考虑如何让它成为下一个 UNI。