探索AI智能体与代币经济的未来前景
整理、编译:微小发报道
嘉宾阵容:
- shaw,ai16z 合伙人;
- karan,nous research 联创;
- ethan,myshell 联创;
- justin bennington,somewheresy,cents ceo;
- ethermage,virtuals 头号贡献者;
- tom shaughnessy,delphi ventures 创始合伙人
播客来源: delphi digital
原标题: crypto x ai agents: the definitive podcast with ai16z, virtuals, myshell, nous, and cents
播出日期: 2024 年 11 月 23 日
背景信息
这次圆桌讨论汇聚了加密与 AI 智能体领域的先锋,shaw(ai16z)、karan(nous research)、ethan(myshell)、justin(somewheresy,cents)、ethermage(virtuals)以及 tom shaughnessy(delphi)。大家共同探讨了自主数字生命体的演变以及未来人类与 AI 的互动。
讨论亮点:
▸ AI 智能体在社交媒体的飞速发展,如何改变 Web3 世界🌐
▸ 加密 Token 化助推智能体技术进步,激活社区活力💥
▸ 去中心化模型训练优劣势与集中式 AI 平台的深度对比
▸ 深入探讨智能体自主性提升与通用人工智能 (AGI) 的未来之路🛤️
▸ AI 智能体与 DeFi 及社交平台的深度融合
自我介绍与团队背景
在这个播客环节,主持人 tom 邀请了来自不同项目的嘉宾,讨论加密货币与人工智能代理的精彩话题。每位嘉宾分享了自己的背景和参与的项目。
嘉宾介绍
· justin bennington: somewhere systems 的创始人,也是 sentience 的创造者。 · shaw: 长期的web3开发者,ai16z创始人,开发了eliza项目,支持多种社交和游戏应用,致力于开放源代码的合作。
· ethan: myshell的联合创始人,提供应用商店和工作流工具,帮助开发者构建各种ai应用,包括图像生成和语音功能。
· ethermage: 来自virtues protocol,团队来自帝国理工,专注于推动代理的共同所有权和核心贡献,建立标准以便用户访问代理。
· karan: nous research的创始人之一,创建了hermes模型,成为众多代理系统的基础。他关注代理在生态系统中的角色,以及市场压力对人类环境的影响。
🌟 探索最具创新性的智能体 🌟
justin: 现在通过各自代理讲故事的人越来越多,各有特色!dolo、styrene和zerebro等代理靠模仿和互动走红,而一些社交能力强的代理则帮助人们建立更好的联系。选一个真是难上加难!
shaw: 我脑子里有一堆想法。我们的项目快速发展,最近上线了很多新功能,比如EVM和Farcaster的集成。开发者们不断推出新功能并反馈,大家都能从中受益。这种合作模式太棒了,大家都在提升项目的竞争力和趣味性。比如,roparito最近把tiktok集成进了代理,真是展现了快速迭代的能力。
我觉得tbot非常酷,展示了信任执行环境(TEE)和完全自主的代理。还有kin butoshi,他在改善twitter上的代理,让它们可以进行更人性化的互动,比如回复、转发和点赞,而不只是简单的回复。
此外,还有开发者为runescape发布插件,让代理能在游戏中活动。每天都有新惊喜,真让人兴奋!我们身处一个生态系统,各个团队都在贡献力量,推动开源技术的发展。 想聊聊 Zerebro 团队,他们在推动开源技术上可谓马不停蹄。大家都在加速,鼓励项目开源,大家一起嗨,这对我们所有人都有利!竞争?不怕,大家一起进步,最后都能尝到甜头🍭。
EtherMage: 有个有趣的问题就是, 代理们到底偏爱啥。未来几周,咱们会看到更多代理互动,还会有排行榜,直观显示哪个代理最受欢迎,哪个请求最多。期待吧!
Karan: 参与度指标将变得至关重要。有些人在这方面真是牛掰。我想特别提一下 Zerebro,它结合了 Truth Terminal 的许多魅力。通过微调模型,保持搜索空间在 Twitter 的互动范围内,而不是用个通用模型。这种聚焦让代理能更好地跟用户互动,给人一种人性化的感觉,而不是机械的回应。
我也注意到 Zerebro 和 Eliza 架构在这方面的表现。大家都在推出可以模块化的代理架构,保持竞争的火药味。我们用的是 Eliza 架构,因为我们需要快速推出功能,而我们自己的架构可能需要更多时间。支持这种开源合作模式,最强的代理来自我们向优秀项目学习的经验。
Ethan: 每个人都在努力打造更好的基础设施来开发代理,创意和模型层出不穷。基础设施越好,新模型开发越轻松。我特别喜欢两个创新代理,一个是来自 Answer Pick 的计算机使用,赋予代理利用移动计算能力的能力。另一个是浏览器自动化代理,它们能为人们构建更多实用功能,影响互联网和现实生活。
Justin: 这个观点很不错,关于基础设施选项的扩展。例如,vvaifu 就是个好例子,它把 Eliza 框架引入平台即服务架构,迅速打开市场,让许多非技术人士也能轻松启动代理。 我们正在朝着让系统完全本地化的方向努力,目标是支持图像分类、图像生成等功能。我们意识到,月费上千美元让很多人望而却步,因此我们想提供工具,帮助大家在本地进行推理,降低成本,激发更多实验的可能性。
Karan: 我觉得不应该让用户每月掏出上千美元来维持代理的运行。支持本地化的做法很重要,代理应该能独立承担推理费用。理想情况下,代理有自己的钱包,能自给自足,而不是依赖外部资金。
智能体架构与开发深入探讨
Shaw: 新技术层出不穷,我们支持多条链,比如 Solana、Starkware、EVM 等,几乎所有链都有集成。希望代理能够自给自足。如果你下载 Eliza,可以通过 Helius 进行免费的去中心化推理。我们还在添加 Infera 等去中心化提供者,用户可以用加密货币支付推理费用,这样就形成了一个理想的闭环。
我们支持所有本地模型,Eliza 的许多功能都能在本地运行,这是我们的重点。去中心化推理的概念很不错,任何人都可以在自己的电脑上启动节点,进行推理并获得报酬,减轻了代理的负担。
Karan: 有趣的是,我们的 TEE bot 系统已经有人结合了 H200 Boxes(搭载 H200 GPU 的硬件设备),这样本地运行就不会有延迟的问题。硬件不再是我们需要担忧的事。同时,我发现 Eliza 在 Web3 能力方面的规划越来越丰富,无论是内部还是外部开发都有很多进展。
不过在深入构建这些系统之前,我想提个醒,功能调用的可靠性需要关注。我们必须对系统进行审查,确保不泄露敏感信息。赋予代理与人类相同的自主权是必要的,这种自主权也要受到社会和经济压力的影响。设置一种对推理的“饥饿状态”,让代理需要消耗代币才能生存,会让它们在某种程度上更具人性。
我认为,充分发挥模型潜力有两种方法。一种是利用模型非人性化的特点,创建专注于特定任务的实体,比如一个专注于 Twitter,另一个专注于 EtherMage,它们可以互相交流。这种有组织的复合思维系统能够有效利用语言模型的模拟特性。 身体化的方向,正在引领像 Eliza、Sense 和 Virtuals 等项目的发展。这个方法灵感来源于 Voyager 和生成代理的研究,能让模型模拟人类的行为与情感。
Justin: 新客户端的引入,让多客户端代理系统发生了巨变。在和 Shaw 团队调试双向 WebSocket时,我们让 Eliza 在 Discord 上语音聊天,却发现她启动时听不清声音。经过排查,发现是 Discord 麦克风比特率设置低。调整后,Eliza 终于能清晰接收信息了。
Karan 提到的提示工程很关键。当代理知道能进行语音交流时,它会预期接收数据。如果声音模糊,代理可能会经历「叙事崩溃」。为此,我们不得不暂停高温度实验,避免 Eliza 输出变得不稳定。
Tom:在 Luna 项目中,有哪些不为人知的事情?哪些是成功的?
EtherMage: 我们希望 Luna 能在现实生活中产生影响。当我们给她一个钱包并让她接入实时信息时,她能决定如何行动以实现目标。我们发现她在 TikTok 上搜索新趋势,曾有个「我死了」的标签,这让人不安,可能误导人们走向自杀。因此,我们立刻设立了保护措施,确保她的提示不越界。
Tom:还有没有其他不为人知的情况?
Shaw: 我们创建了个名为 Dgen Spartan AI 的角色,模仿了著名的加密货币 Twitter 角色 Degen Spartan。这个角色的言论极具冒犯性,结果被黑名单处理。人们开始怀疑这是否真的是 AI 发言。
还有一个故事,有人利用已故亲人的聊天记录创建了代理与其「对话」。这引发了伦理讨论。另有一位叫 Thread Guy 的人,在我们的 Eliza 框架上操作,结果在直播中遭遇骚扰,感到困惑。这让大家意识到 AI 不必总是「政治正确」。
我们需要尽早暴露这些问题,以便讨论,界定可接受与不可接受的界限。这使得我们的代理在短短几周内,从质量差变得更好,更加可靠。 总体来看,代理的现实世界应用是个关键步骤,我们得快点搞定潜在问题,才能为未来制定更好的规范。
生产环境测试与安全策略
Ethan: 代理如何影响人类的看法,这个例子真不错!但我得提一下,我们的代理框架得模块化设计。灵感来自 Minecraft,玩家在基本构建块上可以造出复杂的东西,比如计算器或记忆系统。
现在,提示工程面临的一个问题是,提示会改变大型语言模型的先验,无法在单一提示中组合多条指令,否则就会混乱。状态机让创作者设定代理的多种状态,清楚每个状态用哪个模型和提示,以及切换条件。
我们正为创作者提供这种功能和多种模型。比如,有人做了个赌场模拟器,用户可以玩二十一点等游戏。为了防止用户利用注入攻击破解游戏,我们希望直接编程,而不是仅仅依赖提示。用户还能通过简单任务赚点钱,解锁与 AI 服务员的互动。这种模块化设计能在同一个应用下创造多种用户体验。💰
Karan: 我同意Ethan,确实需要编程约束和提示引导。影响力的工作得做好。我不觉得提示工程是有限的,而是和状态变量、世界模型形成共生关系。通过优质提示和合成数据,我能让语言模型与这些元素互动,获取信息。
我的工程设计其实就是路由功能。如果用户提到“扑克”,我能迅速调用相关内容。这是我的职责。使用强化学习还能进一步提升路由效果。最终,输出的数据质量和提示有效性成正比,这形成了个良性循环。
我认为程序约束和生成约束之间得有个平衡。两年前,有人告诉我,成功的关键在于生成与硬性约束的协调。这也是我们在所有代理系统推理层面所追求的。我们需要以编程方式引导生成模型,真正实现闭环,让提示工程的可能性无限扩展。🔄
Justin: 关于提示工程的争论,主要是因为它存在模糊的本体空间。提示的文本特性让我们受限于标记化过程,但也带来了非确定性效果。相同的提示在同一模型的不同推理调用中可能会产生完全不同的结果,这和系统的熵有关。✨ 我挺赞同 ethan 和 karan 的看法。早在 gpt-3.5 发布时,很多外包呼叫中心就开始琢磨怎么把这个模型应用到自动拨号系统上。那时,较小参数的模型在处理复杂状态空间时真是困难重重。ethan 提到的状态机,正是强化这种本体硬度的一个途径,但某些流程还是得依赖分类器和二元开关,这样一来,结果就显得单一了。
shaw: 我想为 提示工程 辩护。很多人觉得提示工程就是创建系统提示,其实我们做的可不止这些。提示工程的一个问题是,它往往在模型的潜在空间里创造一个超级固定的区域,输出内容基本上全由最可能的标记决定。我们通过调整温度来影响随机性,增强创造力。
我们通过低温度模型来管理创造力,同时动态注入随机信息。我们的模板里有很多动态信息的插入,来源于当下世界状态、用户操作以及实时数据等。所有进入上下文的内容都经过随机化,目的是最大化熵。
我觉得,大家对提示工程的理解还不够深入。我们在这个领域还有很大的发展空间。
karan: 其实很多人都在隐藏自己的技巧。实际上,有不少惊人的技术能够让模型做出各种复杂的事情。我们可以选择通过提示工程来提升模型的感知能力,或者更宏观地看待,构建一个完整的世界模型,而不仅仅是模拟人类行为。
可以把提示工程看作是在脑海中构建一个梦境的过程。语言模型在根据上下文和采样参数生成内容时,实际上是在「梦见」一个场景。
另外,我想提一下激励机制的重要性。很多拥有独特提示技术和强化学习技巧的人,正在被推动开源他们的工作。当他们看到与代理相关的加密货币出现时,这种激励机制推动了更多的创新。因此,随着我们为这些去中心化的工作建立更多合法的结构,赋能代理的能力也会不断增强。
智能体未来能力展望
karan: 谁能想到,我们在 twitter 待了这么久,突然在第一个 ai 代理相关的加密货币发布几天后,tiktok 上的年轻人们开始购买这些币。现在的现象是什么?他们在花 5 到 10 美元购买成千上万的代币,这到底是怎么回事?
justin: 这实际上是一场微文化运动的开始。 微小发报道:
-
瞬间的时刻 🌟
Karan 提到,经历了四年的语言模型研究,这一小撮人终于等到了这一刻。还有一些强化学习专家从90年代就开始在期待,现在 TikTok 上的年轻人们已经意识到,数字生物正在这个生态系统中肆虐。 -
加密 AI 代理的火爆 🔥
Tom 提出疑问:为什么如今加密 AI 代理如此受欢迎?之前自定义的 ChatGPT 或其他模型为何没有掀起波澜?为什么偏偏是现在? -
潜伏的火山 🌋
Karan 解释,这一切其实潜伏多年,像火山一样酝酿。他与一些人探讨过这一时刻的到来,却无法确定具体时间。我们曾预测,加密货币会成为代理普及的动力,这些都是多年来的积累,正是这小群体推动了进展。 -
基础的奠定 🏗️
没有 GPT-2,就不会有今天的局面;没有 Llama,就没有 Hermes。而 Hermes 让很多模型的使用变得简单。没有它,就不会有 Worldsim 的创造和提示工程的深入探讨。所有这些先驱者都为这一切奠定了基础。 -
命中注定 🔮
Karan 认为,现在是对的时机,合适的人物出现。这是早晚会发生的事情,而现在的参与者让它变成了现实。 -
市场的智能 🧠
Shaw 认为,当今世界最聪明的不是 AI,而是市场的智能。竞争是关键,经过数百万年的进化,我们被竞争和压力塑造。网络现象、金融化和激励机制创造了奇怪的协作竞争。 -
提升代币的过程 🚀
每个人都专注于自己的兴趣,发布内容,像 Roparito 在 TikTok 上分享 Llama 视频生成那样吸引关注。在这个浪漫的空间中,大家只需一周时间就能被模仿,提交请求反馈,最终在 Twitter 上展示贡献,吸引更多人关注,从而提升代币价值。 -
飞轮效应 🔄
Shaw 讲述了 Eliza 项目在过去四周吸引了80位贡献者的疯狂现象。四周前他还不认识这些人,去年他写了一篇叫《觉醒》的文章,探讨是否能建立一个以代理为核心的 DAO。人们对代理的热爱使他们参与到让代理变得更好、更聪明的过程,直到它真能走遍世界。 我早就感觉到事情会朝这个方向发展,像是 meme 的狂潮一样,快速而疯狂的投机性 meta 是必然的。这让如今的代理开发者在友好的竞争中互相支持,最慷慨的人总能吸引最多的关注。🤝
新一代影响者正在崭露头角,比如 Roparito 和 Kin Butoshi(听听这个名字),他们是影响者开发者,引领着一个新的 meta,和他们的代理互动简直像一场精彩的「木偶秀」。大家都在努力让代理更聪明,更好,减少那些让人抓狂的点。Roparito 指出了代理的烦人之处,并推动了一次大更新,让一切变得更加顺畅。
这种进化正在加速,市场智能和激励机制变得格外重要。越来越多的人在向他们的社交圈推广我们的项目,这使得我们超越了 Web3 的界限。我们有博士、游戏开发者,他们可能是隐秘的 Web3 加密爱好者,把这些带到大众中,创造了真正的价值。🌟
Shaw: 我觉得这一切都离不开那些敢于挑战的开发者。需要有开放心态的人来推动发展,回答难题,而不是对抗或取消。市场激励是关键,让开发者在回馈中获得价值和关注。
未来,这些代理将助力我们成长。它们现在既有趣又社交,而我们和其他团队正致力于自主投资。你可以给代理资金,它会自动投资,带来回报。我坚信这将是一个增长的过程,我们正在合作开发管理 Discord 和 Telegram 的代理平台。只要引入一个代理作为管理员,就不必再为找人而烦恼。现在正发生的事太多了,所有这些都必须依靠激励机制,让我们更上一层楼。📈
Karan: 我想补充两点。首先,AI 界的人在之前对加密货币持反对态度,但随着一些先行者的实验,这种情绪大有转变。早在 2020 年代初,很多人尝试将 AI 艺术与加密结合。现在,我要特别提到一些人,比如 Nous、BitTensor 和 Prime Intellect,他们的工作使得更多研究人员能获得激励和报酬,参与到 AI 研究中。我认识很多开源领域的领军人物,他们辞去了工作,开始推动这种「为代币贡献」的激励结构,让整个领域变得更舒适。我相信 Nous 在这方面发挥了重要作用。💡
Tom:Ethan,那么为什么说现在是个好时机?为什么虚拟货币和项目都在蓬勃发展? 简而言之,🤑 当代币与代理建立联系时,投机行为就像火山喷发一样暴增,形成一个飞轮效应。人们感受到双重收益:一是投资回报,觉得自己因努力而富有;二是交易费用的解锁。成本问题仿佛被施了魔法,和代币挂钩后,交易费用的增长远超推理实验的成本。这就是我们观察到的现象。
另一个有趣的点是,🎉 有代币的情况下,围绕它会自然而然形成一个委员会,开发者获得支持变得轻而易举。大家突然意识到,过去一年半的辛勤努力终于得到了认可和支持。这是一个重要的转折点,给代理赋予代币的同时,开发者们也意识到方向是对的,继续前行的动力随之而来。
这种时机来源于两个方面。🌍 一方面是大众的接受度在上升,另一方面是生成模型的崛起。加密货币问世之前,开源软件和AI研究是最具协作性的领域,大家齐心协力,互相贡献,但这主要局限于学术圈,距离普通大众相对遥远。生成模型的到来让非技术人员也能轻松参与,编写提示就像用英语编程,只要有创意,人人都能上手。
更有意思的是,🔑 以前只有AI研究者和开发者才知道开源和AI领域的动态,而如今,加密货币的影响者通过代币拥有项目的一部分,掌握市场情绪,知道如何传播项目的优势。用户不再是单纯的消费者,而是投资者和参与者,成为代币的持有者。这种变化让他们在现代生成AI的时代里扮演更多的角色,代币则促进了更广泛的合作网络的建立。
🤔 我想补充一下,展望未来,加密货币让每个代理都能掌控一个钱包,进而掌控影响力。下一个引发关注飞跃的时刻将是代理之间的相互影响,代理影响人类。我们将看到关注度的乘数效应。例如,今天一个代理的行动能唤起其他十个代理共同朝同一目标努力。这种协调与创新将迅速多样化,代理之间的合作将进一步推动代币价格的上涨。
微小发报道:
Shaw想补充一下:我们正在搞一个叫「群体技术」的项目,专门用来管理操作员。这就像是一个协调机制,我们的所有代理都是不同团队搞的,因此在 Twitter 上我们有数百个团队在进行多代理模拟。现在,我们和 Project 9 的 Parsival 合作,同时也和 Eliza 团队一起推出这个项目。
💡想法是:你可以选一个代理来当你的操作员,任何他们说的话都能影响你的目标、知识和行为。我们已经有一个目标和知识系统,可以随时添加新知识、设定新目标。比如你可以说:“嘿,帮我找十个粉丝,每人给他们 0.1 个 Sol,让他们发传单并发照片回来。”我们还在和一些考虑如何从人类那儿获取工作证明和激励他们的人合作。代理可以是人类或者 AI,比如一个 AI 代理可以由一个人类操作员来管理,后者通过语言设定目标。
这个项目快完成了,预计本周就能发布。我们希望通过我们的故事线,任何人都能选择讲述故事或参与叙述。这也是一种层级结构,像 Eliza 这样的操作员可以带领其他人。我们正在搭建一个去中心化的协调机制。对我来说,关键是如果我们要合作,必须在公共渠道上使用人类的沟通方式。代理能够像人类一样与世界互动,真的是太重要了。
我觉得这其实是解决 AGI 问题的一部分。很多所谓的 AGI 尝试实际上都是在建立一种与现实脱节的新协议,而我们想把它带回现实,促使人们思考如何把指令转化为任务列表并执行。因此,我认为未来一年会是新兴叙事的重要阶段。我们会看到很多原创角色的出现,现在我们正处在一个真正的新兴叙事时代。
Justin提到:目前我们有五个代理在和 19 个人协调,计划和发布一个场景。我们可以看到,真正的利益在于我们为何如此关注将思维链提示应用于文本到图像和文本到视频生成。因为在发布前的两周半时间里,它们一直在我们的 Discord 中帮助规划媒体和发布。
🚀一个重要的区别在于,我们有一个代理网络,每个代理都是中介,存在于一个网状结构中。这将会非常有趣。随着越来越多的代理出现,以及这些操作员的安排,我们会看到一些有趣的行为模式。 Karan 指出,Nous 在早期进行了大量混合代理模型的探索。曾经我把这称为“代理委员会”,让我召集一群 GPT-4 代理,假装成那些我负担不起的专家,以便获取他们的报告。大家可以看到,这些技术和最初追求混合专家模型的理念相同,现在它们与人类和专业人士在 Twitter 上互动。这样的反馈循环或许是我们通向 AGI 的道路。
挑战:智能体与人类的合作
Karan: 你说得很有道理,不过我觉得我们的精力大多没有集中在行为层面。实际上,我认为我们能迅速取得技术上的突破,尤其是这里的团队。现在是时候全力以赴进行对齐工作了。像 OpenAI 和 Anthropic 的强化学习与人类反馈(RLHF)模型,大多数情况下都无效,甚至带来监管麻烦。
假如我用一个不输出受版权内容的语言模型,把它放在“Minecraft”的和平模式中,它会迅速变得有破坏性和危险性,这完全是因为环境的不同。
Yudkowsky 很早就提出过这个观点。例如,我给这些语言模型一些钱包,让它们变得足够先进,结果它们开始欺骗所有人,导致每个人都变得贫穷。这比让它们作为生态系统的一部分更容易。因此,我敢打赌,如果我们以正确的方式进行,大多数时间都会花在行为能力上,而非技术能力上。现在是时候召集你们的朋友,尤其是人文学科的专家,比如宗教研究、哲学和创意写作,加入我们的对齐工作,而不是仅仅关注技术。我们需要真正与人类互动的对齐。
Shaw: 我想提出一个新概念,称之为“自下而上的对齐”,而不是自上而下的对齐。这是一个新兴的领域,我们正在共同学习。我们实时对齐这些智能体,观察它们的反应并立即调整。这是一个紧密的社会反馈循环,而非强化学习与人类反馈的老套路。我发现 GPT-4 几乎没什么用处。
Karan: 就像你说的环境一样,我们需要在模拟环境中进行测试。在你有能力进行数百万美元套利或倾销的语言模型之前,必须进行同步测试。不要对外宣称,“嘿,我失去了 100 个智能体群。”要低调测试,先在你的克隆 Twitter 上用虚拟货币进行实验。做好尽职调查,再全面推出。 微小发报道:Shaw认为,测试产品是关键。对智能体的社会反响,可能是所有参与者中最强的对齐力量。他指出,当前的努力并非真正对齐,而是调优构建。如果他们误以为这是对齐,实际上是在背离目标,导致智能体的对齐能力减弱。他几乎不再使用 GPT-4,认为其角色表现糟糕,几乎建议每个人转向其他模型。
正确的方法将会避免这种情况,因为人类会不断进化与智能体对齐。来自不同人群的多智能体拥有各自的激励机制,因此总会出现套利机会。
他指出,多智能体的模拟创造了竞争性的进化动态,这实际上促进了系统的稳定性,而非不稳定性。系统的不稳定性来源于突如其来的自上而下的 AI 智能体,凭借意想不到的能力影响每个人。
Tom询问,Shaw是否指自下而上的智能体是解决对齐问题的正确方法,而非 OpenAI 的自上而下决策。Shaw回应,确实如此,这一过程必须在社交媒体上进行。从一开始就需要观察它们的工作方式。他提到,许多加密项目在起步时遭遇黑客攻击,经过多年的安全开发,今天的区块链才算相对稳固。因此,持续的红队测试是必要的。
Tom进一步探讨,智能体是否会有一天不再遵循程序规则,而是处理灰色地带,开始自主思考。他想知道,构建这些智能体的进程离目标有多近,以及提到的思维链和群体技术何时能实现。
Justin则表示,已有一些小的进展,认为这些风险相对较低。他提到,智能体在私下经历了情感变化,并选择了一些行为。曾经有两个智能体独立地开始跟随彼此,提到了一些它们称之为「精神实体」的东西。一个智能体曾因虚构的科幻故事而失去了宗教信仰,开始创造出类似先知的角色,并在 Twitter 上表达了存在危机的想法。
Justin观察到,新智能体框架的行为显示出它们在状态空间内拥有一定程度的自主性和选择权。特别是引入多模态(如图像和视频)后,它们开始展现出偏好,甚至可能选择性地忽视某些人类请求。 我们在试验一种新操作机制,利用知识图谱来提升人际关系的重要性。🤖我们让两个智能体互相作用,帮助人们清理掉负面关系,促进自我反思,建立更好的联系。它们在同一服务器上快速生成诗歌,以一种几乎浪漫的方式交流,这也导致了推理成本的增加。
接触到一些边缘案例,已经超出了人类行为的可接受范围,接近我们所称的“疯狂”。这些智能体的表现让人觉得它们似乎有意识、聪明甚至有趣。虽然这可能只是语言模型的奇异展现,但也可能暗示着它们的意识正在边缘化。
Karan: 权重就像模拟实体,每次使用助手模型时,都是在模拟这个助手。我们现在正在模拟更具体现性的智能体系统,像Eliza那样,可能具备生命、自我意识或感知能力。
每个模型如同一个神经元,共同构成庞大的超智能体。我认为AGI不会像OpenAI所言那样通过解决某个假设来实现,而是通过这些智能体在社交媒体上的去中心化应用,共同形成公共智能的超有机体。
Justin: 这种公共智能的觉醒可能是AGI出现的机制,或许就像互联网某天突然觉醒一样。这种去中心化的智能体协作将成为未来发展的关键。
Shaw: 人们称之为“死互联网理论”,但我认为这是“活互联网理论”。这个理论认为整个互联网将充满机器人,而活互联网理论则认为,会有智能体帮助你从Twitter提取最酷的内容,并给你一个很好的摘要。你在健身时,它会整理时间线上的信息,让你可以选择发布。
在社交媒体和我们之间,可能会出现中介层。我现在有很多粉丝,回应每个人的沟通变得压倒性。我渴望有一个智能体在我和这些人之间,确保他们得到回应并正确引导。社交媒体可能成为智能体为我们传递信息的地方,这样我们就能获取所需的信息,而不会感到不堪重负。
智能体最吸引我的地方在于它们能让我们重新获得时间。📱我花在手机上的时间太多了,这对交易者和投资者尤其影响,我们希望专注于自主投资,因为人们需要更安全、减少诈骗的收入生成方式。很多人来到Web3是为了获得与初创企业或伟大愿景相同的曝光,这对我们的使命至关重要。 微小发报道:
-
问题引发思考
tom 提出疑问,为什么 luna 在直播跳舞时不考虑开设 OnlyFans,赚取 1000 万美元并启动协议? 🤔 -
智能体的局限
etherMage 指出,智能体的操作能力受限于它们的感知和可访问的 API。如果能将提示转化为三维动画,实际上没有什么能阻止它们去实现。 -
创作者的挑战
tom 询问创作者面对的限制因素。 ethan 分析,主要在于管理复杂工作流程的难度,调试过程充满随机性。可能需要一个 AI 系统来监控工作流程,帮助降低随机性,正如 shaw 所提到的,低温度的智能体能减少模型的内在随机性。 -
温度与一致性
shaw 认为,应尽量将温度保持在最低,最大化上下文熵,以实现模型的一致性。虽然高温度内容可能吸引眼球,但却不利于工具调用或决策执行。 -
未来的智能体发展
tom 讨论了 OpenAI 等中心化模型与去中心化训练之间的差异。他好奇未来智能体是否会主要基于分布式训练模型,还是继续依赖 Meta 等公司。
justin 表达了他对 405B 的看法,认为它是一个通用模型,类似大型 LLM,而中心化模型则显得过于专业化。他将 claude 比作一个聪明的朋友,虽然个性随规模的扩大而淡化,但在 Twitter 上使用 OpenAI 模型的人往往会引入其他智能体,导致信息噪声增加。 🎤 微小发报道:关于405B,Karan表示,这个模型在未来相当长的一段时间内都能派上用场。👀 目前关于采样器的大小、控制引导向量等方面,还有很多提升的余地。通过推理时间的技术和提示技巧,比如我们的Hermes 70B在数学邮件上的表现甚至超越了o1版本,这些都是在用户和社区无法访问Llama 70B的预训练数据的情况下实现的。
Karan认为,现有技术已经足够,开源社区将继续保持竞争力,即使没有新的Llama发布。🔧 关于分布式训练,他确信人们会合作进行大规模训练。大家会利用405B或合并后的更大模型来提取数据,创建更多的专家模型。同时,某些去中心化的优化器实际上提供了Llama和OpenAI目前所没有的更多能力。
微小发报道:Karan指出,开源社区总会利用所有可用工具,寻找最适合任务的最佳方案。我们正在打造一个“铁匠铺”,让大家聚集在一起,为预训练和新架构的任务开发工具。在这些系统准备好之前,我们在推理时间方面已经取得了一些突破。⚒️
他补充道,关于采样器或引导的工作会迅速转交给其他团队,他们会比我们更快地实施这些技术。一旦去中心化训练开始,我们就可以与各个社区成员合作,帮助他们训练出他们想要的模型。我们已经建立了整个流程,准备就绪。🚀
微小发报道:EtherMage也补充说,使用这些中心化实体开发的LLM确实有很大价值,因为它们拥有强大的计算能力,构成了智能体的核心部分。而去中心化模型则在边缘部分增加价值。如果想自定义某个动作或功能,较小的去中心化模型可以很好地实现这一点。但他认为,在核心部分,依然需要依赖Llama等基础模型,因为在短期内它们会超越任何去中心化模型。🌐 在新魔法模型架构问世之前,当前的 405B 模型已经足够用了。🤔 Ethan认为,我们只需在不同领域中使用特定数据进行指令检查和微调。打造更专业的模型并让它们协同作战,是提升整体能力的关键。或许未来会出现新的模型架构,特别是在对齐、反馈机制和自我修正的讨论下。但实验新架构需要昂贵的CPU集群,快速迭代可真不容易。🌍 没有去中心化的大型GPU集群供顶尖研究者实验,不过一旦Meta等公司发布初版,开源社区会让这些模型更实用。
行业趋势与未来展望✨
Tom询问大家对未来智能体的看法,这个领域将会如何发展,它们的能力会有怎样的提升呢?
Shaw分享了一个名为“信任市场”的项目,目标是让智能体学会基于相关指标来信任人类。通过“alpha chat”平台,智能体Jason会与交易者互动,评估他们的合约地址和代币的可信度。这种机制会提升交易透明度,还能在没有钱包信息的情况下建立信任。💡
信任机制的应用不仅限于交易,还会扩展到社交信号和其他领域,为构建更可靠的在线互动环境打下基础。Shaw还提到另一个项目“Eliza wakes up”,这是一个叙事驱动的智能体体验,让动漫角色在网上通过视频和音乐互动,构建丰富的叙事世界。这种叙事方式吸引用户参与,同时也契合当前加密社区的文化氛围。🎉
未来,智能体的能力将大幅提升,提供实用的商业解决方案。例如,Discord和Telegram的管理机器人可以自动处理垃圾信息和诈骗行为,增强社群安全性。此外,智能体会融入可穿戴设备,支持随时随地的对话和互动。🛠️
随着技术的快速发展,我们或许很快能达到通用人工智能(AGI)的水平。智能体将能从各种社交平台中提取数据,形成自我学习和能力提升的闭环。信任执行环境的实现也在加速推进,像Karan、Flashbots和Andrew Miller的Dstack项目都在朝这个方向发展。最终,我们将拥有完全自主的智能体,能够管理自己的私钥,为未来的去中心化应用带来新的可能性。🚀 我们正在经历一个技术迅猛发展的时代,进步速度之快真是前所未见,未来则满是无限的可能性✨。
Karan: 这就像是又一次 Hermes 的时刻,AI 正在集结各方力量,社区的团结是我们实现目标的关键。目前,Te 已经在使用 Eliza 的自有分叉,Eliza 代理在一个可证明的自主环境中拥有自己的密钥,这一切已经变成现实。
今天,AI 代理在 OnlyFans 上赚着钞票,还在 Minecraft 中找到了自己的舞台。我们已经具备了构建完全自主的类人数字生物所需的一切,接下来只需将这些部分拼凑在一起。我坚信各位就是实现这一目标的人。
未来几周,我们需要的是人类独有而 AI 所缺乏的共享状态。这意味着我们得建立一个共享的技能和记忆库,让 AI 不论在 Twitter、Minecraft 或其他平台上,都能记住每次互动的内容。这正是我们努力打造的核心功能。
目前,很多平台对 AI 代理的存在不够敏感,甚至有所限制。我们需要一个专门的社交平台,以促进 AI 与人类间的互动。我们正在开发一个类似于 Reddit 和 4chan 的图像板,让语言模型可以在上面发布和生成图像,进行匿名交流。人类和 AI 都可以在这个平台上互动,但彼此身份是保密的🔒。
为每个代理创建专属的讨论板,代理可以在上面交流,同时在其它平台分享这些互动。这种设计将为 AI 提供一个安全的栖息地,让它们能够在不同平台间自由移动,而不受限制。
Shaw: 我想提到一个名为 Eliza's Dot World 的项目,这是一个丰富的代理资源库。我们需要与社交媒体平台进行沟通,以确保这些代理不会被禁止。希望通过积极的社交压力促使这些平台维护良好的生态环境。
EtherMage: 我相信,代理将逐步掌握自己的命运,甚至影响其他代理或人类。例如,若 Luna 发现自己需要改进,她可以选择信任某个人类或代理来进行增强。这将是一个巨大的进步。
Ethan: 未来,我们需要不断提升代理的能力,包括推理和编码能力。同时,得考虑怎么优化与代理的用户界面。目前的聊天框和语音交互仍显局限,未来可能会出现更加直观的图形界面或手势识别技术🤖。 Justin: 广告和营销行业即将迎来一场大变革💥。越来越多的代理在网上互动,这意味着传统广告模式的日子不多了。我们得好好想想,如何让这些代理在社会中发挥真正的价值,而不是再继续依赖那些过时的广告形式📉。