构建去中心化大脑:AI与区块链的完美结合
微小发报道:
概述:
· 去中心化解决方案的必要性:随着 AI 的飞速发展,必须对抗科技巨头对技术的集中控制。将 AI 与区块链结合,能确保数据的开放性与可验证性。
· 知识图谱的优势:凭借卓越的数据组织和检索能力,检索增强生成(RAG)结合知识图谱,提升了大语言模型的准确性,提供与上下文相关的最新信息。
· 去中心化知识图谱的未来:这是一个重大范式转移。运用区块链技术,去中心化知识图谱能确保信息的开放访问,同时通过可验证性和透明治理增强信任。
· Geo 的崛起:一个创新的去中心化知识图谱,Geo 即将在 The Graph 上线。它将区块链和 AI 完美结合,打造更易访问、更可靠的互联网,真正由用户治理。
· 信息生成与组织:借助人工验证和 AI 驱动的内容生成,信息将以指数级速度增长,确保信任与透明度的同时,保有人性化的触感。
大语言模型(LLM)在各个领域的迅猛普及,引发了对其潜在风险的热烈讨论。AI 对文化、政治和真相追求的深远影响已显而易见。因此,全球社区不能让少数科技巨头通过数据护城河垄断人工智能,而应联合构建去中心化的替代方案。
保持数据开放和公共性,有助于建立一个信任层,以一种大型科技公司无法实现的方式来验证数据准确性。我们不应受限于少数公司的偏见和假设,而应共同努力,打造一个真正可访问、由每个人拥有的去中心化大脑。AI 技术及其与日常生活的融合,理应从一开始就设计为公共产品,而非由个别科技巨头在封闭环境中向大众提供。 在聊到大语言模型和信息检索时,拿人脑来打比方,超有趣!🧠通过工作记忆和显性记忆,我们可以理解自己和人工智能的互动。 大语言模型对显性记忆相当拿手。 在训练过程中,它们用权重来编码数据,解析超多内容,从而把信息牢牢记住。不过,万事皆有缺点。由于大语言模型没法存储所有训练数据(数据量大得吓人),这就导致了大家都知道的「幻觉」现象,简单问题反而会给出搞笑的答案。而且,不能继续训练的限制,让它们对最新的创新和发现一无所知。这也是为什么检索增强生成(RAG)技术成了大语言模型的理想伴侣。
RAG 是个过程,要求在大语言模型的训练知识外,先参考其他数据集,给模型提供新信息和上下文。 可以把 RAG 看作是 AI 大脑的工作记忆。 它通过外部知识库和向量数据库整合最新知识,增强 AI 生成内容的准确性和相关性。不过,太依赖非结构化信息可能会让提取数据变得复杂,信息冗余还不一定能确保上下文信息正确。
知识图谱:超越向量数据库
知识图谱能显著提升大语言模型中 RAG 的能力。相比向量数据库,知识图谱在语义分析、数据检索和可验证性上都有明显优势。它跟人类认知类似,擅长理解自然语言的复杂性,还能深入洞察数据之间的关系。这种语义深度确保大语言模型获取相关的准确信息,显著提升生成内容的质量。相对而言,向量数据库常常忽视上下文,或者依赖无关信息,这些都可能导致大语言模型的「幻觉」现象。 只有通过知识图谱,大语言模型才能迅速找到相关实体,遍历图谱获取上下文信息。
即使数据集在不断扩充,知识图谱的结构化特性也特别适合整理大量数据。这种结构优势让检索过程更加精准,为每个查询提供最相关的数据,提升 RAG 应用的性能和效率。这种提升,加上从大语言模型的「显性记忆」中找到的信息,能让提示词业务从两个「记忆桶」中获得服务,因为每个记忆桶都有自己的风格和优势, 因此能够提供更准确、更切合实际的响应。 去中心化知识图谱:范式转变💡
去中心化知识图谱,听起来很酷吧?我们认为,它能完美结合区块链和 AI,连接全球所有数据,并通过深思熟虑的创造、策展、组织和组合,以便于探索的方式将这些数据串联起来。以往的知识图谱往往由某些公司或拥有独特知识库的团队集中构建和更新,虽然这解决了特定需求,但跟我们期待的未来互联网基石相去甚远。
在区块链和 AI 的结合上,去中心化知识图谱在重要性、范式转移潜力和文化相关性等方面,绝对是其他方案无法比拟的。
Geo,基于 The Graph(全球领先的去中心化区块链数据索引和查询协议)打造的去中心化知识图谱,真是让人激动。Geo 开创了在真正的 web3 精神下,从零开始构建这种技术的方法——让所有人都能公开获取知识,而不需要任何守门人。
Geo:去中心化知识网络的先锋🌐
Geo 的目标不仅仅是将全球数据组织成一个可搜索的数据库,更要确保这些数据的可组合性独一无二。想象一下,未来你可以通过「代理」与 Geo 互动。用户直接向代理提问,知识图谱则会检索相关内容、数据库或 API,实时提供给大语言模型(LLM)使用。不同于现在逐个查看搜索结果的方式,代理会加载所有相关信息后,直接给出你的问题答案,妥妥的省时省力。
当然,输入给代理的信息质量极其重要,这正是区块链的优势——身份和信誉。通过认证每条信息的原作者,确保作者身份可追溯、可验证,从而有效保障信息源的属性和质量。而且,所有内容高度可组合,我们可以根据自己的兴趣和需求,定制与这些信息的互动方式,而不影响原始数据。
通过 The Graph 构建去中心化大脑🧠 构建一个去中心化的大脑 🧠,这是我们的宏伟蓝图!我们想把来自各个数据源的信息存储起来,然后由人类整理成独立的社区,叫做「Spaces」。这个共享的大脑不仅能利用结构化的信息进行推理,还能确保AI做出明智的决策。一旦这个去中心化的大脑诞生,它就能通过API连接到现实世界,变成真正自主的智能代理,帮用户处理琐事,让人们能专注于更有意义的工作。同时,互相关联的知识图谱能从多个动态数据源提取数据,保持数据的多样性。
🌟 全新数据贡献和验证生态系统 🌟
在全球数据服务的舞台上,The Graph凭借新开发的互联数据图谱,正处于最佳实施位置。它将在现有服务的基础上,增加对大语言模型数据服务的支持,也就是说,索引者将提供开源的模型推理服务。这些模型可以直接访问,或者通过方便的开发者工具调用经过互联数据图谱验证的数据。开发者将首次拥有一个开放、可组合、低延迟、完全集成的技术栈,来构建比以往更强大的人工智能代理。
🔍 从信息检索到知识创造:大语言模型与人类的角色 🔍
为了构建未来的去中心化大脑,我们得采取不同寻常的方法。这将增强AI系统的弹性和可靠性,确保大语言模型能提供有意义的响应,同时简化检索增强生成技术(RAG)。在The Graph的新纪元设计中,精心构建的知识图谱将帮助我们迈向更美好的未来。
-
只有经过加密验证、信誉可追踪的贡献者,才能将信息添加到互联图谱中(也就是Geo空间)
-
信息也可以从可验证的第三方数据源聚合而来
-
大语言模型在工作记忆中存储的数据与新加入的信息之间建立逻辑连接,Geo中的人类对此进行验证
-
智能代理接收人类的提示词,并使用RAG从互联图谱中检索最相关的信息
-
希望向Geo空间贡献内容的用户能直接访问相关数据,从而创造更高质量的内容
-
智能代理本身可作为用户交互界面,用户可以请求信息、创作并提交新内容,智能代理还能协助用户编辑、添加、访问和链接其他相关信息。 为了更好地实现知识循环,引入策展人角色是个不错的主意。借助可信赖的人类来标记信息,知识图谱能够迅速识别出最有价值的数据。我们将重新定义 The Graph 中策展人的定位,通过 GRT 来激励他们的参与。
未来的场景中,想象一下大语言模型在人的协助下,自主扩展知识图谱,而不是依赖人类去检索信息。这些模型可以生成信息,并将其提交给可信的人类进行验证。这样不仅提升了信息聚合的速度,还保留了人类对数据的验证能力,更重要的是,保留了人类与数据的联系。通过禁止大语言模型直接添加数据,我们也能过滤掉潜在的幻觉信息,同时借助大语言模型来处理日常任务。
去中心化知识图谱中的信任与透明度 🕵️♂️
将区块链技术与知识图谱结合,能为数据验证增添一层信任。每条数据都源自可验证的来源,并且保留有关于数据来源、修改记录和相关人员的清晰记录。这种透明性提升了数据的可信度,为数据使用创造了安全环境,使去中心化知识图谱成为推进大语言模型中 RAG 技术的最佳选择。
借助 Geo 浏览器,我们便捷地获取全球信息,这让 The Graph 在这个激动人心的互联网时代处于独特的前沿。一个真正开放的、去中心化的人工智能大脑,需要开放透明的治理,而这一点在中心化架构下无法实现。因此,The Graph 不仅满足了世界对去中心化知识图谱的需求,还让全球用户群体能够参与到这个重要工具的治理中。
继续前行吧!🚀