DeepSeek R1:Crypto AI的泡沫破裂与未来展望
2025年1月,DeepSeek R1的发布在AI圈里引起了不小的轰动,彻底改变了Crypto AI的生态!🎉 以前,Crypto AI的焦点主要集中在AI Agent上,而DeepSeek R1及其开源策略则重新定义了规则:超低的训练成本和创新的自适应训练方式,使得AI产业去中心化的梦想变得触手可及。这波变革影响深远,Crypto AI市场总市值大幅缩水,许多AI代币经历了高达70%的回调。但这真的是危机吗?还是Crypto AI的一次大洗牌?DeepSeek是摧毁Crypto AI叙事的“终结者”,还是推动其进入实用化时代的“破局者”?🤔
DeepSeek的野蛮生长
DeepSeek的发展可以追溯到2021年。当时,专注于量化交易的对冲基金幻方开始大规模招募AI人才。这种量化公司转向AI的做法可不多见,招募的多是探索前沿技术的研究员,包括大模型(LLM)和文生图模型等领域。虽然有传言说幻方是为了更好地利用闲置的GPU资源而转型,但更多的原因应该是为了抢占大模型等前沿AI技术的制高点。💪 到了2022年底,幻方吸纳了越来越多来自清华和北大的顶尖AI人才。受ChatGPT的启发,幻方的CEO梁文锋决心征战通用人工智能领域,于2023年初成立了DeepSeek。不过,随着智谱、月之暗面、百川智能等AI企业的快速崛起,DeepSeek作为一个纯研究机构,加上缺乏明星创始人,独立融资变得异常艰难。因此,幻方选择将DeepSeek剥离出来,并全资支持其开发。这个高风险的决策让DeepSeek摆脱了融资方的盈利承诺和估值压力。
💡 DeepSeek拥有充足的GPU资源,团队得以专注于技术突破。这里就像一片创新的乐土,年轻的研究者们可以尽情探索。此时的DeepSeek更像个研究院,而非传统企业。就像OpenAI早期的经历,没人能想象一个专注于研究机器人手玩魔方的公司,最终能打磨出ChatGPT;同样,谁能想到幻方这家量化公司,会用DeepSeek突破当前的AI泡沫?前者花了7年,而后者仅用2年。
🚀 2023年11月,DeepSeek推出了参数达到670亿、性能接近GPT-4的DeepSeek LLM;2024年5月上线了DeepSeek-V2,而同年12月发布的DeepSeek-V3在基准测试中与GPT-4o和Claude 3.5 Sonnet表现持平。DeepSeek如此迅猛的技术进步,背后并非单靠资金和高学历,而是科技奇点的爆发——「ChatGPT影响了世界AI产业」,各种奇点在任何一个充满想象力的土壤中加速涌现,直到下一个关键奇点的到来。
🌌 最终在2025年1月,DeepSeek成功穿越奇点,推出了第一代具备推理能力的大模型DeepSeek-R1,凭借远低于ChatGPT-O1的训练成本和卓越性能,打开了新大门。
用开源向全世界分发,开启星际之门的钥匙。
就在 DeepSeek R1 发布并宣布开源模型的次日,美国总统特朗普在白宫新闻发布会上大手一挥,启动了一项高达 5000 亿美元的「星际之门」计划。这项计划由 OpenAI、软银、甲骨文和投资公司 MGX 联合创建的合资企业 Stargate 推动,旨在美国为 OpenAI 构建新的人工智能基础设施。这种规模的投资简直可以与「曼哈顿计划」相提并论,显然是要借全国之力,通过算法的堆叠将闭源 AI 推向巅峰,确保美国在 AI 领域的主导地位。不过,谁能想到,几天后,这个开源模型直接在对岸拒绝了大门,不仅拿着锤子砸墙,还顺便给别人发锤子呢。
DeepSeek 作为与顶尖闭源模型相抗衡的开源模型,其全新训练架构引发了行业的连锁反应,闭源 AI 的日子可真不好过,跑不赢 DeepSeek R1 的闭源模型恐怕要在资本市场上被淘汰。就连 A16z 的创始人 Marc Andreessen 也公然表示,应该更加关注开源 AI,而不是一味依赖闭源 AI。无论是看好 AGI 未来的可能性,还是认为 AI 仅仅是 SaaS 产业的升级,大家都一致认为闭源的弊端远大于开源,黑箱、产业垄断、信息安全、资本操控等问题,都是极其危险的发展方向。
虽然一些业内人士对 V3 的混合专家技术「MoE」提出疑问,认为它需要庞大的数据集,怀疑是用 OpenAI 的模型进行蒸馏;同时,对 R1 中基于强化学习的技术也表示担心,认为在训练芯片的使用数量上可能存在造假。但这些质疑丝毫无法阻挡行业结构的改革潮流。
在训练架构上,DeepSeek R1 的开源彻底打破了 OpenAI 的闭源商业逻辑,通过让模型自我进化的方式,避免了传统模式中对算力和数据标注的巨大投入。虽然训练模型依旧是个盲盒,但成本已经大大降低了。
在 AI 硬件方面,DeepSeek 的 V3 开源更是直接挑战了英伟达的市场地位。英伟达 GPU 的强大护城河主要依赖于其底层的并行计算平台和编程模型 CUDA,其广泛的生态系统和充足的开发者使得使用非英伟达芯片进行训练的学习成本太高。而高门槛的购买条件加上政治限制,让全球 AI 发展的步伐变得割裂。 对我们而言,短期内,美股的 AI 领域缩水严重,Crypto AI 的总市值几乎被砍掉一半,市场已经进入熊市。但从长远来看,最被广泛认可的 AI 行业正在朝着开源、透明、去中心化的方向发展。无论从哪个角度看,Crypto 与 AI 的结合将愈加紧密。
Crypto AI 的救赎,前进!前进!不择手段的前进
在这波 Crypto AI 泡沫破裂的过程中,许多 AI 概念代币都经历了 70% 的回调,Crypto AI 市场也缩水显著。有网友调侃说,“550 万美元就能训练出一个大模型,为什么还要买这些 AI 市值超高的 Crypto AI?”确实,Crypto 市场大多是资金驱动的,而非以产品为核心,90% 的 AI 代币其实没什么实际意义。
不过随着加密市场监管体制的完善,这里依旧是中小型 AI 创业公司的沃土。DeepSeek 在大模型训练成本上相较于 ChatGPT O1 降低了 99%,其训练方法预计将带来更高的生态增长。
简单来说,DeepSeek 为 Crypto 带来了去中心化的训练模型,使得 Depin 类项目的合理化成为可能,训练流程和信息投喂变得更加透明,同时,数据集贡献者获取价值的机制也更为合理,供需结算变得简单。而随着万倍以上的 AI 产业相关生态发展,Crypto AI 的下游产业会更加丰富。一旦市场上涌现出足够多有竞争力和创意的产品,只要其中一个打响名声,外部资金自然会回流进入 Crypto。市场已经在苦苦等待改变,TrumpCoin 之后一系列名人币的收割让 AI 市场原本充足的流动性和正向反馈遭到破坏,因此,DeepSeek 戳破的泡沫反而是个更大的利好。
目前已经有不少 Crypto AI 项目或迅速集成了 DeepSeek,或在其架构上进行更新,例如 ElizaOS、Argo、Myshell、Build、Hyperbolic、Nillion Network、infraX 等等。其中一些项目已经在产品端通过 DeepSeek 进行了优化。
Myshell
在聊天机器人和应用插件的开发过程中,微小发报道,Myshell 的技术团队以超快的速度集成了 V3、R1 及图像生成模型 Janus-Pro,几乎在半天内就完成了。作为区块链领域少数坚持打磨产品的项目,Myshell 在 Web2AI 领域也小有名气,却一直不急于发币。这次 DeepSeek 的开源将为 Myshell 用户带来成本上的大利好,低成本将吸引更多 Agent 开发者,进一步完善已成熟的产品。
Argo
微小发报道,Argo 的开发者 Sam Gao 在产品设计初期就将 DeepSeek 融入其重要功能,作为一个工作流系统,Argo 将 LLM 作为标准的 DeepSeek R1 内置,工作流的生成则交由 DeepSeek R1 处理。由于工作流的特性,Token 的消耗和上下文信息量极为庞大,“平均>=10k Token”。Argo 还将 CoT(Chain-of-Thought)融入工作流思考流程。DeepSeek 的开源不仅降低了工作流产品的成本,还允许用户在 Argo 中本地部署 LLM,从而保障用户隐私安全。
在 DeepSeek R1 发布之前,Argo 已经将初步训练逻辑 Chain-of-Thought(CoT)集成进 Agent Workflow 的制作流程中。特别是在 meme 交易和市场趋势分析等任务上,Argo 采用了 Graph-of-Thought (GoT) 定制其工作流程,这种新颖的方法将推理以图形方式构建,节点代表“LLM 思想”,边则表示这些思想之间的依赖关系。
因为 Argo 选择了 GoT(当前唯一应用此模型的 Crypto AI Workflow),实现了更可靠和透明的流程。这种创新方法直接提升了 Argo 平台交易的安全性和信任度。将思维图(GoT)集成到 Web3 AI 代理中,使 Argo 成为 AI 加密交易的先锋。CoT 的结构化推理不仅增强了金融交易的安全性,也确保了透明、可靠的决策,这在去中心化金融(DeFi)中至关重要。 值得关注的是,Argo的核心开发者Sam与Shaw联手撰写的论文《EraseAnything: Enabling Concept Erasure in Rectified Flow Transformers》,探讨了如何在不影响模型整体生成性能的情况下,从大规模文本到图像扩散模型中去除不希望的概念。这一研究得到了DeepSeek研究员Xingchao Liu的支持。
🚀 Hyperbolic Labs的创新
Hyperbolic Labs首开先河,在其GPU平台上托管DeepSeek-R1模型。用户可以租用Hyperbolic的GPU资源,在本地或指定的数据中心运行DeepSeek-R1模型,而无需将敏感数据上传到DeepSeek的服务器。这种方法不仅保护了数据隐私,还能充分发挥DeepSeek模型的卓越推理性能。通过Hyperbolic的去中心化计算网络,用户能够以更低的成本获取DeepSeek模型的高效推理能力。这对初创公司、超级个体创业者,甚至那些渴望高效使用AI的用户来说,都是一个极具竞争力的解决方案。
💥 市场的挑战与机遇
这一轮泡沫破裂,无疑让Crypto AI市场遭受重创,许多AI Token的炒作价值骤然下降。但实际上,DeepSeek并不是在消灭Crypto AI,而是在推动市场加速进化。随着DeepSeek R1的推出,Crypto AI的未来将不再仅仅依赖投机,而是要围绕去中心化AI计算、模型训练的经济激励机制、AI资源的公平分配和实用产品等方向进行重构。真正的挑战在于Crypto能否利用DeepSeek带来的技术革命,建立一个真正有价值的AI生态,而不仅仅是制造概念和炒作。
🌱 进化与加速
这不是结束,而是进化。Crypto AI需要更快、更激进地前进!