编辑: BlockBeats
自 2023 年初以来,人工智能(AI)已经成为科技领域的新高地,尤其是在 ChatGPT 的推动下,AI 技术的热潮在全球范围内迅速蔓延。这场趋势不仅引发了一场涉及全球科技巨头的「AI 军备竞赛」,更是重塑了科技产业的发展轨迹。对于 Web3 行业的从业者来说,AI 与 Web3 的结合不再是遥远的概念,而是一个明确且可行的发展方向。
在过去的一年中,「Web3 + AI」的概念迅速成为行业热词。在这一过程中,一个行业共识逐渐形成:「区块链解决生产关系问题,AI 解决生产力问题」。这不仅是对两大技术领域融合的精准概述,也预示着 Web3 与 AI 结合将成为未来科技发展的重要趋势。在 Binance Labs 公布的第六季 12 个全球孵化计划项目中,QnA3 作为一款「AI 驱动的 Web3 知识平台和投研交易工具」,是其中颇具代表性的与 AI 紧密结合的 Web3 DApp。
BlockBeats 分析了 QnA3 的发展情况,并对各个阶段的技术路径和理论进行了梳理。
QnA3 的发展路径
QnA3 团队成立于 2023 年 1 月,在短短一年内实现了其产品从 0 到 1 的巨大蜕变:6 月,QnA3 上线问答功能,用户量突破 1 万;9 月,QnA3 上线以意图为中心的 Telegram 机器人,用户量突破 30 万;12 月,QnA3 上线数据挖矿功能,QnA3 日活跃用户数霸榜 BNB Chain No.1 超过半个月时间,用户量突破 200 万。如今,QnA3 用户数已飙升至 900 万。
QnA3 的核心定位:Web3 世界居民必备的 AI Agent
根据官方的介绍,QnA3 是 Web3 世界居民必备的 AI Agent,协助用户进行 Web3 化全生命周期的全场景管理。
1)信息管理 AI+Research =「RAG」
QnA3 是 Web3 领域中 AI+搜索的领跑者和全能型选手。
基于 GPT 微调模型等通用智能生成能力及 Google、微软 Bing 等搜索引擎构建,QnA3 对比 ChatGPT 等生成式 AI 具有专业数据和专有知识的壁垒,信息时效性强、可追溯信源并有效减少幻觉。对比谷歌等传统搜索引擎,QnA3 答案没有信息冗余、准确可信,问题可被拆解,答案可被反馈。
依托于对 LLM 的理解和 Pre Train(预训练)、Post Train(训练后),Scaling Up(可扩展性),Inference(推理)的丰富经验 [1],QnA3 将 LLM 与搜索有机结合,优秀的产品力、工程化能力和快速迭代能力使 QnA3 后发先至,在众多前行者中突围并稳固领跑者身份。信息管理功能已经可以满足概念问题,实时问题,推理问题,市场分析问题和交易问题等不同场景的需求。
实现后发先至的核心技术原理:将 RAG(Retrieval Augmented Generation,检索增强生成)技术发挥到极致,同时满足「Web3 知识专业性」、「高实时性」和「问答内容强关联性」。
在项目成立早期,QnA3 就分析了以 ChatGPT 为代表的通用大模型,认为 LLM 主要的问题之一为内容时效性差(2023 年初 OpenAI 发布的 ChatGPT3.5 版本,数据范围只能统计到 21 年 9 月),同时存在缺乏索引带来的潜在幻觉风险。
本质上来说,LLM 无法生成训练数据与语料库之外的内容,也无法为生成内容提供精确索引和参考依据。QnA3 采取的方式是学习 Meta。2020 年,Meta 研究人员通过引入 RAG 把与问题相关的事实交给 LLM 加工和学习,不仅结合了生成模型的先验知识,也汲取了检索模型的实时性和内容的丰富性。
检索增强生成(RAG)技术原理 [2]
检索增强生成技术(RAG)包含检索、生成两个环节。
检索系统(Retriever):检索环节包括需求编码器(Query Encoder)和文档索引(Document Index)。使用两个不同的 BERT 模型将需求 q 与文档 z 分别编码为 q(x) 和 d(z),进而使用最大内积搜索算法获取内积最大的文档,将其与需求共同输入生成部分。
生成系统(Generator):在此环节,生成器根据检索器总结输出最终答案。大模型会根据输入预测下一个词的出现概率,并生成概率最大的单词。共有两种方式计算生成概率:1)RAG-Sequence:使用同一个文档预测,先确定文档再计算候选词概率;2)RAG-Token:使用不同文档预测,每个候选词的概率为所有文档的条件概率之和。
QnA3 以 RAG 作为 AI+Research 的核心技术,凭借团队超过十年的数据经验,以数据的理解和应用能力为基础,在检索能力、响应速度和数据源质量三项重要指标始终保持领先地位;采用 RAG 融合外部知识库与模型先验知识,外部知识库丰富且易于更新的数据有效弥补了大模型数据滞后、伴有幻觉的劣势。
2)资产管理 AI+Trading =「具备 Intent-Centric 的 AI Agent」
交易是所有 Web3 世界居民绕不开的环节。QnA3 基于 Paradiam 提出的「以意图为中心」(intent-centric)的概念,结合用户与 AI 交互的问题,得到了几个洞察:
1)用户意图的建立是逐步的,但是最初的意图是模糊的,甚至是不准确的。
2)意图的准确与否直接决定了用户最终的体验,而这很大程度由意图识别来决定。
3)最终配合用户的实现路径越简单快捷安全越好。
主流科学界将人类与 AI 的合作由初级到高级分为 Embedding、Copilot 和 Agents 三种模式。在 Copilot 模式下,工作由人类主导、部分任务初稿由 AI 协助完成,而在 Agents 模式中,AI 充分发挥「智能」,可以表现出更强的任务拆分、工具选择和进度控制能力,人类只需设立目标、提供资源并监督结果,工作的具体展开可全权交由 AI 代理,即「以意图为中心」(intent-centric)。
对「以意图为中心」(intent-centric)实践的系统框架,OpenAI 安全团队负责人 Lilian Weng 曾提出,在基于大模型的自主代理系统中,LLM 作为核心控制器,充当 AI Agent 的大脑,具备推理能力,而其他三个关键组件 Planning、Memory 和 Tool Use 将赋予 LLM 执行更复杂任务的能力 [3]。这与 QnA3 在实现 Intent-Centric 时设计 AI Agent 的思路不谋而合 [4]。
在完成信息的管理工作后,QnA3 上线的代币技术面分析与交易功能,解决了用户信息与交易间跨产品,多操作的纷繁之苦。在获取信息后即时把握市场机会,并通过算法选择手续费最低,滑点最低,路径最短,交易最安全的方式完成交易。
从近几个月的用户体验与反馈看,基于「以意图为中心」(intent-centric)而设计的 QnA3 AI Agent 已经具备行动能力,能够帮助用户完成从信息管理到资产管理的多项具体任务,用户只需进行目标设定和等到结果即可。由此可见,ChatGPT 与 QnA3 在文本理解和推理能力上都具有优异表现,能够对用户提出的问题做出详细解答,但在垂直赛道中 QnA3 通过 RAG 而更显优势,同时,已经具备行为能力的 QnA3 还能够代替用户实现 AI+Trading 的「帮他做」。
3)权利管理 AI+DePIN=「Decentralized Machine Learning」
如果要进一步提升 Web3 的发展水平,当今市场存在两个基本共识:
1)必须引入更多 Web2 用户将其转化;
2)必须与实体经济建立联系。
2023 年 DePIN 的增长对 Web3 生态系统产生了相当大的影响。随着 DePIN 边界的扩大,它展示出成为面向消费者的应用层的资质,类似于 DeFi、游戏和社交,具有大规模采用的潜力,可以推动对底层链或生态系统消费者需求。
Pantera Capital 执行合伙人 Paul Veradittkit 在其博客中提到,DePIN 趋势的增长也对去中心化治理产生了下游影响。目前大多数 DAO,如 Uniswap、Compound 和 MakerDAO,几乎都与数字或金融化资产有关。随着 DePIN 项目的成熟并逐渐将治理交接给 DAO,DAO 协调购买、使用和维护物理设备(无论是服务器、传感器还是硬盘)的需求将不断增加。DePIN 可能成为一个趋势,将 DAO 的治理权限从数字资产扩展到物理资产,最终可能需要 DAO 运作和行为更像传统公司,这可能是标志着「Web3」在「现实世界」中被采用的一个转折点 [5]。
QnA3 产品一发布,就以问答的形式作为链接 Web2 与 Web3 两个世界的桥梁。在引入几十万 Web2 用户的同时,QnA3 也在不断探索更多将两个世界联通的方式。
受到 DePIN 热潮的启发,QnA3 于近期推出数据挖矿功能,将去中心化的实体设备的闲置算力用在 AI 模型训练中,使用 Web3 世界的激励机制为用户提供被动收入,完成「用户贡献算力」、「算力产出数据训练模型」、「更好的模型服务用户」的闭环。QnA3 选取的 AI+DePIN 方式将去中心化硬件层与社区所有的新数据经济融合在一起。
Messari 视角下的 DePIN 基本上是链下数据生成结合链上数据确认两大模块,核心是确权和规模效应,同时 DePIN 有几种模式,如定制专用硬件,比如 Helium ;或者专用激励层,将常用硬件转化或加入为 Web3 网络,比如 Render Network,将个人闲置 GPU 组网出售给他人 [6]。
AI+DePIN 三个关键因素分别是:
1)扩展性能能力:DePIN 的硬件规格要求会影响算力提供者的数量和扩展速度;
2)采用便利性:减少摩擦是吸引更多算力提供者的关键;
3)代币经济学:为利益相关者设计和调整代币经济学。
QnA3 通过 AI+DePIN 的模式,借助用户的算力来帮助其完成数据抓取与数据清洗工作。与此同时,QnA3 认为在硬件物权的确权上,数据的价值必须被重视,人作为数据的主体需要新的数字权利,这才是 DePIN 背后的价值取向,而非单纯的数据上链和代币激励。与实际业务相结合,QnA3 最终选取了 Decentralized Machine Learning 的方向。AI 项目的发展永远都将面临着计算瓶颈以及缺乏协作的限制。将 AI 与 DePIN 相结合,QnA3 有望能够逐步地解决这些问题。
现在的尝试仅仅是 QnA3 在 Decentralized Machine Learning 应用场景下迈出的第一步,未来 QnA3 还考虑推出硬件钱包和桌面机器人等更多拳头产品,从而构建起以 AI 为核心,涵盖 research,trading 与 DeFIN 的服务矩阵,形成 AI Agent 为核心,涵盖信息管理,资产管理和权利管理的的产品框架,满足用户全生命周期的全场景需求。
QnA3 三大优势
研究驱动
QnA3 是 Crypto 项目里厚积 AI 研究实力的产品,QnA3 与美国斯坦福大学、加州大学伯克利分校、西北大学等知名科研机构合作,近期将会在顶级期刊联合发表学术论文。集齐 OpenAI、Google DeepMind、Meta、Apple、Nvidia 等全明星阵容的技术顾问委员会。创始团队主要 base 在美国,来自腾讯、百度和国际知名投资银行,在数据、AI 和 crypto 领域经验丰富。
用户导向
凭借对用户的理解和对市场的敏锐,产品上线半年的时间里,QnA3 已经实现了多次关键的版本迭代。特别是在更新频繁的时期,几乎每周都会推出新的功能,每两个月会推出重要功能。信息管理功能已经可以满足概念问题,实时问题,推理问题,分析问题,交易问题,价格问题等不同场景的需求;资产管理功能识别用户意图并帮助用户完成;权利管理功能将在未来逐步实现用户的物权和人权的数字化管理;真正实现以用户为中心的产品实践。
功能创新
产品功能迭代速度快,每周一个小版本。两个月一个大版本。从时间发展的线路看,从立项到产品上线,不足三个月,然后上线半年时间收获 900w 用户,覆盖全球 166 个国家和地区,每日 UAW 接近 200K,已经长居 BNB 链榜首。
QnA3 的未来潜力
人机交互新方式
QnA3 快速增长的用户数量验证了对话式搜索引擎的刚性需求。在 Web3 垂直领域产品定位对标谷歌、ChatGPT 等巨头具备数据和场景卡位优势,更易于实现 AI Agent 的场景闭环。
目前的人机交互方式主要以图形界面和触控交互为主,但未来 QnA3 可以成为操作系统级别的入口,实现「对话即接口」的全新人机交互范式,或将带来全新的软件服务形态。
生产工具向生产力跃迁带来商业化的巨大空间
AI 既是基础设施,又是生产力引擎,如同蒸汽机,电力,计算机和互联网。在 AI 赋能下,众多应用软件都将由生产工具向生产力跃迁,参与生产价值分配。而与 QnA3 类似的工具软件将逐步从辅助人类提效的「生产工具」成为独立的增量「生产力」,从而或能够直接参与生产价值的分配。在 AI 应用未来能够成为一部分「生产力」的情况下,未来的模式从收取效率提升「抽成(Take rate)」的角度来衡量其潜在能够实现的增量价值上限。
QnA3 上线的 Telegram 机器人可以帮助 KOL 管理社群并在社群内实现问答、代币分析和代币交易,上线伊始便完成商业闭环。此外,QnA3 也与媒体、交易所和培训网站达成合作。QnA3 表示,这种生态样本和抽成模式不同于交易所和交易机器人抽成的商业模式,他们在意的不是佣金,而是与用户目标相同,成为利益共同体,从而参与增值收益的分配。
QnA3 的两个伙伴:OpenAI & Google
相较于 OpenAI
QnA3 vs ChatGPT 具备以下核心优势:
1)专有数据和专有知识壁垒
许多高价值、特定领域行业依赖于丰富的专有数据集。针对这些细分行业的人工智能解决方案需要在这些数据上进行训练。然而,拥有这些数据库的实体将专注于保护其数据护城河,不太可能允许第三方无限制地访问这些数据库以进行人工智能训练。因此,这些实体将在内部或通过特定的合作伙伴关系建立专门用于这些工作流程的专业人工智能系统。这些系统将有别于一般的人工智能模型。
2)信息时效性强
ChatGPT 等大模型只包含训练时的数据和语料,后续信息无法及时更新。QnA3 基于底层传统搜索引擎开发而得,具备时效性强的优点。
3)易于溯源
QnA3 生成的内容都在下方附有引用链接,在保证可靠性的同时便于用户溯源或深入研究。
4)减轻幻觉
通用大模型的幻觉问题在细分行业高质量的追求下是不可接受的。QnA3 有专属的数据筛来源和筛选机制,通过多道流程规避这个问题。
AI+Research 与大模型技术对比
生成式 AI 语言理解与生成能力突出,但存在幻觉、数据缺乏实时性等劣势。生成式 AI(Generative AI)是一种基于 AI 技术的机器学习模型,它对海量训练数据进行学习并根据其特征生成与原始数据相似的全新内容,生成内容可以为图像、视频、音乐、语音和文本等。近年来计算机硬件性能的提升和预训练技术的发展使生成式 AI 能力实现跃迁,以 ChatGPT 为代表的大型语言模型具备语言理解能力强大、多样化生成能力等优点,被广泛应用于各行各业。但生成式 AI 无法做到实时更新,且受限于训练数据,可能无法覆盖相对小众、缺乏通用性的长尾知识。同时,生成式 AI 对生成内容的可控性较差,存在「幻觉」问题,用户也难以对答案进行直接验证。
检索增强生成(RAG)融合外部知识与模型先验知识,有效弥补生成式 AI 缺陷。检索增强生成(Retrieval Augmentation Generation)由检索和生成两部分组成,首先在知识库中根据需求召回最匹配的文档内容,再作为提示词输入模型生成答案。
5)专业作为质量的核心
细分行业的工作流程要求高质量,奖励任何质量改进动作。任何应用于细分行业的人工智能解决方案都需要不断调整以提高质量。反应速度和反馈效率对于质量至关重要。通用模型本身的高兼容性在这里会导致质量的差距,可以想象如果火箭的人工智能模型被 GPT-4 这类的通用模型代替,结果将是毁灭级的。这种质量差距必然导向专业化调整。
相较于 Google
QnA3 vs Google 等传统搜索引擎具备以下核心优势:
1)页面清爽,答案直接
输入一个问题时,传统搜索引擎呈现多个并列链接,其中穿插大量广告,而 QnA3 会结合最相关的链接直接生成精炼答案。提高信息获取效率,减少关键字查询、筛选、链接点击和页面浏览;让 Web3 用户在嘈杂的市场环境和海量信息中直接了解事情的真相,并通过简洁明了的个性化答案做出决定。
2)细分领域精细搜索
QnA3 作为 Web3 知识库和 AI+Research 工具,用户在 Web3 垂类领域精确搜索,结果更具针对性。
3)问题拆解和追问能力
基于大模型的理解能力,QnA3 可以对用户提问逐步拆解并追问澄清,精确把控用户需求。在谷歌中搜索是什么、为什么类型的问题,谷歌能都应对自如。但是涉及更复杂的问题,如「某个代币现发展阶段值不值得购买」、「请对于 XX 代币进行技术面分析」,「比较 BTC 与 ETH 的优劣」,QnA3 显然比谷歌会回答得更好,QnA3 的引擎有着更加强大的理解问题、总结问题、拓展问题的能力,无疑让它有了更强的竞争力。
4)反馈功能
QnA3 生成回答后,用户可以对其准确性进行反馈,以强化学习的反馈机制帮助其进一步提升模型准确性。QnA3 以积分的方式和用户进行链上交互。
在 Web3 领域,能做,和做得好,有很大的差别。Google 在其第一款搜索产品后,几十年间发展出了涵盖 Android,Gmail 和 Map 的超大产品矩阵。OpenAI 在去年的开发者大会上也宣布推出 GPT Sotre。现在谷歌市值 1.7 万亿美元,OpenAI 估值接近千亿美金。目前,QnA3 通过其核心产品在广大 Web3 用户中证明了自己,从长远发展上来看,QnA3 未来一定会在 Cyrpto+AI 这一领域添上更加浓墨重彩的一笔。
[1]《火炬,钥匙,桥梁和未来》https://reurl.cc/eL3Kvm
[2] Lewis, Patrick, et al.「Retrieval-Augmented Generation for Knowledge-Intensive NLP Tasks.」ArXiv abs/2005.11401 (2020): n. pag.
[3]《LLM Powered Autonomous Agents》https://lilianweng.github.io/posts/2023-06-23-agent/ + CICC Research Department
[4]《意图之上,行为之下》https://reurl.cc/dL23dk
[5]《DePIN:Decentralized Hardware Meets the New Data Economy》https://www.veradiverdict.com/p/depin?utm_source=profile&utm_medium=reader2
[6] Messari,《crypto-theses-for-2024》https://resources.messari.io/pdf/crypto-theses-for-2024.pdf