DataFi 项目盘点:从机制到落地,谁在构建数据金融新秩序?(上篇)
2025-07-31 12:30
Portal Labs
2025-07-31 12:30
Portal Labs
2025-07-31 12:30
订阅此专栏
收藏此文章

自 RWA 成为政策与市场的双重焦点以来,各类现实资产正加速探索上链路径。其中,数据类 RWA 项目尤为引人注目。2025 年 7 月,上海数据交易所宣布启动“可替代表征数据资产(RDA)”试点,将部分公共数据与企业数据打包为链上资产,首次以“数据包”形式进行市场化发行与收益分配试验,标志着数据市场从“交易数据使用权”迈向“定价数据资产本身”的关键转折。

为什么数据成为 RWA 产业的重要构成?传统数据市场显然给出了答案。

在数字经济高速扩张的今天,我们每一次点击、关注、点赞、甚至滑动,都在不断产生可被商业利用的数据资产。根据 IMARC 2025 年报告(编号:SR112025A3650)显示,2024 年全球数据货币化市场规模达 41 亿美元,预计 2033 年,规模将达到 161 亿美元,复合年增长率(CAGR)为 15.76%。另一组来自 DMR 的数据(报告代码: RC-1412)则推算,2025 年全球数据经纪市场价值将达到 3125 亿美元,到 2034 年将达到 5981 亿美元,复合年增长率为 7.5%。

然而,这场变革并未真正打破“数据利益错配”的旧结构。RDA 的推出,固然是数据持有方资产化的一大步,却并未触及数据生产者的核心权益。现实中,企业掌握数据,平台设定规则,最终获得收益的,始终是机构而非个体。普通用户持续供给行为数据,却既无定价权,也无参与权,更谈不上收益分成。这一现象,正是 DataFi 试图颠覆的结构性痼疾。

2025 年中旬开始,以 Openledger、Irys、DataDance 为代表的面向个人用户的 DataFi 项目相继发力,试图打破数据经纪公司和平台垄断,将“数据资产化”的收益链条重新链接至个体贡献者,为数据生产者争取实际的获利空间。

为帮助读者理解这些项目的核心机制与商业模式,Portal Labs 将分为上下两篇进行评估分析。不过在正式开始之前,我们有必要先问一句:什么是 DataFi?


从 InfoFi 到 DataFi

或许你没听说过 DataFi,但 InfoFi 肯定有所耳闻。2025 年上半年,InfoFi 代表性项目 Kaito 和 cookie.fun 可谓是红极一时。

InfoFi,即 Information Finance,强调“内容即资产、注意力可变现”。它将社交平台上的发言、标签、点赞和影响力作为资产载体,通过内容上链与积分激励机制,为用户提供“内容创作即收益”的路径。然而,其局限也很明显。

首先,InfoFi 只覆盖了数据资产中的“内容维度”,并且仅是社交媒体内容,覆盖面略窄;其次,InfoFi 的激励机制高度依赖社交声量与互动量,结果是少数创作者受益,大多数用户参与感与回报感不足。再加上激励的作用下,往往会为了刷激励,而发内容,往往会导致内容的机械与空洞。

正是在这样的背景下,DataFi 作为下一阶段的数据资产化尝试开始崭露头角。它试图把“数据作为资产”的愿景,推进到更完整、更结构化、更具参与性的版本。

与 InfoFi 仅聚焦“内容”不同,DataFi 的核心在于结构化行为数据的资产化。它关注的不是你发了什么帖、说了什么话,而是你在网络世界中“做了什么”——浏览、点击、购买、订阅、跳出、对比、评价……这些行为背后的路径、偏好与节奏,才是品牌营销、AI 训练、商业建模最渴望的价值信号。

而在 Web3 语境中,DataFi 并不只是一套“采集数据 - 打包出售”的流程,它强调“授权即激励”的闭环机制,即数据的每一次使用,都必须经过用户明确授权,并伴随平台激励反馈。数据所有权、控制权、收益权因此被重新拆解与重构,形成了一种基于加密证明、隐私保护与可验证使用的资产流转模式。

一个典型的 DataFi 平台,往往具备以下三个要素。

  1. 数据采集与授权层:用户通过插件、App 或链上身份工具,将自己的部分数据(如浏览记录、购买行为、位置轨迹等)纳入系统,并可自由选择授权给哪些用途或品牌使用。
  2. 隐私保护与价值验证层:为了避免 Web2 式的“裸数据交易”,DataFi 平台通过 ZK 等隐私计算技术,将用户数据加密转化为结构化信号,从而实现“数据不出域,价值可验证”。同时,平台还需搭建价值验证机制:如行为标签匹配度、数据新鲜度评估、使用次数限制、贡献独立性识别等。
  3. 收益分配与撮合执行层:当数据被实际调用,且满足合约内设定的使用条件后,平台将通过智能合约,依据预设收益模型,自动完成多方之间的价值分配(如用户、平台、节点、模型提供方等),并在链上完成记录,以确保分配过程的公开、可追溯与不可篡改。

这套机制本质上重构了数据流通的范式,即在用户(数据生产者)的授权之下,调用并出售数据的使用权,并在数据实际被使用并产生价值之后,将收益按规则反馈给用户本人。

那么,不同的 DataFi 项目又是如何设计这一底层架构和商业模式的呢?首先,Portal Labs 来拆解近期动作频频的 OpenLedger。


案例一:OpenLedger

AI 热潮已无需赘言,然而当前 AI 行业面临着一个严峻的问题:模型再强,也需要“能用的数据”,但现实并不理想。数据质量参差、归属不清、使用不合规,正成为 AI 产业下一阶段的系统性障碍。

近年来,AI 赛道的头部企业因训练数据争议频频陷入诉讼泥潭。

OpenAI 被多家媒体起诉,称其未经授权使用文章训练 GPT‑4,被指控违反版权法规;北美知名作者如 Sarah Silverman、George R. R. Martin、Christopher Golden 等也加入诉讼大军,迫使法庭重新审视 AI 数据训练的合法边界;欧盟数据保护组织 NOYB 向 Meta 发出法律挑战,指出其“使用 Facebook+Instagram 用户数据训练 AI 模型”时未获得用户明确同意,可能触犯 GDPR 要求;Reddit 也对 Anthropic 提起诉讼,指控其在未经同意的情况下抓取大量 Reddit 评论进行 AI 训练。

在此背景下,OpenLedger 围绕 AI 训练所需的“数据溯源 + 使用确权”难题,打造了一套以账本为底层、可计量为特征、能分润为闭环的数据流通结构。

它的核心并非创建一个新的数据市场,而是试图提供一种「可供 AI 放心调用」的数据框架:

  • 所有数据上传与使用过程均记录在链上,形成可溯源的调用路径;
  • 每一条数据都绑定上传者的身份与标签结构,便于 AI 模型在推理前进行预筛与构建使用范围;
  • 一旦某个模型调用了某类数据,即触发链上“使用登记 + 价值结算”机制,由模型开发者支付调用费用,系统自动向数据贡献者发放分润。

技术架构

OpenLedger 设计了一套围绕「链上归因、数据分润与模型调用结算」展开的底层架构,核心由四部分构成:

Datanets & Data Contributor

它并不是一个统一的数据市场,而是多个可自主创建的数据网络(Data + Subnet)。任何开发者或组织都可以基于某一特定领域(如金融文本、医药记录、用户行为等)发起一个 Datanet,吸引数据贡献者上传原始数据,并标注标签、来源与权限。这种结构有助于提高数据的可用性、可筛选性,也天然内置“领域归属感”。

Proof of Attribution

这是链上归因机制。OpenLedger 不直接出售数据本身,而是在 AI 模型调用数据完成训练或推理后,评估每一份数据对模型结果的贡献程度。这种“贡献即价值”的算法结构,不仅避免了数据滥用问题,也为后续分润奠定了可量化基础。

Payable AI / Economic Model

这是 OpenLedger 尝试解决“AI 模型收益如何反馈到数据贡献者”这一难题的关键路径。所有模型调用、执行与输出结果都在链上登记,当模型开发者或使用者触发某次推理行为时,系统即刻记录调用数据来源,计算归因结果,并自动执行费用结算与收益分配。这一过程无需平台撮合,完全由链上合约自动完成。

Governance & Model Factory

OpenLedger 允许开发者通过“模型工厂(Model Factory)”快速部署 AI 模型,如 OpenLoRA 架构,并为其设置收益逻辑、调用权限与分润规则。所有设置均可通过链上治理模块完成,数据贡献者也可就某模型的数据使用方式、收益分配权重进行投票或治理提案,确保整个系统的运作公开、透明、可调。

生态建设

技术搭建是一方面,生态组建的节奏也在持续推进中。

根据官网披露,OpenLedger 已经与 Kaito、AltLayer、Trust Wallet、EtherFi、Near、EigenLayer 等 44 个知名 Web3 项目达成合作,涵盖数据验证、Agent 接入、链上部署等多个维度。这不仅为其账本机制的实际应用提供了初步落地场景,也标志着其正在从底层设施逐步延展出一个“数据×AI”的互联生态。

围绕开发者生态的建设,OpenLedger 已在过去半年内组织了近十场线上线下活动。其中较为核心的包括:

  • 在 ETHGlobal New York 黑客松设立“AI Attribution”专题赛道;
  • 于 Devconnect Istanbul 发起数据主权主题闭门研讨;
  • 与 Giza、Worldcoin 等项目联合举办旧金山“AI x Onchain Compute”工作坊。

上半年,OpenLedger 团队在上海、杭州、深圳等城市举办多场线下 meetup 与开发者私享会,邀请国内 AI 基础模型团队、Web3 基础设施项目、去中心化存储协议等参与讨论“可溯源数据结构如何服务 AI 模型训练”的落地议题。

目前,其开发者社区目前已形成五大区域节点,包括湾区、东海岸、柏林、巴塞罗那、新加坡,贡献者超过 150 人,涵盖账本写入插件、可验证数据集成器、ZK 处理管道等方向。一些早期工具组件也已开启 Alpha 测试,包括浏览器插件式数据上传器与 Chrome-based Proof 发射器。

与此同时,2024 年底,OpenLedger 正式启动 OpenCircle 激励计划,宣布将投入 2500 万美元支持 AI 与 Web3 开发生态的早期构建与测试部署。该计划聚焦于 Agent 节点、模型推理、数据共享等模块,已成为当前 OpenLedger 生态中最具实际投入与吸引力的激励机制之一。

路线图

根据官方规划,OpenLedger 将在 2025 年第三季度完成 OpenCircle 激励计划的第一阶段,重点推进两项核心模块的落地:一是 Agent 接入模块,用于为外部 AI 系统构建结构化、可验证的链上数据调用路径;二是公共账本桥(Public Ledger Bridge),实现不同链上数据网络间的可组合性与同步索引能力。

与此同时,团队计划于 2025 年底前上线面向开发者的 Ledger SDK 与 UI 组件集成工具包,以降低 AI 产品集成门槛,推动从协议层到应用层的闭环成型。这将标志着 OpenLedger 从底层协议构建,进入“开发者可用工具链”阶段,完成从基础设施到应用工具的首次闭环搭建。

值得注意的是,截至目前,OpenLedger 尚未公布 Token 上线时间表,也未披露相关 Token 经济模型细节。结合其当前聚焦底层模块建设与开发者生态搭建的战略节奏,可以判断该项目仍处于“技术验证 + 社群拓展”阶段,尚未进入资本化释放周期。这一进程安排,也在某种程度上体现出其以技术能力为主导、暂不急于引入流动性预期的冷启动路径选择。

融资进展

根据 Rootdata 显示,OpenLedger 在 2024 年 7 月完成了 800 万美金的种子轮融资,由 Polychain、Borderless Capital 领投,投资阵容还包括 Hashkey Capital、MH Ventures、Mask Network 等一线机构。根据 Protagonist 披露,该资金主要用于账本系统初始架构和数据确权协议的搭建。

优势分析

1.明确定位:做 AI 的账本

OpenLedger 不参与模型训练、数据存储、算力租赁等资源密集型赛道,而是专注于提供一套链上可信的“AI 调用账本”结构。它的核心价值在于记录、组织和验证 AI 系统的调用路径与行为结果,成为用户、开发者与模型之间的中立基础设施。

2.结构原生为 AI 设计:支持多模型接入与组合使用

在 OpenLedger 上,AI 模型可以模块化注册为“可调用组件”,形成链上索引与统一接口;不同模型可以被 Agent 组合调用,并形成可验证路径。这种组合式结构不仅降低了多模型交互门槛,也为未来 Agent 网络提供了基础的可追踪调用图谱,是传统链下系统所不具备的能力。

3.激励机制嵌套于架构内,形成可追溯的价值流动路径

在 OpenLedger 的 OpenAzure 架构中,调用路径一旦形成链上记录,相关参与方(如模型、数据提供方、执行节点)即可获得预设激励。这种基于行为轨迹的激励机制,为 AI 生态提供了明确、结构化的价值分发逻辑。

劣势分析

1.商业模型严重依赖 AI 项目调用行为

OpenLedger 的商业闭环建立在“AI 项目调用其账本结构”的基础上,也就是说只有当调用真实发生时,记录才被写入链上,激励才有分配依据。如果没有足够多的 AI 项目接入、调用活跃度低,无论是对平台还是对最终用户,都难以形成实质性的收益回报,也就无法实现商用闭环和生态活力。

2.数据仍然中心化存储,面临潜在安全与隐私风险

尽管调用和归因证明链上透明,但实际原始数据仍保存在 OpenLedger(或其合作方)控制的集中式存储系统中。这意味着与真实去中心化模型相较,仍存在被入侵、泄露或滥用的潜在风险。对安全性要求极高的应用场景,如隐私敏感型数据或特殊行业数据,可能对这种存储机制保持谨慎态度。

3.社区参与机制有限,核心治理仍相对集中

尽管 OpenLedger 引入了如 OpenCircle 等参与机制,允许用户投票决定模型优先级与调用权重,但目前平台的核心逻辑(包括激励结构、标签规则、收益分配等)仍由项目方主导设定。其“社区参与”尚未上升为链上治理或 DAO 机制,也缺乏明确的 Token 权利绑定路径。在生态规模扩大、利益复杂化的阶段,如何进一步实现社区协商能力与协议透明度,将成为其治理结构面临的重要挑战。


未完待续

本篇我们详细分析了 OpenLedger 如何围绕 AI 和数据使用权构建链上可信调用账本,但 OpenLedger 并不是 DataFi 赛道的唯一参与者。

在下篇文章中,Portal Labs 将继续为大家解析另外两个同样值得关注的 DataFi 项目,Irys 与 DataDanceChain。这两个项目在数据授权、隐私保护以及商业闭环设计上各有巧妙之处,分别体现了 DataFi 领域不同的创新路线与实现路径。

下一篇,我们不见不散!

【免责声明】市场有风险,投资需谨慎。本文不构成投资建议,用户应考虑本文中的任何意见、观点或结论是否符合其特定状况。据此投资,责任自负。

Portal Labs
数据请求中
查看更多

推荐专栏

数据请求中
在 App 打开