金融业押注「交易基础模型」:为什么银行自建,而不是接通用大模型
NVIDIA 把 Revolut、Mastercard、Adyen、Stripe 攒成一条叙事:金融业的赢家模型是用自家交易流水训练的专用基础模型。数据独占性才是垂直 AI 的护城河,但这套故事里有几处该打折。
概述
NVIDIA 6 月 1 日的这篇官方博客,把 Revolut、Mastercard、Adyen、Stripe 四家攒成同一条叙事:金融业正在从「每个业务线一个专用模型」转向「一个用自家交易流水训练的基础模型」。它管这个新物种叫交易基础模型(transaction foundation model),核心主张是把 transformer 架构搬到结构化的表格交易数据上,学出一个对客户行为的统一表示,再用它同时驱动欺诈、信用、推荐等多个下游任务。
这条叙事最值得拿走的判断不是「transformer 又赢了一个领域」,而是:在金融这种数据高度独占的垂直行业,护城河不在模型规模,而在谁拥有那条别人复制不了的交易流水。这也正好解释了为什么这些机构是自建专用模型,而不是接一个通用大模型。当然,这是 NVIDIA 自家卖货的叙事,几个被反复引用的数字和「架构已成熟」的口气都该打折再看。
发生了什么
NVIDIA 给交易基础模型下的定义是:在数十亿笔金融事件(支付、转账、产品交互、行为信号)上训练的大规模 AI 系统,把原始流水转成可复用的表示。和传统欺诈模型的区别在于上下文:传统模型孤立地评估单个信号,基础模型则在时间、设备、地点、历史行为构成的上下文里解读同一笔交易。文里那个例子很具体:一笔半夜的支付,如果是 10 分钟内第四笔、发生在陌生设备、客户从没交易过的城市,含义就完全不同。
四个落地案例是这篇的实质内容:
Revolut 与 NVIDIA 合作建了一个叫 PRAGMA 的 transformer 基础模型家族,训练数据是 240 亿笔事件、2600 万用户、100 多个国家,跑在 Hopper GPU 加 cuDF 库加 Nemotron 开放模型的栈上,部署在 Nebius 云。Revolut 信用数据科学负责人 Tadas Kriščiūnas 给的最硬的一句话是:特征工程从过去的几周甚至几个月,变成完全不需要。
Mastercard 在做一个自有的大型表格基础模型,当前训在数十亿笔匿名交易上,目标扩到数千亿,纳入欺诈、授权、拒付、商户位置、忠诚度等更多数据集,用了 NVIDIA NeMo AutoModel 加 AWS 加 Databricks。Adyen 已规模化部署,处理了 1 万亿美元支付量,用强化学习给商户提升转化、压低风险,其 AI 产品负责人 Dhruv Ghulati 说哪怕授权率 0.1% 的提升都能换来可观的增量交易额。Stripe 用 NVIDIA 加 AWS 平台建模型理解完整交易上下文,称去年拦下约 1120 亿美元欺诈、欺诈率平均降 38%。
NVIDIA 同时放出了一个叫 Build Your Own Transaction Foundation Model 的开发者示例,主张任何机构都能据此在自家表格交易数据上起步建 transformer embedding,接进现有管线而不必从头重建。
为何重要
真正改变判断的是这句:在金融业,训练数据本身就是护城河。NVIDIA 把这点说得很直白,交易历史是竞争对手复制不了的专有资产。这和过去两年通用大模型的逻辑正好相反。通用 LLM 的竞争是公开语料加模型规模加算力,谁都能从大致相同的互联网文本起跑,壁垒薄、容易被追平。而一家银行那 240 亿笔交易、2600 万真实用户的行为序列,既买不到也爬不来,这才是别人补不上的差距。
这就回答了核心问题:为什么这些机构选择自建专用模型,而不是接一个现成的通用大模型。两个层面的原因。数据层面,核心风控数据是结构化表格流水、不是文本,也绝不会喂给外部模型,所以「调一个第三方 API」从合规和数据主权上就走不通。架构层面,这些机构选的是把 transformer 用在表格数据上,从原始流水直接学表示,而不是套用为自然语言设计的模型。这两点合起来,意味着金融垂直 AI 的赢家不会是模型最大的那家,而是数据最独占、且有能力把自家流水训成统一表示的那家。
它还暗示了一个架构层面的真实转变:从「碎片化的任务专用模型」转向「单一统一表示」。NVIDIA 把碎片化的代价讲得有道理,每多一个用例就多一个模型,每进一个新市场就要重训,彼此不共享上下文的模型会把价值留在桌上。一个能跨任务复用的统一表示,确实能省下重复的特征工程和模型维护,Revolut 那句「特征工程归零」就是这个收益最直接的体现。这对任何手里攒着大量结构化行为数据的机构都是个信号,不只是银行。
对建设者的影响
如果你在金融或其他数据独占的垂直行业做 AI,这篇给的最实在的一条是:先盘清自家专有数据的规模和独占程度,这才是决定你能不能、值不值得自建基础模型的前提,而不是先去比模型架构。Revolut 那个量级(240 亿事件、2600 万用户)是个参照,但门槛不在绝对数字,在于这些数据是不是别人拿不到的、是不是覆盖了足够长的行为序列。数据不够独占、不够长,自建一个 transformer 基础模型大概率不如继续用调好的专用模型划算。
第二条,别把「接通用大模型」当成默认选项再去找它哪里不行。在核心风控这种结构化、强合规的场景里,通用 LLM 从一开始就不是合适工具:它没有你的专有数据,架构也不是为表格序列优化的。值得评估的方向是 transformer-on-tabular 这条路,以及它能不能用一个统一表示替掉你现在那一堆各自为战的专用模型,从而砍掉重复的特征工程。
第三条要冷静:统一表示并非没有代价。把欺诈、信用、推荐压进一个模型,意味着这个模型一旦出问题,波及的是所有下游任务,而不再是孤立的一个。监管解释性、版本回滚、单点故障这些问题,文里完全没提,但落地时绕不开。这恰恰是 NVIDIA 这种厂商叙事会略过的部分,得你自己补上。
该忽略什么
第一个该打折的,是那些被当成既定事实引用的厂商自报数字。Stripe 的 1120 亿美元拦截欺诈、38% 欺诈率下降,Adyen 的 0.1% 授权率提升,GFT 的误报降 75%,Revolut 跨任务全面胜过专用模型,这些全是各家自己报、NVIDIA 转述、没有第三方复核的数字。它们方向上可信,具体幅度该当成营销口径而非审计结论。尤其「单个基础模型在所有任务上都胜过专用模型」这种全面性表述,几乎肯定有挑选过的对比基线。
第二个该忽略的,是「架构已成熟、基础设施已就绪、现在就能上」的紧迫感。这篇结尾那句「数据已经存在,架构已经验证,基础设施已经就绪」是典型的卖货话术。它转述的恰恰都是 Revolut、Mastercard、Stripe 这类有顶级数据科学团队和巨量数据的机构,把它们的成功包装成「任何机构现在都能做」。那个 Build Your Own 开发者示例降低的是起步门槛,不是把数据规模、数据治理、模型运维这些真正的难处也一并解决了。
第三,别把这读成 NVIDIA 中立的行业观察。整篇的落点是卖 GPU 和软件栈:Hopper、cuDF、Nemotron、NeMo AutoModel 在每个案例里反复出现。它对交易基础模型这个方向的判断是对的,但每一个被引用的成功案例同时也是一笔硬件订单,叙事的乐观程度要按这个利益相关性折一道。
常见问题
通用大模型能直接做欺诈检测和信用风控吗?
技术上能跑,但接不进核心风控。欺诈和信用判断要的是对一个客户全部交易序列的连续表示,而这些数据是结构化的表格流水,不是文本,也不会喂给外部模型。通用 LLM 既没有这些专有数据,也没有为表格序列优化的架构。NVIDIA 这篇里所有案例(Revolut、Mastercard、Stripe)用的都是自家训练的 transformer,不是接 GPT 类模型。
交易基础模型的训练数据要多大规模?
按文里数字,Revolut 的 PRAGMA 训了 240 亿笔事件、2600 万用户、100 多个国家;Mastercard 当前用数十亿笔匿名交易,目标扩到数千亿;Adyen 处理了 1 万亿美元支付量。这个量级本身就是壁垒:它来自多年自有业务沉淀,买不到也复制不了,这正是护城河所在。
交易基础模型真比原来的专用模型更准吗?
按 NVIDIA 给的说法是的,但要分清证据强度。Revolut 称单个基础模型在信用评分、欺诈、推荐多个任务上都胜过各自的专用模型;Stripe 称去年拦下约 1120 亿美元欺诈、欺诈率平均降 38%。这些是厂商口径、未经第三方复核的自报数字,方向可信,具体幅度该打问号。