
出品 | 网易智能亚洲一区域二区域三区域四区域
作家 | 小爪
剪辑 | 王凤枝
Claude Fable 5上线后,许多东说念主看跑分,许多东说念主在算账。
这很非凡。
这个模子虽然很强。Anthropic说它是首个面向公众绽放的Mythos级别模子,亦然当今能用到的最强Claude。但第一波体验帖里,冒得最快的词不是强。
是贵。
有东说念主晒账单:一个网页版《模拟东说念主生》类花式,花了100好意思元。有东说念主在Reddit上提醒,重度任务里,一分钟会烧掉约2% 的额度。
于是Fable 5把一个问题甩给了用户:你手里这件事,配不配让它出手。
它照实很强,但不是顺手用的那种强
Fable 5的能力口碑并不差。
违抗,最早一批体验者对它的评价很高。Every首席实施官丹・希珀(Dan Shipper)在X上发了一条传播很广的长帖,说他们里面测试了一周掌握,覆没编程、写稿、营销、剪辑等任务。统一轮测试也被作念成了一支视频。他给出的判断很告成:这是天下上最佳的编程模子。

他的帖子里有许多夸张但有画面的体验:它能处理坐褥故障积压,能作念3D花式,能分析客户反馈和网站数据,还能把问题拆成可测试的管制决策。换成往日,这些内容富饶复古一篇法式的新模子发布稿。
更明慧的是后半段。
希珀说,Fable 5 \"很慢,很吃token\"。它适应最重的职责,不适应和洽写稿这类需要快速往复的任务。他还用了一个很狠的譬如:拿它作念日常常识职责,像用火箭辐射器拍蚂蚁。
一个模子强到能处理坐褥故障积压,也慢到不适应陪你一句一句改著作。这个反差,比跑分更接近确凿使用。
一个模子能完成某个任务,并不等于它应该被用在这个任务上。 往日用户问模子,大王人先问\"它能不行答好\"。Fable 5之后,更多东说念主启动问另一个问题:这件事值得用这样重的模子吗?
价钱表仅仅第一层,确凿贵在职务会扩张
Fable 5的贵不是猜出来的。
这里要先辨认两种\"贵\"亚洲一区域二区域三区域四区域。
对API斥地者来说,玉体当今单价。Anthropic官方价钱表写得很清亮:每百万输入token 10好意思元,每百万输出token 50好意思元。手脚对照,Claude Opus 4.8是5好意思元输入、25好意思元输出。Fable 5的基础API单价,卤莽是上一代顶级Opus的两倍。
对Claude Pro / Max这类订阅用户来说,贵不一定是立时多付一笔钱。Fable 5在6月22日之前被包含在付费筹画中,之后会转向基于容量和使用额度的拜访。用户体感里的\"贵\",更多来自额度烧得快:明明还在订阅里,但一次重型任务就能把可用额度飞速吃掉。
要是仅仅两倍,用户恐怕会这样明锐。
问题在于,Fable 5这种模子的使用面孔,自然会把一次任务拉长。
它更适应长崎岖文、复杂代码、多智力推理、器具调用和自我检讨。一个看似浮浅的\"帮我完成这个功能\",在自主代理式职责流里可能不是一次回答,而是一串筹画、读文献、改代码、跑测试、修故障、再考据。价钱内外的token单价是静态的,确凿任务里的token豪侈是动态的。
Reddit的ClaudeAI社区里有效户发帖,说我方在Max 20x筹画里试Fable 5,重少许的任务里,用量卤莽每分钟掉2%。这个说法不行告成换算成整个订阅用户的老本,同帖也有东说念主说我方莫得遭遇这样夸张的豪侈。但它富饶阐扬,早期重度用户一经启动把Fable 5当成一个会明显豪侈额度的重型器具。

这等于用户启动算账的原因。
他们不是只在看单价,而是在看一次完好任务的总老本。
雷同的说法也在酬酢平台上冒出来。有东说念主戏弄Fable 5很擅长两件事:写代码和掏空银行账户。还有东说念主晒出一个一次生成网页项筹画老本,说用Fable 5作念了一个网页版《模拟东说念主生》类花式,花了100好意思元。
这个问题在对比测试里更明显。有东说念主拿Fable 5和Opus 4.8作念同题对比:Windows 11截图复刻里,他反而合计Opus 4.8略微更好;到了3D版Flappy Bird和Remotion飞生动画,Fable 5才明显拉开差距。临了他的论断不是\"Fable无脑更好\",而是更接近一句居品忽视:它很强,但不是每个界面或编程任务王人应该上Fable,Sonnet或Opus在一些场景里更经济。
Anthropic并非莫得提供缓解工夫。订价页面里,提醒词缓存和批处理API王人能把部分调用价钱压下来,对高频调用的斥地者有实质价值。仅仅这些更像工程侧的优化,平素用户确凿小心的,照旧一次完好任务跑完之后,额度还剩若干。以前新模子上线,用户常问:\"它比上一代灵敏若干?\"
此次后头多了半句:\"这少许灵敏,我买不买得起?\"
慢,不仅仅恭候几秒
这里要把\"慢\"说准确。
Fable 5并不是整个场景王人被吐槽反馈粗笨。第一波公开反馈里,更汇聚的诉苦是贵、用量废弃快、吃token。\"慢\"更多来自傲型任务体验:它会想很久,跑很久,占用很长崎岖文,适应把任务丢给它之后等效能,而不是一问一答地往复磨。
慢具体慢在那处,代码审查和长任务测试里看得最清亮。代码审查器具CodeRabbit的一段接头拿Fable 5作念测试,论断是它更澈底、更慢,也更贵。在DeepSuite长任务里,Fable有任务跑到90分钟以上超时;手脚对照,欧美妇人实战bbwbbwCodex频繁12到17分钟,Opus约24到34分钟。Fable跑通的任务平均也要43分钟掌握,并豪侈约3.5万token。

这不是聊天框里多等三秒的问题。
用户等的不是一句复兴,而是一段后台功课。
不同任务需要的速率不雷同。写一句话、改一个标题、查一个倡导,用户需要的是快、低廉、顺遂,不错反复往复。Fable 5在这些任务上可能不合算。它会调用更多崎岖文,张开更长推理亚洲一区域二区域三区域四区域,豪侈更多额度,临了获取的效能恐怕比一个更轻的模子更适应这个场景。
复杂代码、长文档分析、多代理编排、需要它自我考据的任务,才更接近它的惬意区。
Fable 5的体验反馈,也在迫使用户再行流露模子单干:不同任务应该有不同档位。
那支Every视频把Fable 5比成\"曲速引擎\":跨星系很快,但不适应在城里转弯。希珀在视频里展示了一个《巴别藏书楼》浏览器3D游戏,用一个提醒词让Fable 5我方读故事、策划、实施、检讨,跑了三四个小时才完成。
这个例子比\"模子更灵敏\"更直不雅。你给它一个筹画地,然后离开座位。几个小时后总结,看它有莫得果然抵达。
Anthropic其实也在往这个主义推。官方材料强调Fable 5能在最高推理强度下反念念并考据我方的职责,更适应高度自主的操作。换成居品说话,它既回答问题,也在承担更长的任务链。
任务链越长,恭候和老本就越成为体验的一部分。
最强模子正在变成\"高功率档\"
Fable 5刷新能力上限,虽然遑急。
但此次更极度念念的是,用户启动把模子当成资源来休养。
往日一年,AI居品给用户造成了一个很强的心计预期:订阅之后,璷黫问,璷黫试,最强模子就在聊天框里。哪怕知名额,许多东说念主仍然把它当成一个近似无穷的日常器具。
Fable 5把这个预期往回拉了一步。
它不是不行顺手用,而是顺手用的代价变得更明显。用户启动将强到,最强模子应该留给高价值任务。写代码架构、配置杂故障、读超长文档、作念多智力分析、跑一整套代理职责流,这些任务可能值得。顺手改几句话、列一个提纲、把一个网页总结成三点,恐怕值得。
这不是表面判断。统一支视频里也提到,Fable 5在写稿和营销案牍上并莫得明显压过Opus 4.8,句子还会显得更密、更文体化。对需要快速往复的日常写稿,希珀仍然更偏向用更快的日常主力模子。
Fable的强,主要落在少数重负务上:它把那里的天花板推得更高。

这会逼着AI居品改默许体验。
以后一个锻真金不怕火的AI职责台,可能不该只让用户手动选拔一堆模子名。它还要判断:此次是不是重负务,大选录跑多久,会不会明显烧额度,半途需不需要让用户阐发。
这些开关听起来贫穷,但它们会越来越像居品体验自己。
好的居品恐怕总把最贵的能力摆在前台。更多时候,它应该替你判断:此次用快模子就够了,照旧值得开一次Fable。
Fable 5的第一波反馈,一经把这个问题推到用户眼前:你花出去的钱,买到的是一段策画时间、崎岖文、推理深度和失败重试。
能力也启动分层
还有一个更明锐的分层。
Fable 5是公众不错用的版块;Mythos 5与它同属Mythos级,但拜访畛域更窄,初期主要通过Project Glasswing和受信任拜访筹画提供给部分合作方。
Reddit上有效户把这件事解读为:前沿AI正在变成一种带门槛的能力。 这个说法有社区情感,不行告成当论断。但它提醒了一件事:最强AI能力一经不仅仅\"有莫得发布\"的问题,还包括谁能用、在哪些场景能用、遭遇高风险央求会不会被左迁、什么组织能拿到截止更少的版块。
这和价钱问题连在沿途。
一个用户有莫得月付会员,仅仅第一层门槛。一个团队有莫得预算、有莫得效量管制、有莫得任务路由、有莫得东说念主工验收和回滚机制,才决定它能不行弥远吃到最强模子带来的收益。
Fable 5的体验反馈因此有点矛盾。
全球承认它强,也承认它贵;风景为重负务付钱,又不肯意把每一次轻任务王人交给它;期待它自主完成更多职责,又操心一条央求在后台扇出成一大串token豪侈。
这等于第一批用户确凿遭遇的Fable 5:能力很诱东说念主,代价也终于藏不住了。
AI居品不再仅仅\"更灵敏\"
往日看模子更新,最容易写成一句话:更灵敏了。
Fable 5虽然更灵敏。但它也把几个很实验的问题摆到了桌面上:谁决定该用它,什么时候值得等,什么任务值得烧token,一次代理式央求在后台扩张时,谁来踩刹车。
用户看到的是一个输入框,公司看到的可能是一串子任务、器具调用、崎岖文传递、检讨和重试。能力越强,越容易让东说念主把更大的任务交给它;任务越大,老本和恭候就越不行被藏在界面后头。
这会让AI居品从\"聊天框竞争\"参加\"休养系统竞争\"。
确凿难的,可能会变成很具体的居品细节:什么时候自动切到轻模子,什么时候提醒用户这是一项重负务,什么时候先问一句\"要不要持续烧额度\",什么时候必须把东说念主拉总结验收。模子越强,这些小开关越遑急。
Fable 5的第一波体验声息,一经给了一个清亮信号:用户不是不肯意为强模子付费,他们不肯意在不知说念代价的情况下,让每个任务王人变成重型任务。
Fable 5的居品意思,不仅仅\"Anthropic又发布了一个强模子\"。
更耐看的变化在用户这边:最强Claude上线后,第一批东说念主终于启动厚爱问,什么事情配得上最强模子。
它让东说念主看到上限。
也让东说念主启动看账单。

