Thinking in Bets

读书发布于 2026-06-28 更新于 2026-06-28

人生是扑克

在正式进入这篇文章之前，我希望你可以先暂停下，回忆下过去半年内你做过的所有决策，其中最好和最差的决策分别是什么？如果你已经有了答案那么可以继续阅读。

第一个问题：当你在回忆最好和最差的决策时候，你是如何评估一个决策的好坏的？是通过这个决策所带来的结果吗？是否带来了好结果的决策就是好的决策，带来了差的结果的决策就是个差决策呢？

不知道你是否买过彩票，买彩票这个决策时而会带来好的结果，时而带来坏的结果。那么我们该如何评价购买彩票这个决策呢？

买彩票的结果几乎完全是靠「运气」，如果是其他人买了彩票并且中奖了，我们不会说他做了好的决策，而是说他运气真好。「运气」是这个世界运行中的不可知因素，它不是我们能够通过逻辑推理出来的，哪怕是世界上最聪明的人和最强大的计算机，也无法计算出运气。

因为运气的存在，我们的生活更多的时候像是在打扑克（尤其是德州扑克），而不是在下象棋。在象棋中，所有棋子都是公开信息，游戏的双方比拼的是逻辑推理能力。而在扑克游戏中，你永远不知道对方手里拿着什么牌，是真的拿了手好牌还是在诈唬，一手好牌也可能输，一手烂牌也可能赢，扑克比拼的是在不确定中做决策的能力。

从信息论的角度，两者最大的区别是：

象棋是完全信息博弈（Perfect Information）。双方知道全部状态，没有随机事件。理论上存在一个最优策略。
扑克是不完全信息博弈（Imperfect Information）。存在隐藏信息和随机发牌，你永远无法知道世界的完整状态。

所以我们说人生是扑克，而不是象棋。首先，你拿到的牌不是你能决定的，有人出生富裕，有人贫穷，这些会影响我们，但不是我们的责任，我们真正要回答的问题是「如何打好手里的牌？」；其次，没有人知道所有的信息，我们永远是在不确定性中行动，而且我们也必须在信息完整之前就行动；也正因如此，每一次行动都是在下注，每一次决策，都是在用今天有限的资源来换取未来可能出现的结果。

做决策就是下注

米塞斯是奥地利学派经济学的代表人物，他最著名的著作是《Human Action》。虽是一本经济学著作，但它真正讨论的是人的行动（human action）。米塞斯认为经济学就是研究人在资源稀缺条件下如何做出行动，也就是如何决策。他最影响深远的观点是：

Human action is purposeful behavior.
人的行动，是有目的的行为。

米塞斯认为一次决策必须包含四个要素：

存在不满意（Uneasiness）
存在一个希望达到的未来状态（Desired End）
相信行动能够改变结果（Means）
在不同手段之间选择（Choice）

而之所以我们需要做选择（决策）是因为我们所有用的资源是稀缺的，所以我们不得不放弃 A、B、C 而选择 D。稀缺不是单纯的「少」，而是「渴望拥有」和「实际拥有」之间的差距；一个东西只有在被渴望、且不足以满足渴望时，才构成稀缺。

人们常说「人生就是在做选择」，我不这样认为，「选择」听起来就好像是晚饭吃拉面还是炒饭一样简单，我更倾向于把选择分成几种类型：

第一类是消费型选择（Consumption Choices）。它们影响的是当下体验，例如今天吃什么、看什么电影、穿什么衣服。这些选择当然也是经济学意义上的选择，但几乎不会影响未来的人生，因此不值得投入大量认知资源。
第二类是优化型选择（Optimization Choices）。这类选择需要一定成本，也需要分析利弊，例如买哪辆车、买哪台电脑、住哪家酒店、选择哪个工具。它们是在一个相对确定的世界里寻找更优方案。结果基本是已知的，你付出成本，就能得到对应的产品或服务，因此它们属于优化问题，而不是下注问题。
第三类，我认为应该叫人生下注（Life Bets）。这类选择投入的是有限且不可轻易收回的资源，面对的是一个无法预测的未来。更重要的是，它们会改变未来的机会集合（Opportunity Set）。今天决定创业，以后能选择的事情变了；今天决定移民，以后的朋友、工作、文化环境都变了；今天决定投资一家公司，未来的财富结构和职业路径也可能完全不同。每一次下注，都不仅是在赌一个结果，而是在塑造未来的自己。

所以这三类的真正区别可以从四个维度来理解：成本是否高、结果是否不确定、选择是否可逆、是否改变未来机会集合。而我们在这里所讨论的选择（决策），实际上就是第三类，这种决策的成本更高、结果充满不确定、切不可逆、同时也会改变未来的机会集合。所以我们将其称之为「下注」，有一点赌的性质在里面，但并不尽然。

下注是有代价的信念

我们拥有有限的时间、金钱和注意力，不可能把这些资源同时投入到所有地方，因此我们必须回答：这些资源应该投向哪里才能让价值最大化？于是，每一次决策，本质上都是一次资源配置。那么我们的依据是什么呢？

在 2016 年伯克希尔股东信里，巴菲特建议非专业投资者应该长期持有 S&P 500 指数基金，因为普通人很难长期战胜市场。

Over a ten-year period commencing on January 1, 2008, and ending on December 31, 2017, the S&P 500 will outperform a portfolio of funds of hedge funds, when performance is measured on a basis net of fees, costs and expenses.
在从 2008 年 1 月 1 日开始、到 2017 年 12 月 31 日结束的这十年间，以扣除各项管理费、成本和开支后的净收益来衡量，标普 500 指数的表现将优于一个由对冲基金组成的基金组合。

如果这个策略对多数人来说更优，为什么不是所有人都这样做？因为有人相信自己能识别好公司，相信自己有认知优势，这些人是在下注自己，相信自己有能力跑赢 S&P 500。也就是说资源总是投向决策者相信价值最高的地方。每个人根据自己对于未来的理解进行资源配置。这种对未来的理解，我们把它称为信念（belief）。

回到米塞斯对行动的定义，「存在一个希望达到的未来状态」，但这个未来是否真的会达到，没有人知道。但如果必须等到未来确定以后才行动，那么人将永远不会行动。这些行动之所以能够发生，是因为人们相信某一种未来更有可能发生，相信世界会以某种方式运转，相信某个行动会提高某种结果出现的概率，相信自己有能力承受过程中的波动，并相信这个结果值得付出代价。信念，就是人在面对不确定未来时，仍然愿意采取行动的依据。它不保证结果，但它让行动成为可能。而下注，就是为我们为自己的信念付出代价的行为。

如果信念只是停留在我们的脑子里，那它只是一个观点。经济学有一个很重要的思想叫做 Revealed Preference（显示性偏好），由经济学家保罗·萨缪尔森（Paul Samuelson）于1938年提出。它认为一个人的真实偏好不是他说出来的，而是通过他的行为表现出来的。换句话说，一个人的资源配置，就是他价值观的外在表现。

好的决策是你会毫不犹豫再次选择的决策

未来不确定，也就意味着失败是不可避免的，既然如此，那么我们究竟从下注中得到了什么？答案就是反馈（新的信息），或者更准确地说，是为了校准我们的信念，提升我们下一次下注的成功率。这并不意味着结果不重要，只是因为结果不确定，如果你受到幸运女神眷顾，那么再好不过了。

下注不是一个孤立的行动，而是一个反馈系统的一部分。

信念 → 下注 → 反馈 → 更新信念 → 更好的下注。

每一次下注，都会产生新的信息；新的信息，又会修正我们的信念；修正后的信念，又会改善下一次决策。我们真正获得的，不是一次成功，而是一次次不断的校准我们对这个世界的认知。长期来看，每一次下注都能让我们的信念更接近真实世界，判断力就会形成复利。

这就回到我们最开始的问题，我们如何判断一次决策的好坏，结果好的决策就真的好决策，而结果差的决策就真的是坏决策吗？不一定，因为结果往往带有「运气」的成分，而决策是在信息不完整的前提下做出的。因此评价一次决策，就不能从结果去倒推，而应该回到当时的条件：在当时已知的信息、概率、风险和机会成本下，如果再来一次，我们是否还会选择我们当初的决策，如果答案是肯定的，那么这就是好的决策，如果答案是否定的，那么就是坏决策。

这也是为什么我们要不断重复这个系统，为什么人生需要不断的下注，因为人生不是一次下注，而是一系列的下注，我们关注的不是某一次下注的结果，而是信念不断校准，不断接近现实运行逻辑的的信念，会持续不断的为我们带来复利。爱因斯坦说复利是人类世界最伟大的发明，财富的复利如此，认知的复利也是如此。到这里我觉得更能理解巴菲特，巴菲特虽然是在讲财富复利，但归根结底，财富的背后是资产配置的能力，是对是世界越来越准确地理解。

偏见会影响我们的决策

如果我们已经知道什么是好的决策，那么现实中为什么我们仍然不断做出坏决策？答案就是偏见。旧文《思考，快与慢》里面介绍了我们是如何思考的。

我们的大脑拥有两种不同的思考模式
系统 1 快速、直觉，擅长处理日常琐事，但容易受到偏见影响；
系统 2 缓慢、理性，能够帮助我们做出深思熟虑的决策，但它的运行消耗大量的认知资源。

压力、情绪、睡眠状态、周围环境等等都会导致我们无法使用系统 2 来进行理性思考，我们可以把偏见分成三类，它们分别影响我们整个反馈系统的不同环节：

第一类是污染信念形成的偏见，比如确认偏误和可得性启发；确认偏误让我们只寻找支持自己原有观点的信息。
第二类是污染下注行为的偏见，比如损失厌恶、沉没成本、过度自信；它们让我们下注过大、拒绝止损，或者把「我相信」误认为「我知道」。
第三类是污染反馈解释的偏见，比如 resulting、后见之明偏误、自利偏误；它们让我们把成功归因于能力，把失败归因于运气，于是反馈没有变成学习，反而变成自我保护。

偏见最大的问题是下注没有让信念更接近现实，反而让旧信念变得更顽固。

降低偏见对决策系统的破坏

既然偏见会污染整个下注反馈循环，那么问题就变成了：我们如何降低偏见对决策的影响？首先，偏见是无法被彻底消除的，我们能做的是设计一套工具，来确保整个反馈系统正常运转。

事实上，这也是科学面对不确定性的方式。Karl Popper 提出的可证伪性（Falsifiability）认为，一个理论是否科学，并不取决于它能够解释多少现象，而取决于它是否愿意接受现实的检验，以及是否存在可能被现实推翻的条件。

Carl Sagan 在《The Demon-Haunted World》中进一步提出了著名的 Baloney Detection Kit（胡扯检测工具箱）。它的核心思想与 Popper 已知：主动寻找反证、接受独立验证、区分假说与事实、避免诉诸权威，并始终保持怀疑。

这与《Thinking in Bets》讨论的决策过程几乎完全一致。

定义下注 → 明确信念 → 校准概率 → 寻找反证 → 时间校准 → 设计下注 → 预设退出 → 复盘更新。

定义下注

目标是确认这件事到底是不是值得启动完整决策流程的 Life Bet。

很多人一上来就分析选项，但还没弄清楚自己究竟在赌什么。这里我们要回答的问题是：这个决策的成本是什么？不可逆程度有多高？未来的机会集合会如何改变？最坏情况是什么？时间尺度是多少？如果它只是消费型选择或优化型选择，就不值得投入太多认知资源；如果它会消耗大量时间、金钱、声誉、关系，才进入完整流程。

明确信念

目标是把脑中的模糊感觉变成可检查的假设。这里会用到的工具包括 Decision Journal、Probability Estimate、Belief Statement，还有 Annie Duke 很喜欢的 “Wanna Bet?” 这个问题。

其实就是准备一个文档，在下注前写下我相信什么、为什么相信、成功概率是多少、关键假设是什么、我可能错在哪里、我愿意付出什么成本。它的价值是防止未来的你篡改记忆。结果发生之后，人会自然地产生后见之明偏误，觉得自己早就知道，或者把当初模糊的判断美化成清晰的逻辑。决策日志把下注前的信念冻结下来，让未来的复盘有证据。

校准概率

目标是给自己设定一个基准线。这里用到的工具是：Outside view、Base rate、Reference class forecasting。

实际上还是在你的文档中，回答这几个问题：为什么我们能做这件事情？历史上哪些人成功了，哪些人失败了，行业内的成功概率有多高？失败的原因分别是什么？而我们当下拥有的资源是让我们更接近成功还是在失败？

寻找反证

目标是让自己提前判断风险，这里使用到的工具是：

Premortem：做法很简单，在真正下注之前，假设这件事已经失败了，然后倒推它为什么失败。
Red team：它原本来自军事和安全领域，意思是让一组人站在对立面，专门攻击你的方案、假设、证据和防御。因为团队很容易产生共识幻觉，尤其当老板已经表达倾向时，其他人会不自觉地配合这个方向。红队的任务是像敌人一样思考：如果我是竞争对手，我会如何打败你？如果我是用户，我为什么不买？红队的价值在于，让反对变成一种流程，让批评转变成职责。
devil’s advocate：类似于 Red team，只是相对轻量级，在讨论中，指定一个反对方，不断的提出反对意见，这个判断最可能错在哪里？我们是否只看到了支持证据？有没有另一种解释能说明同样的现象？如果我们不做这件事，最强理由是什么？

一个好下注不应该害怕反证；如果一个想法只能在没有反对意见的环境里成立，它本身就不值得投入大量成本。

时间校准

所谓时间校准，是让未来的自己参与到现在的决策当中。使用的工具包括：

10–10–10：问自己这个选择在 10 分钟后、10 个月后、10 年后分别会造成什么后果。
反向规划（Backcasting）：它的做法是从理想未来倒推今天应该做什么：假设三年后这个下注成功了，那中间发生了哪些关键事件？哪些条件必须成立？今天要做什么才可能走到那里？它和 premortem 是镜像关系。
未来的自己（Future Self）：在做大决策时问一句，六个月后、一年后、十年后的我，会感谢现在的我，还是会替现在的我承担代价？很多坏决策，本质上是现在的自己把成本转嫁给未来的自己：今天的冲动消费，就是在用未来的现金流付款。
心智时间旅行（Mental Time Travel）：它指的是在头脑中穿越时间：回到过去，理解当初的判断；去到未来，想象不同选择可能带来的后果。人很容易把短期舒服误认为长期正确，把短期痛苦误认为错误信号。

设计下注

第五阶段是设计下注，这里的工具是：

仓位控制（Position Sizing）：投资里的概念，意思是你不只要判断某个机会好不好，还要决定押多少。
可承受损失（Affordable Loss）：回答如果失败，我最多能失去什么，并且这个损失是否不会摧毁我。
Small Bet：这个可以理解为 MVP，即用最小成本去验证最关键的假设。
Optionality：好的下注应该尽量保留或扩大未来的选择，而不是过早把自己锁死在单一路径里。选择权本质上是一种不对称结构：有限的损失，无限的机会。

预设退出

第六阶段是预设退出，目标是在冷静时替未来情绪化的自己设定边界。工具是

终止条件（Kill Criteria）：也就是推出条件，即当发生什么事情的时候，我们应该退出，或者重新评估。
止损（Stop-Loss）：同样是投资里的话术，即当达到某个边界条件时自动减仓或者退出。
尤利西斯契约（Ulysses Contract）：也就是预先与自己约定好交易规则。它来自《奥德赛》里的故事：尤利西斯知道自己听到海妖歌声时会失去理性，所以提前让船员把自己绑在桅杆上，并命令他们无论自己怎么哀求都不要松绑。例如在投资里，当你知道未来的自己会被情绪、恐惧或贪婪支配时，提前设计约束，让未来的自己更难做蠢事。

复盘更新

第七阶段是复盘更新，目标是把结果转化为信念更新，工具是

事后验尸（Postmortem）：主要描述「发生了什么，以及为什么发生」。它像给一个已经结束的项目、产品实验做解剖：原来的目标是什么，实际结果是什么，中间哪些假设被验证了，哪些没有被验证，哪些风险被低估，哪些信号被忽略，哪些外部因素超出控制。它的重点是还原事实链条，尽量把故事拆成证据。
决策复盘（Decision Review）：回答这是否是一个好的决策，回到当时信息条件下，我的决策过程是否合理？回头看当时的 decision journal：我当时知道什么，不知道什么，给出的概率是否合理，是否查了 base rate，是否做了 premortem，风险是否可承受，退出条件是否清楚，仓位是否匹配信念强度。它评估的是过程质量，而非结果本身。
信念更新（Belief Update）：即我们学到了什么，也是整个复盘的最终目的。比如你原来相信「通过分析财报能够识别优秀的公司」，一次亏损之后不能简单更新为「我不适合投资」，更好的更新可能是「我对商业模式判断还可以，但低估了资产负债表风险，下一次必须把债务结构作为硬约束，并降低单票仓位。」

未来永远不会在我们行动前交出完整证据。我们拥有的，是自己的信念与有限的资源，以及在不确定中行动的勇气。所谓决策，就是把这些资源押向某个未来假设；所谓下注，就是让信念付出成本，并接受现实的审判。

人生像扑克，它提醒我们：结果从来不只属于判断，也属于运气；一次赢不能证明我们看见了真理，一次输也不能证明我们当初愚蠢。真正重要的是，在每一次下注之后，我们是否愿意诚实地面对反馈，修正信念，调整筹码，重新选择更好的牌桌。

偏见会让人保护自己，但我们可以使用工具接近真实。决策日志、外部视角、基础概率、事前验尸、10–10–10、退出标准、复盘更新，它们看起来是方法，其实是一种谦卑：承认自己会犯错、承认未来不可知、承认直觉需要校准、承认信念只有经过现实检验才有价值。

好的决策系统追求的不是某一次的胜利，而是一种长期的学习能力。每一次下注都让我们更理解世界、也更理解自己、更懂得如何配置资源。久而久之，这种被现实不断校准的判断力会形成复利。它让人不只是承受不确定性，也让我从不确定性中获利，形成反脆弱的力量。

最后，决策能力不是预测，而是在不确定中持续学习的能力。我们无法保证每一次下注都会赢，但可以让每一次下注都不被浪费。只要信念还能更新，未来的机会集合还在扩大，我们就仍然在游戏中，并且越来越有资格参与更好的游戏。