Thinking in Bets
人生是扑克
在正式进入这篇文章之前,我希望你可以先暂停下,回忆下过去半年内你做过的所有决策,其中最好和最差的决策分别是什么?如果你已经有了答案那么可以继续阅读。
第一个问题: 当你在回忆最好和最差的决策时候,你是如何评估一个决策的好坏的?是通过这个决策所带来的结果吗?是否带来了好结果的决策就是好的决策,带来了差的结果的决策就是个差决策呢?
不知道你是否买过彩票,买彩票这个决策时而会带来好的结果,时而带来坏的结果。那么我们该如何评价购买彩票这个决策呢?
买彩票的结果几乎完全是靠「运气」,如果是其他人买了彩票并且中奖了,我们不会说他做了好的决策,而是说他运气真好。「运气」是这个世界运行中的不可知因素,它不是我们能够通过逻辑推理出来的,哪怕是世界上最聪明的人和最强大的计算机,也无法计算出运气。
因为运气的存在,我们的生活更多的时候像是在打扑克(尤其是德州扑克),而不是在下象棋。在象棋中,所有棋子都是公开信息,游戏的双方比拼的是逻辑推理能力。而在扑克游戏中,你永远不知道对方手里拿着什么牌,是真的拿了手好牌还是在诈唬,一手好牌也可能输,一手烂牌也可能赢,扑克比拼的是在不确定中做决策的能力。
从信息论的角度,两者最大的区别是:
- 象棋是完全信息博弈(Perfect Information)。双方知道全部状态,没有随机事件。理论上存在一个最优策略。
- 扑克是不完全信息博弈(Imperfect Information)。存在隐藏信息和随机发牌,你永远无法知道世界的完整状态。
所以我们说人生是扑克,而不是象棋。首先,你拿到的牌不是你能决定的,有人出生富裕,有人贫穷,这些会影响我们,但不是我们的责任,我们真正要回答的问题是「如何打好手里的牌?」;其次,没有人知道所有的信息,我们永远是在不确定性中行动,而且我们也必须在信息完整之前就行动;也正因如此,每一次行动都是在下注,每一次决策,都是在用今天有限的资源来换取未来可能出现的结果。
做决策就是下注
米塞斯是奥地利学派经济学的代表人物,他最著名的著作是《Human Action》。虽是一本经济学著作,但它真正讨论的是人的行动(human action)。米塞斯认为经济学就是研究人在资源稀缺条件下如何做出行动,也就是如何决策。他最影响深远的观点是:
Human action is purposeful behavior.
人的行动,是有目的的行为。
米塞斯认为一次决策必须包含四个要素:
- 存在不满意(Uneasiness)
- 存在一个希望达到的未来状态(Desired End)
- 相信行动能够改变结果(Means)
- 在不同手段之间选择(Choice)
而之所以我们需要做选择(决策)是因为我们所有用的资源是稀缺的,所以我们不得不放弃 A、B、C 而选择 D。稀缺不是单纯的「少」,而是「渴望拥有」和「实际拥有」之间的差距;一个东西只有在被渴望、且不足以满足渴望时,才构成稀缺。
人们常说「人生就是在做选择」,我不这样认为,「选择」听起来就好像是晚饭吃拉面还是炒饭一样简单,我更倾向于把选择分成几种类型:
- 第一类是消费型选择(Consumption Choices)。它们影响的是当下体验,例如今天吃什么、看什么电影、穿什么衣服。这些选择当然也是经济学意义上的选择,但几乎不会影响未来的人生,因此不值得投入大量认知资源。
- 第二类是优化型选择(Optimization Choices)。这类选择需要一定成本,也需要分析利弊,例如买哪辆车、买哪台电脑、住哪家酒店、选择哪个工具。它们是在一个相对确定的世界里寻找更优方案。结果基本是已知的,你付出成本,就能得到对应的产品或服务,因此它们属于优化问题,而不是下注问题。
- 第三类,我认为应该叫人生下注(Life Bets)。这类选择投入的是有限且不可轻易收回的资源,面对的是一个无法预测的未来。更重要的是,它们会改变未来的机会集合(Opportunity Set)。今天决定创业,以后能选择的事情变了;今天决定移民,以后的朋友、工作、文化环境都变了;今天决定投资一家公司,未来的财富结构和职业路径也可能完全不同。每一次下注,都不仅是在赌一个结果,而是在塑造未来的自己。
所以这三类的真正区别可以从四个维度来理解:成本是否高、结果是否不确定、选择是否可逆、是否改变未来机会集合。而我们在这里所讨论的选择(决策),实际上就是第三类,这种决策的成本更高、结果充满不确定、切不可逆、同时也会改变未来的机会集合。所以我们将其称之为「下注」,有一点赌的性质在里面,但并不尽然。
下注是有代价的信念
我们拥有有限的时间、金钱和注意力,不可能把这些资源同时投入到所有地方,因此我们必须回答:这些资源应该投向哪里才能让价值最大化?于是,每一次决策,本质上都是一次资源配置。那么我们的依据是什么呢?
在 2016 年伯克希尔股东信里,巴菲特建议非专业投资者应该长期持有 S&P 500 指数基金,因为普通人很难长期战胜市场。
Over a ten-year period commencing on January 1, 2008, and ending on December 31, 2017, the S&P 500 will outperform a portfolio of funds of hedge funds, when performance is measured on a basis net of fees, costs and expenses.
在从 2008 年 1 月 1 日开始、到 2017 年 12 月 31 日结束的这十年间,以扣除各项管理费、成本和开支后的净收益来衡量,标普 500 指数的表现将优于一个由对冲基金组成的基金组合。
如果这个策略对多数人来说更优,为什么不是所有人都这样做?因为有人相信自己能识别好公司,相信自己有认知优势,这些人是在下注自己,相信自己有能力跑赢 S&P 500。也就是说资源总是投向决策者相信价值最高的地方。每个人根据自己对于未来的理解进行资源配置。这种对未来的理解,我们把它称为信念(belief)。
回到米塞斯对行动的定义,「存在一个希望达到的未来状态」,但这个未来是否真的会达到,没有人知道。但如果必须等到未来确定以后才行动,那么人将永远不会行动。这些行动之所以能够发生,是因为人们相信某一种未来更有可能发生,相信世界会以某种方式运转,相信某个行动会提高某种结果出现的概率,相信自己有能力承受过程中的波动,并相信这个结果值得付出代价。信念,就是人在面对不确定未来时,仍然愿意采取行动的依据。它不保证结果,但它让行动成为可能。而下注,就是为我们为自己的信念付出代价的行为。
如果信念只是停留在我们的脑子里,那它只是一个观点。经济学有一个很重要的思想叫做 Revealed Preference(显示性偏好),由经济学家保罗·萨缪尔森(Paul Samuelson)于1938年提出。它认为一个人的真实偏好不是他说出来的,而是通过他的行为表现出来的。换句话说,一个人的资源配置,就是他价值观的外在表现。
好的决策是你会毫不犹豫再次选择的决策
未来不确定,也就意味着失败是不可避免的,既然如此,那么我们究竟从下注中得到了什么?答案就是反馈(新的信息),或者更准确地说,是为了校准我们的信念,提升我们下一次下注的成功率。这并不意味着结果不重要,只是因为结果不确定,如果你受到幸运女神眷顾,那么再好不过了。
下注不是一个孤立的行动,而是一个反馈系统的一部分。
信念 → 下注 → 反馈 → 更新信念 → 更好的下注。
每一次下注,都会产生新的信息;新的信息,又会修正我们的信念;修正后的信念,又会改善下一次决策。我们真正获得的,不是一次成功,而是一次次不断的校准我们对这个世界的认知。长期来看,每一次下注都能让我们的信念更接近真实世界,判断力就会形成复利。
这就回到我们最开始的问题,我们如何判断一次决策的好坏,结果好的决策就真的好决策,而结果差的决策就真的是坏决策吗?不一定,因为结果往往带有「运气」的成分,而决策是在信息不完整的前提下做出的。因此评价一次决策,就不能从结果去倒推,而应该回到当时的条件:在当时已知的信息、概率、风险和机会成本下,如果再来一次,我们是否还会选择我们当初的决策,如果答案是肯定的,那么这就是好的决策,如果答案是否定的,那么就是坏决策。
这也是为什么我们要不断重复这个系统,为什么人生需要不断的下注,因为人生不是一次下注,而是一系列的下注,我们关注的不是某一次下注的结果,而是信念不断校准,不断接近现实运行逻辑的的信念,会持续不断的为我们带来复利。爱因斯坦说复利是人类世界最伟大的发明,财富的复利如此,认知的复利也是如此。到这里我觉得更能理解巴菲特,巴菲特虽然是在讲财富复利,但归根结底,财富的背后是资产配置的能力,是对是世界越来越准确地理解。
偏见会影响我们的决策
如果我们已经知道什么是好的决策,那么现实中为什么我们仍然不断做出坏决策?答案就是偏见。旧文《思考,快与慢》里面介绍了我们是如何思考的。
我们的大脑拥有两种不同的思考模式
系统 1 快速、直觉,擅长处理日常琐事,但容易受到偏见影响;
系统 2 缓慢、理性,能够帮助我们做出深思熟虑的决策,但它的运行消耗大量的认知资源。
压力、情绪、睡眠状态、周围环境等等都会导致我们无法使用系统 2 来进行理性思考,我们可以把偏见分成三类,它们分别影响我们整个反馈系统的不同环节:
- 第一类是污染信念形成的偏见,比如确认偏误和可得性启发;确认偏误让我们只寻找支持自己原有观点的信息。
- 第二类是污染下注行为的偏见,比如损失厌恶、沉没成本、过度自信;它们让我们下注过大、拒绝止损,或者把「我相信」误认为「我知道」。
- 第三类是污染反馈解释的偏见,比如 resulting、后见之明偏误、自利偏误;它们让我们把成功归因于能力,把失败归因于运气,于是反馈没有变成学习,反而变成自我保护。
偏见最大的问题是下注没有让信念更接近现实,反而让旧信念变得更顽固。
降低偏见对决策系统的破坏
既然偏见会污染整个下注反馈循环,那么问题就变成了:我们如何降低偏见对决策的影响?首先,偏见是无法被彻底消除的,我们能做的是设计一套工具,来确保整个反馈系统正常运转。
事实上,这也是科学面对不确定性的方式。Karl Popper 提出的可证伪性(Falsifiability)认为,一个理论是否科学,并不取决于它能够解释多少现象,而取决于它是否愿意接受现实的检验,以及是否存在可能被现实推翻的条件。
Carl Sagan 在《The Demon-Haunted World》中进一步提出了著名的 Baloney Detection Kit(胡扯检测工具箱)。它的核心思想与 Popper 已知:主动寻找反证、接受独立验证、区分假说与事实、避免诉诸权威,并始终保持怀疑。
这与《Thinking in Bets》讨论的决策过程几乎完全一致。
定义下注 → 明确信念 → 校准概率 → 寻找反证 → 时间校准 → 设计下注 → 预设退出 → 复盘更新。
定义下注
目标是确认这件事到底是不是值得启动完整决策流程的 Life Bet。
很多人一上来就分析选项,但还没弄清楚自己究竟在赌什么。这里我们要回答的问题是:这个决策的成本是什么?不可逆程度有多高?未来的机会集合会如何改变?最坏情况是什么?时间尺度是多少?如果它只是消费型选择或优化型选择,就不值得投入太多认知资源;如果它会消耗大量时间、金钱、声誉、关系,才进入完整流程。
明确信念
目标是把脑中的模糊感觉变成可检查的假设。这里会用到的工具包括 Decision Journal、Probability Estimate、Belief Statement,还有 Annie Duke 很喜欢的 “Wanna Bet?” 这个问题。
其实就是准备一个文档,在下注前写下我相信什么、为什么相信、成功概率是多少、关键假设是什么、我可能错在哪里、我愿意付出什么成本。它的价值是防止未来的你篡改记忆。结果发生之后,人会自然地产生后见之明偏误,觉得自己早就知道,或者把当初模糊的判断美化成清晰的逻辑。决策日志把下注前的信念冻结下来,让未来的复盘有证据。
校准概率
目标是给自己设定一个基准线。这里用到的工具是:Outside view、Base rate、Reference class forecasting。
实际上还是在你的文档中,回答这几个问题:为什么我们能做这件事情?历史上哪些人成功了,哪些人失败了,行业内的成功概率有多高?失败的原因分别是什么?而我们当下拥有的资源是让我们更接近成功还是在失败?
寻找反证
目标是让自己提前判断风险,这里使用到的工具是:
- Premortem:做法很简单,在真正下注之前,假设这件事已经失败了,然后倒推它为什么失败。
- Red team:它原本来自军事和安全领域,意思是让一组人站在对立面,专门攻击你的方案、假设、证据和防御。因为团队很容易产生共识幻觉,尤其当老板已经表达倾向时,其他人会不自觉地配合这个方向。红队的任务是像敌人一样思考:如果我是竞争对手,我会如何打败你?如果我是用户,我为什么不买?红队的价值在于,让反对变成一种流程,让批评转变成职责。
- devil’s advocate:类似于 Red team,只是相对轻量级,在讨论中,指定一个反对方,不断的提出反对意见,这个判断最可能错在哪里?我们是否只看到了支持证据?有没有另一种解释能说明同样的现象?如果我们不做这件事,最强理由是什么?
一个好下注不应该害怕反证;如果一个想法只能在没有反对意见的环境里成立,它本身就不值得投入大量成本。
时间校准
所谓时间校准,是让未来的自己参与到现在的决策当中。使用的工具包括:
- 10–10–10:问自己这个选择在 10 分钟后、10 个月后、10 年后分别会造成什么后果。
- 反向规划(Backcasting):它的做法是从理想未来倒推今天应该做什么:假设三年后这个下注成功了,那中间发生了哪些关键事件?哪些条件必须成立?今天要做什么才可能走到那里?它和 premortem 是镜像关系。
- 未来的自己(Future Self):在做大决策时问一句,六个月后、一年后、十年后的我,会感谢现在的我,还是会替现在的我承担代价?很多坏决策,本质上是现在的自己把成本转嫁给未来的自己:今天的冲动消费,就是在用未来的现金流付款。
- 心智时间旅行(Mental Time Travel):它指的是在头脑中穿越时间:回到过去,理解当初的判断;去到未来,想象不同选择可能带来的后果。人很容易把短期舒服误认为长期正确,把短期痛苦误认为错误信号。
设计下注
第五阶段是设计下注,这里的工具是:
- 仓位控制(Position Sizing):投资里的概念,意思是你不只要判断某个机会好不好,还要决定押多少。
- 可承受损失(Affordable Loss):回答如果失败,我最多能失去什么,并且这个损失是否不会摧毁我。
- Small Bet:这个可以理解为 MVP,即用最小成本去验证最关键的假设。
- Optionality:好的下注应该尽量保留或扩大未来的选择,而不是过早把自己锁死在单一路径里。选择权本质上是一种不对称结构:有限的损失,无限的机会。
预设退出
第六阶段是预设退出,目标是在冷静时替未来情绪化的自己设定边界。工具是
- 终止条件(Kill Criteria):也就是推出条件,即当发生什么事情的时候,我们应该退出,或者重新评估。
- 止损(Stop-Loss):同样是投资里的话术,即当达到某个边界条件时自动减仓或者退出。
- 尤利西斯契约(Ulysses Contract):也就是预先与自己约定好交易规则。它来自《奥德赛》里的故事:尤利西斯知道自己听到海妖歌声时会失去理性,所以提前让船员把自己绑在桅杆上,并命令他们无论自己怎么哀求都不要松绑。例如在投资里,当你知道未来的自己会被情绪、恐惧或贪婪支配时,提前设计约束,让未来的自己更难做蠢事。
复盘更新
第七阶段是复盘更新,目标是把结果转化为信念更新,工具是
- 事后验尸(Postmortem):主要描述「发生了什么,以及为什么发生」。它像给一个已经结束的项目、产品实验做解剖:原来的目标是什么,实际结果是什么,中间哪些假设被验证了,哪些没有被验证,哪些风险被低估,哪些信号被忽略,哪些外部因素超出控制。它的重点是还原事实链条,尽量把故事拆成证据。
- 决策复盘(Decision Review):回答这是否是一个好的决策,回到当时信息条件下,我的决策过程是否合理?回头看当时的 decision journal:我当时知道什么,不知道什么,给出的概率是否合理,是否查了 base rate,是否做了 premortem,风险是否可承受,退出条件是否清楚,仓位是否匹配信念强度。它评估的是过程质量,而非结果本身。
- 信念更新(Belief Update):即我们学到了什么,也是整个复盘的最终目的。比如你原来相信「通过分析财报能够识别优秀的公司」,一次亏损之后不能简单更新为「我不适合投资」,更好的更新可能是「我对商业模式判断还可以,但低估了资产负债表风险,下一次必须把债务结构作为硬约束,并降低单票仓位。」
未来永远不会在我们行动前交出完整证据。我们拥有的,是自己的信念与有限的资源,以及在不确定中行动的勇气。所谓决策,就是把这些资源押向某个未来假设;所谓下注,就是让信念付出成本,并接受现实的审判。
人生像扑克,它提醒我们:结果从来不只属于判断,也属于运气;一次赢不能证明我们看见了真理,一次输也不能证明我们当初愚蠢。真正重要的是,在每一次下注之后,我们是否愿意诚实地面对反馈,修正信念,调整筹码,重新选择更好的牌桌。
偏见会让人保护自己,但我们可以使用工具接近真实。决策日志、外部视角、基础概率、事前验尸、10–10–10、退出标准、复盘更新,它们看起来是方法,其实是一种谦卑:承认自己会犯错、承认未来不可知、承认直觉需要校准、承认信念只有经过现实检验才有价值。
好的决策系统追求的不是某一次的胜利,而是一种长期的学习能力。每一次下注都让我们更理解世界、也更理解自己、更懂得如何配置资源。久而久之,这种被现实不断校准的判断力会形成复利。它让人不只是承受不确定性,也让我从不确定性中获利,形成反脆弱的力量。
最后,决策能力不是预测,而是在不确定中持续学习的能力。我们无法保证每一次下注都会赢,但可以让每一次下注都不被浪费。只要信念还能更新,未来的机会集合还在扩大,我们就仍然在游戏中,并且越来越有资格参与更好的游戏。
