AI时代,行为科学如何重塑你的营销与决策?
问题意识
Why Your A/B tests Fail — And How Behavioral Science Can Fix Them l Astroten Founder Richard Shotton
https://www.youtube.com/watch?v=QHoSNV_qUxI
在当今数据驱动的商业环境中,A/B测试已成为优化产品和营销策略的常规手段。然而,我们是否曾深入思考,这些测试的底层假设——即用户行为是完全理性的——可能存在盲点?本篇文章将带你走进行为科学的世界,揭示人类决策中普遍存在的认知偏见,例如“社会认同”、“稀缺性”和“努力的幻觉”,它们如何悄然影响着消费者乃至专业人士的判断。
随着人工智能技术的飞速发展,个性化和自动化成为趋势,但这些根植于人性的偏见并未因此消退,反而可能在信息爆炸的时代变得更加强大。作为技术从业者,你是否曾困惑于数据分析结果与实际用户反馈之间的差异?你又该如何利用行为科学的洞察,在产品设计、营销沟通乃至B2B销售中,构建更具说服力、更能触达人心的策略?本文将为你提供一个全新的视角,帮助你在AI时代,更深刻地理解用户,更精准地制定决策。
阅读收获
- 优化A/B测试策略:将A/B测试思维前置到产品设计早期,而非仅限于最终产品细节,以验证核心行为科学原则的有效性,从而实现更根本的改进。
- 精细化利用认知偏见:通过定制化的“社会认同”和“稀缺性”策略,更有效地影响用户行为,例如针对特定用户群体展示相关数据或限制购买数量,提升转化率。
- 重塑AI产品价值感知:在AI快速交付的背景下,通过强调“设置协议和流程所花费的时间”或“背后积累的经验”,抵消“努力的幻觉”可能带来的低质量感知,确保用户对AI产品的价值有准确的认知。
- 提升B2B决策洞察:认识到高风险、低频次的B2B决策更容易受认知偏见影响,从而在解决方案制定和销售沟通中更策略性地运用行为科学原则,提高成交率。
开放性问题
- 在您负责的技术产品或解决方案中,是否存在因“努力的幻觉”而导致用户对产品价值感知偏差的案例?您会如何调整沟通策略,以更好地传达产品的真实价值?
- 面对AI日益强大的个性化推荐能力,您认为哪些认知偏见会变得更加突出或更难被察觉?作为技术从业者,我们应如何设计系统来有效应对这些潜在影响?
- 除了文中提及的偏见,您在实际工作中还观察到哪些认知偏见对技术决策或用户行为产生了显著影响?这些偏见是如何被识别和利用的?
👉 划线高亮 观点批注
Main
奥伦·霍夫曼: 很多公司都有进行 AB testing(A/B测试)的文化。但他们往往只测试最终产品。我想说的是,你应该将这种 AB testing 的思维方式,更早地应用到流程中。
[音乐] 各位数据迷们,大家好!我今天的嘉宾是理查德·肖顿(Richard Shottton)。理查德是 Astro 10 的创始人,也是两本畅销书《选择工厂》(The Choice Factory)和《选择的幻觉》(The Illusion of Choice)的作者。他现在还有一本新书即将出版,名为《黑客人类思维》(Hacking the Human Mind)。理查德,欢迎来到《数据世界》。
理查德·肖顿: 谢谢奥伦,很高兴来到这里。
奥伦·霍夫曼: 很高兴。现在,很多公司都在不断地进行 AB testing,但你似乎认为,许多测试本身就是错误的。在公司进行这类实验时,他们的盲点在哪里?
理查德·肖顿: 是的。首先,我必须说,AB testing 比直接向客户提问有了巨大的进步。我认为这是第一点。它无疑是一个巨大的改进。如果你要谈论 behavioral science(行为科学)——这是我的专长——它的核心主题就是:人们声称影响他们的因素,与实际影响他们的因素,是截然不同的两回事。事情发生的本质原因(人性)往往无法直视,只有在意义和世俗价值体系下加以美化、再加工。
弗吉尼亚大学有一位了不起的心理学家蒂莫西·威尔逊(Timothy Wilson),他有一个很棒的说法:“我们是自己的陌生人。”他的意思是,人们并不真正知道自己做某事的原因。因此,如果你像大多数企业一样,向人们提问,比如给他们发调查问卷,或者让他们参加焦点小组,他们会给你长篇大论、合乎逻辑、听起来很合理的理由,解释他们为什么购买你的产品。但大多数时候,这些理由都具有很大的误导性。我们缺乏内省的洞察力。所以,我们所说的往往与我们实际所做的,是完全误导性的指南。
奥伦·霍夫曼: 有些事情是可测试的,但有些事情很难测试。比如,如果你正在开发一个需要 两年 才能完成的产品,那对它进行 AB testing 就有点困难。
理查德·肖顿: 是的。
奥伦·霍夫曼: 但如果只是网站上的一个按钮,它是红色还是蓝色,那就容易多了。
理查德·肖顿: 绝对如此。但我想说的是,当人们考虑测试时,尤其是在应用程序和数字领域,正如你所说,许多公司都有 AB testing 的文化,但他们倾向于测试最终的东西,比如:“我们应该改变文本的颜色,还是按钮的大小,还是按钮的形状?”
这当然会带来增量的好处。但我想说的是,你应该将同样的 AB testing 思维方式,更早地应用到流程中。你真正想做的是,采用一个 behavioral science 原则,比如 social proof(社会认同/社会证明)——即我们深受他人行为影响的理念。你需要弄清楚,这个在许多不同类别、市场和地点都被证明有效的理念,是否适用于你面临的特定挑战。这才是你应该使用 AB testing 的地方。一旦你知道这个广泛的洞察是有效的,你就可以开始迭代如何最好地利用它。所以,我认为应该进行 AB testing,但要将其引入到流程的早期。
如何理解这里提及的 使用、构建 个人 AB testing 的流程?结合本文 有哪些具备实操价值的建议?
奥伦·霍夫曼: 是否有一些特定的东西,比如 social proof,是公司没有充分考虑的?在某些方面,我进入的几乎每家公司都缺乏 social proof。这似乎是很多公司可以轻松解决的问题,但还有没有其他他们做得不够的方面?
理查德·肖顿: 是的。有一些偏见,比如 social proof,我认为它们被部分应用了,但还远远不够。在 behavioral science 家研究过的所有实验中,social proof 可能是数据最可靠的一个。它的论点是:如果你让某种行为看起来很受欢迎,你就会让这种行为更具吸引力,更多人可能会去做。
现在,许多听众可能会翻白眼,心想:“我们经常看到这个。”比如,你访问一个网站,上面写着“5,000 条客户评论”或“100万 满意客户”。这是事实,这些都是 social proof 的例子,但它们非常基础。如果你只应用了这种基础水平,你总能将其推得更远。
例如,亚利桑那州立大学的罗伯特·切尔迪尼(Robert Chelini)等人已经证明,我们并非平等地受到他人的影响。我们最容易受到与我们相似的人的影响。我是一个伦敦人,住在英国。我知道其他伦敦人在做什么,会比知道其他英国人在做什么对我产生更大的影响。所以,你不应该只说你有 100万 客户,而应该识别受众的事实,比如他们住在哪里、他们拥有什么类型的企业,然后相应地定制受欢迎程度的信息。所以,social proof 是一个被基础应用了的实验,但还有更多的机会。你很少看到这种定制化的水平。
奥伦·霍F曼: 还有一些事情,比如让人们投票,有很多说法,比如“60% 的人投票了”,这会有帮助。但如果说“你的两个邻居已经投票了”,那真的会让你去投票。
理查德·肖顿: 是的。关于定制 social proof 信息的最初研究中,最引人入胜的是,它与受众的联系是如此微不足道。所以,知道你的邻居正在投票,你街上的大多数人都在投票,这绝对是超级强大的。
我要说的另一件事是,你可以微妙地应用这些原则。德克萨斯大学的彼得森(Peterson)做了一项很棒的研究,他招募了大量的样本,我认为超过 1,000 人,并将他们随机分配到两种 e-commerce(电子商务)购物旅程中。有些人购物时发现他们想买的商品缺货了。在他们完成购物旅程后,彼得森对他们进行了提问,以了解他们的恼怒程度。
有时,这些人看到缺货的产品被标记为“unavailable”(不可用)或“out of stock”(缺货)。而另一些时候,他们看到它被标记为“sold out”(已售罄)。在恼怒评分方面,如果被标记为“out of stock”或“unavailable”,人们会比被标记为“sold out”恼怒得多。
根据彼得森的说法,这与 social proof 有关。如果你说某件商品“unavailable”或“out of stock”,你强调的是你没有管理好供应链,你遇到了物流问题。如果你说它“sold out”,则会产生完全不同的联想。你强调的是很多人想要这个产品,你的需求量超出了你的负荷。所以,是的,人们以这种基本方式应用 social proof,但还有更复杂的方式。
奥伦·霍夫曼: 通常我在网上搜索时,会看到“只剩 两 件,此价格”之类的提示,我就会想:“哦,我必须现在就买,不然它就要没了。”
理查德·肖顿: 是的。这与 social proof 密切相关,但心理学家会称之为 scarcity(稀缺性)。如果你强调剩下的不多了,那么完全相同的产品就会变得更有吸引力。这是一个非常强大的偏见。当心理学家试图对这些实验的商业相对影响进行排名时,scarcity 和 social proof 总是名列前茅。
我最喜欢的一个应用是,我认为美国的零售商比英国做得好得多——我们在英国做得不多——假设你走进一家商店,无论是数字网站还是超市,某件产品正在打折。为了应用 scarcity,你应该告诉人们,每人最多可以购买 四 件。
稀缺性是人类社会衍生出的群体记忆,也是一种 social proof ,商业社会中会利用这种记忆来欺骗消费者。
奥伦·霍夫曼: 我经常看到这个。我一直看到这个。是的。我当时根本没想买一件,但现在我要买 四 件了。
理查德·肖顿: 是的,没错。因为你会想,人们正在做出这些快速的决定,他们正在从促销的“肢体语言”中推断出一些东西。
奥伦·霍夫曼: “现在就买这罐汤。”
理查德·肖顿: 你永远不知道。我可能会吃罐头汤。谁知道他们会不会继续生产。是的。这似乎暗示着,要么零售商认为这东西会以如此低的价格售罄(这暗示了 social proof),要么暗示着零售商在如此好的折扣下正在亏钱。这些都是人们脑海中的解释。
奥伦·霍夫曼: 因为以前,当你有一个超级热门的商品,比如 90 年代的 Beanie Babies,你只能买一个。你可以去商店排队,但只能买一个。或者,如果你买泰勒·斯威夫特(Taylor Swift)的门票,你可能只能买 两 张。所以,有些东西是真正稀缺的,因此,当有些东西是伪稀缺时,我们很容易被愚弄。
理查德·肖顿: 是的,我认为这是一个很好的说法。所有这些偏见都有一定的真实性,但有时它们在我们的脑海中变得如此根深蒂固,以至于消费者会过度应用它们。所以,是的,通常非常有价值的物品会稀缺,但我们开始使用“稀缺等于高价值”这个经验法则,即使在不适用的情况下也是如此。
奥伦·霍夫曼: 还有哪些行为偏见会影响我们的购买决策?
理查德·肖顿: 嗯,我认为对你的听众来说可能很有趣的一个是 illusion of effort(努力的幻觉)。最初的研究是在美国进行的,南加州大学的安德里亚·莫拉莱斯(Andrea Morales)在 2005 年进行。她招募了一群正在寻找公寓的人。她向他们展示了 10 套符合他们要求的公寓。研究中的每个人都得到了完全相同的房源列表,然后他们被要求对房地产经纪人的能力和质量进行评分。
实验的转折点——这些实验中总是有转折点——是,有时人们被告知,这位房地产经纪人花了 一 小时,并使用了电脑来生成这个列表。这是“低努力”条件。另一些人被告知,这位房地产经纪人花了 九 小时,并手动生成了这个列表。
当人们对房地产经纪人进行评分时,你会看到非常明显的差异。分数都是满分 100 分。低努力组给服务提供商打了 50 分。高努力组给服务提供商打了 68 分。因此,即使人们得到了完全相同的产品,评分仍有 36% 的差异。
奥伦·霍夫曼: 哇。在我的科技行业,我认为情况会恰恰相反。如果我看到有人花了 九 小时,给我一个随机列表,我会想:“搞什么鬼?为什么?”即使是 一 小时给我 10 个房源,也感觉时间太长了。我会觉得:“这个人完全是个笨蛋。”我不想和花了 九 小时才给我 10 个房源的人合作。他们显然是无能且愚蠢的。我希望与一个只花 九 秒钟就能搞定一切的人合作。
理查德·肖顿: 如果你直接问任何客户,他们绝不会说:“哦,我希望我的房地产经纪人花更长的时间来制作这些东西。”但这就是“声称数据”(claim data)变得有点问题的地方,因为当你进行这些测试和控制实验时,你会一次又一次地看到这种情况发生。我认为这是一种经验法则:通常在生活中,一个人投入的努力越多,花费的时间越长,质量就越高。
诺贝尔奖得主丹尼尔·卡尼曼(Daniel Kahneman)在 2002 年提出了一个论点。他说:“看,当人们面临复杂问题时,他们倾向于——他们甚至没有意识到——用一个更简单的问题来取代复杂的那个,而这个简单问题能给他们一个几乎同样好的答案。”当你判断一个房地产经纪人的质量时,这是一个复杂的问题。所以人们会想:“好吧,我处理不了这个。一个真正简单的事情是:他们花了多少努力?”所以我们用努力作为质量的代理指标。
奥伦·霍夫曼: 我仍然认为在我们的行业中情况是相反的,高努力意味着低质量,但在我们的行业中,我可能是错的。
理查德·肖顿: 那么,你也可以对房地产经纪人提出同样的论点。如果我认为房地产经纪人可以在 一 小时 内完成同样的产品...但我认为客户是从一个稍微不同的角度来看待的。他们在想:“什么更有可能带来更好的质量?是人们投入了努力的东西,还是没有投入努力的东西?”
奥伦·霍夫曼: 确实。好的。
理查德·肖顿: 我认为这可能发生在你的行业的原因是,实验和不同情境之间总是存在差距。但在 AI(人工智能)方面,我认为你开始看到一些非常有趣的事情。
现在,behavioral science 家对 AI 的实验数量较少,因为它是一个较新的发明,但确实有一些。阿姆斯特丹自由大学(Vrije Universiteit Amsterdam)有一位了不起的学者科比·米勒特(Kobe Millet),他在 2023 年做了一个简单而可爱的测试:他向人们展示了一张海报,并改变了标签。有时,这张骷髅海报被称为由 AI 机器人创作。其他时候,它被称为手绘。每个人看到的是同一张海报,但标签不同。当米勒特问人们关于艺术价值、创造力和作者意图时,你会看到巨大的波动。
奥伦·霍夫曼: 哦,这说得通。是的。你总是想要手工制作、皮革装订的东西,而不是机器制造的。即使机器制造的质量可能高得多,你也会假定手工制作的更好。
理查德·肖顿: 是的。他将此归因于 illusion of effort(努力的幻觉)。我们认为 AI 等于低努力。我们作为消费者的经验是,你输入一个提示,10 秒后,它就吐出了一篇博客文章。所以,这里的重点——我认为这可能与你的论点相关——是,如果我说“不要使用 AI,因为人们不希望事情加速”,那将是荒谬的。当然,你不能那样做。但你必须意识到,如果你的产品交付得越来越快,那么相同的产品就有可能被评为较低质量。
因此,你需要做的是将人们的注意力从交付速度转移到设置协议和流程可能花费的时间。所以,即使我能非常快地生成你所说的这些答案,那也是因为我有 15 年或 25 年的经验,或者我们投资了 100万 英镑。我认为正是这种微妙的转变,我们所有人都可以利用。
奥伦·霍夫曼: 有很多关于律师或类似人士向某人收取 100万 美元一小时工作费用的轶事,他们会说:“你只花了一小时。”律师会说:“不,实际上,我花了 30 年才为你提供这个 100万 美元的东西。”
理查德·肖顿: 完全正确。这很有趣,它出现在各种不同的类别中。我听说它归因于毕加索(Picasso),我认为还有惠斯勒(Whistler),以及平面设计师保拉·谢尔(Paula Scher)。总是同样的事情:“是的,我花了 30 秒来交付,但我花了 34 年学习如何在 30 秒内完成。”是的,正是这个原则。
奥伦·霍夫曼: 你认为 B2B marketing(企业对企业营销)与消费者营销有何不同?
理查德·肖顿: 是的。我面临的一个巨大挑战是,人们说:“好吧,这些东西可能对可口可乐罐头和薯片有效,但对于真正重大的决策,比如购买汽车这样的大额消费决策,或者重大的专业决策,就不会起作用。”
有趣的是,当 behavioral economics(行为经济学)——我认为它是 behavioral science 的一个子集——首次出现时,在 70 年代和 80 年代,有一位英国经济学家肯·宾莫尔(Ken Binmore)非常不屑一顾。他说:“哦,所有这些偏见都不会影响真正重要的购买。如果你购买价值 100万 英镑的产品或购买汽车,你会有既得利益去非常清楚地思考问题。”
而理查德·塞勒(Richard Thaler),后来在 2017 年获得了诺贝尔奖,他回应说:“看,肯,你完全搞错了。当人们购买非常小的商品时,他们做得如此频繁,以至于他们了解自己的偏好。当你购买非常昂贵的产品,比如汽车、房子、订婚戒指,或者许多商业采购时,你做得如此不频繁,以至于你知道自己不知道。正是在这种不确定的情况下,我们越来越依赖偏见。”
塞勒的理论论点是,B2B 将受到这些偏见更深的影响。他提出这个理论论点是很好的,但实验证据也支持他。我们谈到了 social proof,有很多证据表明它对消费者有效,但它对专业人士也有效。
澳大利亚政府在 2018 年进行了一项研究。他们面临一个非常严峻的挑战:澳大利亚医生过度开具抗生素。因此,他们发出了 6,600 封信,试图说服医生少开抗生素。有时,他们只是试图教育医生,列出过度开药的所有坏处,但这对抗生素处方率几乎没有影响,只下降了 3.2%。
奥伦·霍夫曼: “你开的药比 90% 的医生都多”之类的。
理查德·肖顿: 完全正确。然后他们将其定制到城市。所以,“悉尼 90% 的其他医生……”这使处方率降低了 9.3%。效果要好得多。
奥伦·霍夫曼: 是的。但你会认为很多人会争辩说,医生是逻辑、理性的决策者,这些是生死攸关的决定,他们肯定只会权衡事实。但即使是这个群体,即使是这个将自己定义为理性的人群,他们也深受 social proof 的影响。
奥伦·霍夫曼: 这很常见,当涉及到双重决策时。比方说,你是一名 CFO(首席财务官),你很少跳槽到新公司,而你所在的公司也很少招聘 CFO。这是一个需要做出的双重决策。当涉及到这种双重、罕见的决策时,所有这些偏见会如何影响它?
理查德·肖顿: 我想,双方都可以利用这些偏见。所以,我想,这几乎是一场“谁做得最好”的战争。如果你是 10 名候选人之一,正在为一个非常罕见的职位接受面试,那么你让自己更具吸引力的方式,就是比你的竞争对手更有效、更有创意、更横向地利用这些偏见。
奥伦·霍夫曼: 是的。约会市场呢?这也是一个双重决策,对吧?比如婚姻。而且,一般来说,婚姻往往会很顺利。这些决定是如何做出的?
理查德·肖顿: 是的。约会是一个引人入胜的话题。如果人们对此有浓厚的兴趣,我强烈推荐一本书,这本书在英国和美国的名字通常不同。在英国,它叫《Dataclysm》,作者是克里斯蒂安·鲁德(Christian Rudder),他是 OKCupid 的创始人兼首席技术官(CTO)。他最初写了一个博客,副标题是“当人们认为没人看时,他们的行为方式”。他分析了各种有趣的怪癖行为。
他展示的主要事情是,人们所说的,与他们实际所想的,是一个非常非常糟糕的指南。在约会网站上,有很多谎言。例如,他展示了你可以查看美国男性的身高,它本质上是一个钟形曲线。但在 OKCupid 上,美国男性的身高几乎完美地反映了钟形曲线,但整体向右移动了 两 英寸。平均身高现在是 5 英尺 11 英寸。
奥伦·霍夫曼: 这是一个小小的谎言。如果你是 5 英尺 8 英寸,你说自己是 5 英尺 10 英寸。
理查德·肖顿: 所以人们在撒谎。
奥伦·霍夫曼: 每个人都会打折扣。每个人都知道:“好吧,如果这家伙说他 5 英尺 10 英寸,他可能只有 5 英尺 9 英寸或 5 英尺 8 英寸。”
理查德·肖顿: 是的,没错。所以你必须说话。如果他说他 5 英尺 10 英寸,他可能不是 5 英尺 3 英寸。
奥伦·霍夫曼: 没错。而且他肯定不会比……不。所以你知道这一点,对吧?通常不会反着说。
理查德·肖顿: 所以,是的,我认为你绝对正确。人们在撒谎,但只是适度地撒谎,这样他们就有合理的推诿。然后你就遇到了一个悖论:如果你真的说实话,你就没有正确地传达你的身高。因为如果你是 5 英尺 9 英寸,你说自己是 5 英尺 9 英寸,人们会认为你是 5 英尺 7 英寸。真相变成了一种误导。
奥伦·霍夫曼: 这取决于你在优化什么。你是在优化第一次约会还是第二次约会?如果你在优化第一次约会,是的,你可能想撒谎。但如果你在优化第二次约会,那么当他们见到你时,他们会感到惊喜,他们会想:“哦,太棒了。他看起来比我想象的还要好。”
理查德·肖顿: 我非常喜欢你的角度,因为我最喜欢的一个实验是,我认为营销人员——这是我的领域——可以更多地应用,但约会者绝对可以更多地应用。有一个概念叫做 Prattfall effect(失误效应)。
奥伦·霍夫曼: 叫什么?Prattfall?
理查德·肖顿: Prattfall。在英国我们不用这个词,但我认为在 20 世纪 60 年代的美国,它的意思是一个小小的失误。
在最初的研究中,哈佛大学的埃利奥特·阿伦森(Elliot Aronson)让他的同事参加一个测验。然后他把测验的所有答案都给了他的同事。所以这个人完全碾压了对手,看起来像个天才,以巨大的优势赢得了测验,答对了 92% 的问题。但在测验快结束时,他犯了一个 Prattfall,一个小小的失误。他把一杯咖啡洒在了自己身上。
阿伦森录下了这段录音,并将其音频版本播放给听众。但有时听众会听到整个事件:精彩的表现和失误。其他时候,他们只听到精彩的表现,失误被剪掉了。他发现,如果听众听到失误和精彩的表现,他们会显著地,我们说的是 45% 到 55%,更有可能觉得这位参赛者有吸引力。
奥伦·霍夫曼: 因为他们想稍微照亮你的问题,是吗?
理查德·肖顿: 是的。所以,我认为论点是,如果你考虑将其用于商业用途,大多数广告商都在吹嘘。所以,如果你承认任何类型的缺陷,你就会脱颖而出。
人们希望优秀,但并不一定追求完美,需要的是真实。
奥伦·霍夫曼: 这就是“我们是第二名”那种类型的事情。
理查德·肖顿: 完全正确。正是如此。这是吉尼斯(Guinness)啤酒的广告语:“好东西值得等待。”
奥伦·霍夫曼: 是的。番茄酱的事情。是的。非常慢。
理查德·肖顿: 另一件事是,我认为它让你感觉更人性化。它让你的其他主张更可信,因为承认一个缺陷具有实质性意义。
奥伦·霍夫曼: 我们知道每个产品都有缺陷。所以如果你不知道这些缺陷是什么,你总会觉得:“啊,有些不对劲。”但如果他们照亮了他们的缺陷,那么你就会想:“哦,太棒了。好吧,我知道了。我可以接受。比如,他是个烟民。好吧,我可以接受他是个烟民,因为他还有所有这些其他优点。”
理查德·肖顿: 我认为你绝对正确。我们都知道每个产品、每个人都有缺陷,如果我们不确定缺陷在哪里,我们可能会认为它是一个非常重要的问题。如果你能以一种——我的意思是,它不能是谦虚的吹嘘(humble brag),它必须足够有意义,但又不能太重要——的方式承认一些事情,那么真正聪明的部分是,如果你承认正确的缺陷,你就可以强调一个镜像的优势。
所以,如果你的产品很贵,你说“我们真的很贵”,人们会假设:“好吧,如果它真的很贵,那它的质量可能很高。”人类通常认为弱点和优点是同一枚硬币的两面。所以,如果你选择承认正确的缺陷,你就可以强调一个核心优势。
奥伦·霍夫曼: “我工作太多了,这可能意味着我很富有。”
理查德·肖顿: 嗯,是的。所以,我认为你需要做的是思考你真正想传达的核心信息是什么,然后是否有一个你可以承认的缺陷,可以强调这一点。我最喜欢的例子是巴克利(Buckley)咳嗽糖浆。
奥伦·霍夫曼: 不熟悉。
理查德·肖顿: 它是 1990 年在加拿大出现的一个小品牌,在市场上排名第 13 位左右。没有人真正购买它。然后他们改变了他们的创意方向,他们的新广告语是:“它尝起来很糟糕,但它有效。”
奥伦·霍夫曼: 是的。
理查德·肖顿: 广告非常滑稽,35 年来,他们一直使用这条广告语。他们强调这东西的味道有多难闻,因为他们知道人们会假设,如果它味道这么差,那它一定非常有效。他们一跃成为第一名。
奥伦·霍夫曼: 这说得通。是的。我会认为尝起来很糟糕的东西对我来说会更好,对吧?
理查德·肖顿: 是的,没错。他们提请注意这一点,并没有改变液体本身,但强调了它的效力。
奥伦·霍夫曼: 这非常重要。我认为政客有时也会这样做,他们会照亮自己的问题,然后这有助于其他方面,或者在某种程度上使他们人性化。
理查德·肖顿: 是的,这是一个关于政客的非常有趣的观点。我的意思是,我想知道,在英国和美国,我们都有经济停滞不前的情况,自金融危机以来几乎没有增长,那是 17 年前了。所以人们对主流政客越来越愤怒。
因此,最成功的策略之一,鲍里斯·约翰逊(Boris Johnson)做到了,并成为了保守党领袖和首相。奈杰尔·法拉奇(Nigel Farage)目前正在这样做,他的改革党(Reform Party)在民意调查中名列前茅。他们所做的是,让自己看起来与其他政客非常不同。他们知道人们会说:“我对千篇一律的标准政客感到愤怒。”而这个人,因为他们喝酒、开玩笑或有点邋遢,他们将自己定义为非政客,因此他们的受欢迎程度会飙升一段时间。我认为你是对的,这在政治中确实有效。
奥伦·霍夫曼: 你提到价格是一个有趣的问题。存在价格-质量的关系,或者说,当人们试图销售他们的产品时,他们应该如何考虑价格?
理查德·肖顿: 关于价格的研究非常多。你提到了价格-质量。绝对是真的。斯坦福大学的心理学家巴巴·希夫(Baba Shiv)做了一项可爱的研究。他给人们提供了 五 瓶不同的葡萄酒,每瓶都有一个醒目的价格标签,但实际上只有 四 种不同的液体。其中一种葡萄酒是重复的。
人们开始这项研究,他们小酌了一口第一种葡萄酒,一种梅洛(Merlot),他们认为它来自一瓶 5 美元的酒,然后他们说它尝起来很糟糕。几瓶酒之后,他们得到了另一瓶梅洛,上面有一个醒目的 45 美元价格标签。同样的液体。
奥伦·霍夫曼: 同样的酒。
理查德·肖顿: 没错。你可以猜到接下来会发生什么。当他们给它评分时,他们不仅用更积极的形容词来描述它,定量评分也高出 70%。
根据希夫的说法,我们所体验到的,部分地(不是完全地)是我们期望体验到的。而设定我们期望的因素之一就是价格。因为人们头脑中有一个经验法则:一分钱一分货。有趣的是,这会自我实现。完全相同的液体,根据成本的不同,被评为截然不同。
所以,如果有人不买你的产品,经济学家会说:“好吧,你需要降价,因为你没有提供足够的价值。”但在你这样做之前,你可能仍然需要降价,但在你这样做之前,你为什么不测试一个更有利可图的想法:也许我收费太低了?
奥伦·霍夫曼: 我看到一项研究,有点像安慰剂效应(placebo effect),他们给人们提供了 Advil(布洛芬),然后人们对 Advil 的效果进行了评分。然后是完全相同的 Advil,没有任何不同,只是他们在 Advil 上写着“30% 折扣”,而这个效果实际上更差。
理查德·肖顿: 是的。
奥伦·霍夫曼: 它就是效果较差,因为人们的头脑和这些东西真的在捉弄人。
理查德·肖顿: 是的,没错。我认为那是丹·艾瑞里(Dan Arieli)的一项研究。即使在止痛药的世界里,完全相同的药理学药丸也会产生不同的影响,这取决于我们认为它是昂贵的还是便宜的。所以,你必须非常小心地对待产品的大幅折扣、降价、力度过大的促销,因为你不仅在训练人们认为你的产品质量差,产品的实际体验也会更糟。我认为这是 behavioral science 有趣的部分:实际体验也会恶化。
奥伦·霍夫曼: 这是一个数据播客,很多认知偏见会影响我们高管解释自己公司数据的方式。作为领导者,我们应该注意哪些危险的偏见?
理查德·肖顿: 我认为其中一个大的偏见是 overconfidence(过度自信),这是一个被广泛研究的领域。无论是外貌、幽默感还是智力,人们——不是 50% 的人认为自己高于平均水平,而是更像 70% 或 80%。在各种不同的类别中,人们一次又一次地过度自信。
我最喜欢的两项研究中,有一项是瑞典心理学家奥卢斯·芬森(Olus Fenson)在 80 年代进行的。他对驾驶很感兴趣。大多数人认为自己是比平均水平更好的司机,这不会让人震惊。但斯彭森(Spenson)去了医院,那里的人们因车祸受伤卧床。即使是那个群体,他们也认为自己是比平均水平更好的司机。
还有一项是英国南安普顿大学的康斯坦丁·塞达基蒂斯(Constantine Sedakitis)进行的。他去了监狱,这些是青少年监狱,即使是囚犯,大多数人也认为自己比平均水平更道德。这是一个影响各行各业的一致发现。
奥伦·霍夫曼: 我的意思是,有些事情很难衡量。很难知道,我的意思是,我甚至不知道自己有多道德,然后我也不一定知道普通人有多道德。这些事情要难得多。但还有一些事情,我认为更容易判断,比如智商(IQ)。我认为大多数人可能对自己处于哪个智商区域有一个相当好的感觉。
理查德·肖顿: 我认为人们倾向于高估智力,因为很多人没有做过测试,或者如果他们做了测试,他们会想:“哦,我那天宿醉了。”他们会想出一些解释。
奥伦·霍夫曼: 很少有人智力处于后 25%,却认为自己处于前 25%。
理查德·肖顿: 哦,现在我不能马上回答这个问题,因为没有这样的商业应用,但有一个概念叫做 Dunning Krueger effect(达克效应),它本质上是你越愚蠢,你就越有可能夸大你的智力。我认为其中一部分是,如果你对某个话题一无所知,你就不知道自己错过了多少。当你对一个话题越来越擅长时,你会意识到还有多少东西需要了解。你的“无知海岸线”在增长,你更清楚这一点。所以,我认为实际上越愚蠢的人,这种夸大就越大。
奥伦·霍夫曼: 有没有哪些偏见是人们认为自己比平均水平更差的?
理查德·肖顿: 哦,很好的问题。我只见过智力、幽默、外貌等方面的研究,人们都过度自信。请记住,我们谈论的是平均水平。
奥伦·霍夫曼: 是的。平均而言。
理查德·肖顿: 会有一些人是过度不自信的。我听说有人提出存在性别差异的论点。当我问营销人员,他们比同行做得好多少时,男性和女性都过度自信。我认为 90% 的男性认为自己比同行更擅长自己的工作。女性更像是 80%。所以,两性都过度自信,但女性的程度较低。我最近没有看到重复的发现表明人们……
奥伦·霍夫曼: 我经常问人们,他们在给定特质上处于哪个百分位,我发现对于许多特质,人们的评估是相当准确的。但我要说,人们最不擅长评估的特质是 EQ(情商)。
理查德·肖顿: 是的。
奥伦·霍夫曼: 比如,人们会说:“我的 EQ 很高。”或者有人会说他们的 EQ 很低,我甚至不知道这是否与事实有任何关系。
理查德·肖顿: 是的。我认为这可能是我会乐于承认自己可能低于平均水平的领域之一,主要是因为 EQ 低,但谁知道呢?也许有些人在这方面太差了,很难……
奥伦·霍夫曼: 这种关于人们在公共场合和私人场合所说的话的差异问题。我不知道你是否看过塞斯·史蒂文斯-戴维多维茨(Seth Stevens-Davidowitz)的一本很棒的书,叫做《人人都说谎》(Everybody Lies)。我最喜欢的一个例子是,他比较了 Facebook 数据和搜索数据。他查看了人们在 Google 中输入的查询,然后将其与人们在 Facebook 上发布的类似主题的内容进行比较。
他查看了“我的男朋友是”这样的短语,在 Facebook 上最可能出现的词是“慷慨”、“很棒”、“有爱心”。而在 Google 上,则是“出轨”、“白痴”、“自私”。这是一个非常有力的证明,表明人们在知道别人会看到时所说的话,是他们想要投射的美化过的、制造出来的版本。对我这个营销人员来说,这意味着进行社交媒体倾听的人,绝不应该将这些陈述视为逐字逐句的真相。它们是人们想要投射的形象,绝不是对人们实际想法和行为的准确洞察。
奥伦·霍夫曼: AI 将如何影响这一点?因为 AI 有望在个性化方面变得越来越好。我的意思是,它仍然很糟糕。我在 Spotify 和 Netflix 上仍然得到糟糕的推荐,但希望它在个性化方面会越来越好。从长远来看,这会使传统的 behavioral insights(行为洞察)更重要还是不那么重要?
理查德·肖顿: 我对心理学和 behavioral science 会过时持怀疑态度。一位传奇的创意总监比尔·伯恩巴赫(Bill Bernach)在 20 世纪 60 年代说过:“人类本性进化了数百万年,它需要数百万年才能改变。谈论不断变化的人可能是时髦的,但我们作为传播者应该关注的是不变的人。”是的,技术在变化,文化也在变化,但驱动人们需求的这些因素,却惊人地保持一致。
奥伦·霍夫曼: 你认为它会改变吗?因为我可以提出一个论点,即 behavioral science 类型的东西在 AI 世界中会变得更重要。我也可以提出一个论点,它会变得不那么重要。当然,它们仍然很重要,但就相对重要性而言,你认为它会改变还是大致相同?
理查德·肖顿: 我认为有两种方式来看待这个问题。首先,人们的选择越多,这些偏见就越强大。因为,以超市为例。如果你站在洗发水货架前,如果你试图逻辑地计算出哪种洗发水能最大限度地提高你每美元的效用,你将需要选择一个小时,甚至 两 个小时。所以,人们不会那样做。他们只是选择中等价位的,或者最贵的,或者他们在电视上看到过的。他们使用一个快速的经验法则来做出快速的决定。
现在,社会中正在发生的一件事是,我们指尖上的信息越来越多。随着这种情况的不断发展,我认为这会使这些偏见更加强大。所以我认为我会把我的筹码押在那个阵营。
奥伦·霍夫曼: 有趣的是,我发现其中一件事是,我经常只是根据包装来选择,比如什么看起来很酷。所以有点像“以貌取人”。我发现这实际上是一个很好的经验法则,比如只阅读封面最酷的书实际上是相当不错的。有没有像这样你认为完全错误的奇怪说法?比如,人们总是说“不要以貌取人”,但也许我们应该以貌取人。
理查德·肖顿: 嗯,我的意思是,如果我们将这个论点从书本延伸到产品,那么盛装容器、美学当然会影响。
奥伦·霍夫曼: 是的,那瓶漂亮的伏特加。即使是同样的伏特加。
理查德·肖顿: 是的,没错。而且我认为它比人们预期的要深入。所以,是的。很多听众可能会想:“好吧,我有点相信设计精美的瓶子会有这种效果。”但你可以看看餐具。有一位很棒的心理学家查尔斯·斯彭斯(Charles Spence)。我认为他是研究味觉和食物心理学方面最有趣的人。他在爱丁堡做了一项研究,他们在一次会议上提供晚餐,人们被随机分配到不同的桌子上。有些人得到了这种非常花哨、沉重的餐具,而另一些人得到了便宜、轻便的餐具。在对完全相同的食物的评分方面,存在 11%,也许是 12% 的差异。人们有这样一种假设:重等于质量,而这会自我实现。
奥伦·霍夫曼: 如果我拿到沉重的餐具,我肯定会觉得它尝起来更好。我认为会的,因为它就是,你知道,然后你会觉得:“哦,美味。”是的。
理查德·肖顿: 各种品牌都应用了这一点。是的,在食品界,昂贵的葡萄酒瓶会更重一些,但即使是花哨的扬声器、音响系统,比如 Bang & Olufsen,他们的遥控器可能非常轻,但他们人为地增加了重量,因为他们知道这种分量会给人一种质量感。所以,我对你关于书本的论点在道德上是抵触的,但我认为你可能是对的。但肯定是通过美学属性、触感、声音、重量来判断产品,我认为你绝对正确。
奥伦·霍夫曼: 在过去的 25 年里,有如此多的书籍,如此多的人一直在谈论这些认知偏见。我本以为,因为有这么多人谈论它,这意味着它们会不那么有效或不那么普遍。但事实似乎并非如此。我们似乎仍然像在我们了解它们之前一样容易受到所有这些事情的影响。为什么会发生这种情况?或者我说对了吗?
理查德·肖顿: 不,不。它们仍然影响着我们。我的意思是,有一些关于慈善捐赠的实验,你问:“你想捐多少钱?”这是对照条件。然后他们对另一组人使用 anchoring(锚定效应)原则,说:“大多数人捐 50 英镑。你想捐多少钱?”结果是人们最终捐了更多的钱。假设第一组捐了 20 英镑,第二组捐了 30 英镑。你知道 anchoring 的原则是,你抛出这个高数字,人们将其视为一个起点。他们会调整,但调整得不够。所以它最终会影响他们的最终行为。
第三组人来到捐赠页面,上面写着:“很多人捐 50 英镑。请注意,被告知这个数字可能会夸大人们的捐赠水平。”现在,我是在编造确切的数字,我对这项研究了解得不是很透彻,但他们最终可能会捐 28 英镑。它确实下降了一点,但仍然比对照条件多得多。即使被告知这些偏见,也不能完全消除它们。
奥伦·霍夫曼: 但它可能会减轻一点。
理查德·肖顿: 是的,但减轻的程度微不足道。这是唯一要说的。所以,是的,它确实减轻了一点,但微不足道。我认为它们不会随着知识的增加而消失的原因之一是:它们是有用的。人们将它们称为“非理性”(irrationalities)是有危险的。因为如果我们回到洗发水的例子,谁是非理性的?是我,一个可能非常关心我的头发的人,只是非常快地选择了最贵的那一个?还是你,一个经济学家,试图权衡所有的利弊,并在那里花了 两 个小时?我们俩谁是非理性的?
这些偏见、这些捷径和这些经验法则,是做出非常快速决策的相当好的方法。而且我认为大多数消费者、大多数人在大多数情况下会更喜欢速度而不是准确性。
奥伦·霍夫曼: 是的。这说得通。behavioral science 的下一个前沿领域是什么?
理查德·肖顿: 我认为这里一个非常有趣的领域是,更多地了解不同的群体或人格类型是如何受到偏见影响的,因为目前大多数研究都只是关于“平均而言,这个原则运作良好或运作不佳”。有趣的是,人们开始测试对不同群体的影响。
例如,对于 social proof 这样的东西,即我们受他人影响的理念,如果某事看起来很受欢迎,它就会变得更受欢迎。这已经存在了很长时间,所以这类工作已经完成。例如,年轻人往往比老年人更容易受到 social proof 的影响。有一些研究表明,超级富豪受 social proof 的影响较小。
英国税务局 HMRC 的一项研究表明,如果你告诉人们“英国有 90% 的人按时缴纳税款”,人们按时缴纳税款的可能性就会增加。但如果人们处于欠税者中前 1% 的位置,这些人欠了 5万 或 7.5万 美元,甚至 10万 美元,这个群体实际上更不可能支付。
奥伦·霍夫曼: 就像:“哦,太棒了。10% 的人是这样做的。我没有意识到有 10% 这么高。所以,我现在感觉没那么糟了。”
理查德·肖顿: 我认为 behavioral science 家的论点是,每个人都认为自己不受平均水平的影响,但这个群体真正认为他们与众不同。被告知“普通人”在做什么,实际上使他们更不可能去做。
奥伦·霍夫曼: 关于你的 Twitter 账号或 X 账号的问题。我本以为你的 X 账号很糟糕,因为它很难理解。它是 R S H O T 字母,然后是数字 2,然后是 T O N。
理查德·肖顿: 哦,不。那不是我的。我不知道那是谁。我的是 rshottton。
奥伦·霍夫曼: 哦,好吧。对不起,我弄错了。
理查德·肖顿: 没关系。
奥伦·霍夫曼: 我以为你是在捉弄我。我当时想:“哦,也许他是在添加所有这些 behavioral biases。”好吧。你只是 rshottton 在 X 上。好吧。那更有意义了。
奥伦·霍夫曼: 我们问所有嘉宾两个个人问题。你相信哪个阴谋论?
理查德·肖顿: 我认为这个问题的问题在于,如果你相信它,你就将其定义为真相,而不是阴谋论。
奥伦·霍夫曼: 我的意思是,你可能会觉得其他人认为这是一个阴谋。
理查德·肖顿: 我的意思是,当它刚出现时,它肯定被视为一个阴谋论,我不是说我完全确定,但我记得当 COVID 出现时,有实验室泄漏假说(lab leak hypothesis),它被贴上了阴谋论的标签。我一直认为它听起来是合理的。我不会拿任何钱去打赌。我不知道是否有其他合理的解释。可能还有。所以我一直觉得那个被贴上阴谋论标签的速度太快了。
奥伦·霍夫曼: 是的,这种情况经常发生。
理查德·肖顿: 有时确实存在一种“我们与他们”的政治态度,因为唐纳德·特朗普(Donald Trump)等保守派人士支持这种观点。因此,自由派的每个人都没有考虑它是否属实。他们只是认为:“好吧,我不同意这个人,所以它一定是假的。”我觉得那件事发生了一点。
奥伦·霍夫曼: 我们问所有嘉宾的最后一个问题:你认为哪个传统智慧或建议通常是糟糕的建议?
理查德·肖顿: 嗯,我们已经涵盖了我想说的。询问你的客户他们怎么想,我认为这是可怕的、糟糕的建议。优先考虑他们做什么,优先考虑观察数据而不是声称数据。
我们还没有谈到的是,我认为存在一个关于企业信任度下降的迷思。每个人都在谈论,尤其是在营销领域,信任危机。但实际上,如果你看看像爱德曼(Edelman)这样的机构的追踪数据,他们可能是做这个时间最长的。如果你回顾 15 年、20 年前,人们对企业的信任度非常低,就像现在一样。人们从未信任过企业,因为,比方说,你在 2,000 年前的希腊市场,我走过来对你说:“我的橄榄油是世界上最好的。”你会想的不是:“哇,我发现了卖最好橄榄油的人,真是个奇迹。”你会想:“这个人想蒙骗我。他只是想赚点快钱。”
我认为这是一个非常危险的迷思,因为如果你认为自己处于一个独特的历史时刻,你就不会从过去吸取教训。如果你认识到挑战与 20 年、30 年前一样,那么你就可以学习最优秀的人在 20 年、30 年前是如何应对的。你可以应用 Prattfall effect 这样的东西。你可以应用非常精确和具体地说话这样的想法。有研究表明,这更值得信赖。如果你说:“我 92.3% 确定。”这比你只说“我很确定”更可信。它可能不会真正改变我的想法的有效性,但精确性被人们视为准确性和可信度的捷径。所以,是的,我认为关于企业受到信任危机打击的说法,是一个非常虚假的观念。
奥伦·霍夫曼: 这很棒。谢谢理查德·肖顿加入我们的《数据世界》。正如我提到的,我在 X 上关注你,账号是 rshottton,我现在确认是正确的。我绝对鼓励我们的听众在那里与你互动,并购买你的新书。这是一次非常愉快的聊天。
理查德·肖顿: 是的。非常感谢。我现在在 LinkedIn 上发帖比在 Twitter 上多。所以人们……
奥伦·霍夫曼: 好的。抱歉。好的。那么在 LinkedIn 上关注你。
理查德·肖顿: 好的。是的。太棒了。非常感谢。
奥伦·霍夫曼: 好的。很高兴与你聊天。
理查德·肖顿: 谢谢。