Main 这才是心理学: 看穿伪心理学的本质(第10版)=How to Think Straight about Psychology

这才是心理学: 看穿伪心理学的本质(第10版)=How to Think Straight about Psychology

, ,
0 / 0
How much do you like this book?
What’s the quality of the file?
Download the book for quality assessment
What’s the quality of the downloaded files?
要认识真正的心理学,首先要懂得:
1.心理学的进步是通过研究可解的实证问题而取得的;
2.心理学家提出可证伪的理论来解释他们的研究发现;
3.理论中的概念都具有操作性定义,这些定义将随着证据的积累而逐渐演变;
4.这些理论是通过系统实证的方法来检验的,收集来的数据是公开的;
5.心理学家的数据和理论,只有在那些经过同行评审程序的科学刊物上发表之后,才算是进入了科学领域。
6.实证主义之所以具有系统性,是因为它遵循控制和操纵的逻辑,这二者也是真实验的特性。
7.心理学家采用许多不同的方法来获得他们的结论,这些方法的优缺点各有不同。
8.最终被揭示的行为规律通常都是一种概率关系。
9.大多数时候,知识只能通过对众多实验数据的慢慢积累得到。
也许目前我们自身对于心理学的认识还只是伪科学信念系统的产物,借助本书的科学观念,我们可以去伪存真,更好地理解人类行为的本质,弄清什么才是真正的心理学。
学习好或读书多的孩子都不擅长交际和体育;
低自尊导致攻击行为;
孩子会给父母带来幸福;
做多选题时, 即使对所选答案感到不确定, 也千万不要更改最初的答案;
我们只用了 10% 的大脑功能;
早熟者必早衰;
……
如今,各种伪心理学的论调充斥了我们的媒体、我们的生活以及我们的书架,一个经营伪科学信念系统的巨大产业正在兴起,这一信念系统出于既得利益的考虑, 总是想让大众相信,无论什么都能纳入心理学的范畴。
翻开本书,让心理学大师教你如何站在批判性思维的角度,以科学的态度对待心理学,彻底走出伪心理学的误区
Categories:
Year:
2015
Edition:
Di 1 ban.
Publisher:
中国人民大学出版社
Language:
chinese
Pages:
229 / 454
ISBN 13:
9787300218724
Series:
阅想·心理
File:
PDF, 1.54 MB
Download (pdf, 1.54 MB)

You may be interested in Powered by Rec2Me

 

Most frequently terms

 
1 comment
 
victory111
How to think straight about psychology? 但凡是具备初中英语水平的人都知道这中文翻译把标题翻译的风马牛不相及。How to think straight about psychology? 直译:怎样直接地思考心理学?对比一下,原来的中文翻译瞎翻译还充满挑衅攻击性,纯牌精神病
18 October 2020 (17:05) 

You can write a book review and share your experiences. Other readers will always be interested in your opinion of the books you've read. Whether you've loved the book or not, if you give your honest and detailed thoughts then people will find new books that are right for them.
版权信息
书名:这才是心理学:看穿伪心理学的
本质
作者:(加)基思·斯坦诺维奇

目录
CONTENTS
序言
推荐序 心理学有什么不同之处
译者序
序言
Chapter 1 心理学充满生机:在科学阵营里左
右逢源
弗洛伊德问题
现代心理学的多样性
科学的统一性
那么,什么是科学
心理学和世俗智慧:“常识”的误区
心理学是一门年轻的科学
小结
Chapter 2 可证伪性:如何挫败头脑中的小精
灵
理论和可证伪性标准
科学中的错误:逼近真理
小结
Chapter 3 操作主义和本质主义:“但是,博
士,这到底是什么意思?”

为什么科学家不是本质主义者
心理学领域的操作性定义
小结
Chapter 4 见证和个案研究证据:安慰剂效应
和了不起的兰迪
个案研究的地位
为什么见证叙述毫无价值:安慰剂效应
“鲜活性”问题
见证为伪科学打开方便之门
小结
Chapter 5 相关和因果:用“烤箱法”避孕
第三变量问题:戈德伯格与糙皮病
方向性问题
选择性偏差
小结
Chapter 6 让一切置于控制之下:聪明汉斯的
故事
斯诺与霍乱
比较、控制和操纵
小结
Chapter 7 不像是真实生活的心理学实验与“人
为性”批评
为什么自然性并非总是必要的
心理学理论的应用
小结

Chapter 8 避免爱因斯坦综合征:聚合性证据
的重要性
关联性原则
科学共识
不要对矛盾数据感到绝望
小结
Chapter 9 打破“神奇子弹”的神话:多重原因
的问题
交互作用
单一原因解释的诱惑
小结
Chapter 10 人类认知的阿喀琉斯之踵:概率推
理
“某某人”统计学
概率推理以及对心理学的误解
有关概率推理的心理学研究
小结
Chapter 11 偶然性在心理学中扮演的角色
试图解释偶然性事件的倾向
偶然性和心理学
接受错误以减少错误:临床预测与统计预
测
小结
Chapter 12 不招人待见的心理学
心理学的形象问题

心理学和其他学科
我们是自己最坏的敌人
每个人不都是心理学家吗
抵制科学心理学的根本原因
结束语

推荐序 心理学有什么不同之处

彭平凯 清华大学心理学系教授、系主任
心理学是一门很容易让人误解的学科。与其
他学科不同,它研究的是与人民生活紧密相关的
问题。有些还正好是大家都熟悉,而且经常关心
的问题。比如:什么样的人容易讨人喜欢?什么
样的事情我们记忆深刻?什么样的事情让人高兴
(或痛苦)?为什么男人比女人更爱聊政治时
事?人为什么要自杀?意念能不能被植入梦中?
等等……正因为大家关心这些问题,人们就会有
自己的分析,自己的证据,得出自己相信的结
论。很多时候,这些自觉的结论与心理学家的研
究结论并不完全一致,比如说,我们心理学家就
发现,青梅竹马的婚姻很难成立,婴儿并不是有
奶便认娘,性格并不决定一个人的命运,等
等……每当矛盾、怀疑、迷惑甚至气愤产生的时

候,我们到底是该相信自己的直觉、经验和常识
呢,还是该相信心理学的研究、证据和知识呢?
不幸的是,大多数的心理学教科书只满足告
诉大家心理学的研究、发现和知识,但从不说明
为什么这些研究、发现和知识是值得我们关注和
信任的。这些书的作者好像都在假设每一位读者
思考起问题来都像心理学家一样,相信和理解心
理学的研究、发现和知识。幸运的是,基思·斯坦
诺维奇教授写了这本这本《这才是心理学》,一
本“与众不同的心理学”教科书。他总结了心理学
家的职业特质,让每一位读者都有机会去理解我
们心理学家是如何去思考、分析和解读人类的行
为和心理的。他的每一章都将一个常识的、朴素
的、直觉的有关人类心理的分析和思考与一个科
学的、严谨的、心理学的分析和思考相对比,以
帮助读者理解心理学家的分析逻辑和研究思路。
我个人觉得,在斯坦诺维奇阐述的心理学特
质中,有两点应该是区分我们心理学家和其他人
(包括其他领域的科学家)与众不同的地方。
其一是我们心理学的批判性思维习惯,也就
是说,心理学不相信个人的智慧,更相信科学的
方法,而科学方法的本质是证伪,即对我们的经
验、常识和直觉,产生怀疑、挑战和批评。从原

则上而言,心理学家不怕犯错误,但害怕以假乱
真。心理学家也不相信那些能回答所有问题的绝
对真理,但相信对所有问题应该有一个相对正确
的答案。心理学家从不相信个案和例子,因为其
随机性和主观性太过明显,但我们愿意相信大样
本基础上的科学研究发现。我们希望听到动听的
心理故事,但更愿意看到众多心理学观察的数据
和总结。
其二是我们心理学的概率性思维习惯。我们
和很多自然科学家思考方式不同之处就在于我们
更容易相信,任何人类的行为都是概率性的表
现,也就是说,它有一定的不确定性,会受到其
他随机事件的影响。其实人类很多学科都是建立
在概率基础之上的,比如说核物理、天体物理、
生物进化、病理学、所有的社会科学(经济学、
社会学、政治学等)等等,它们都不; 可能准确预
测每一个研究对象的具体活动,但都对整体的事
物活动规律有很好的描述和预测。只不过我们心
理学家更愿意承认而且强调我们学科的不确定性
而已。
总之,我很高兴地看到这本书在中国再版。
杨中芳老师的早期译本是我很喜欢向心理学爱好
者推荐的一本心理学教科书。而新版的译本,尤
其令我兴奋,因为它是由我欣赏的两位年轻同事

——东徽和肖岑,下工夫,花时间,认真翻译完
成的。两位既是同行,也是夫妻,应该是我们心
理学界不鲜见的学术伴侣之一。这可能也是我们
心理学界与众不同的地方吧。

译者序

此刻诸位手中拿的正是斯坦诺维奇教授的
《这才是心理学:看穿伪心理学的本质》(How
to think straight about psychology)第10版中译本。
记得我的博士后合作导师、清华大学心理学系主
任、加州大学伯克利分校终身教授彭凯平老师曾
经说过:在美国,如果一本心理学教科书能够再
版3次以上,这本书就堪称经典教材了。按照这
一标准,斯坦诺维奇教授这本书堪称经典教材中
的翘楚,无怪乎能够成为诸多国家高校心理学本
科专业学习的指定书目。
斯坦诺维奇教授曾感慨,写作最新一版的初
衷,与写第一版时无异。此感慨中有不忘初心方
得始终的赤子情怀,但也有些许的无奈:心理学
被大众误解的状况多年来并未有实质性的转变,
心理学这些年的蓬勃发展也没有使这一情况有根

本性的好转。对于这一点,相信每一位学习和从
事心理学的人都有所体会。
时至今日,每个学心理学专业或从事心理学
工作的人仍然会被人问到三个问题,第一个通常
是:“你知道我现在心里在想什么吗?”名列榜眼
的问题则是:“你会催眠和解梦吗?”排名第三的
问题则一般是:“什么,你们心理学还做实
验?”这类对于问话人来说再正常不过的问题,
却总能让这些学心理学的人哭笑不得。
一个真正称职的心理学工作者不应回避或敷
衍这类问题,正确的做法是直面它们并认真分析
其中的意义,给予人们正确的解答。从最常被问
到的这三个问题中,我们便能以管窥豹地看出公
众对于心理学的一些常见的误解和迷思。
第一个问题所揭示的事实是,心理学在大众
心目中被万能化了。所谓万能化,是指心理学研
究对象和功能的边界被无限地夸大了。首先,许
多人认为心理学无所不包,星座、属相、血型、
玄学、人生哲理及各种心灵鸡汤都被认为是心理
学的范畴——实际上,心理学研究虽然涉及广泛
的人的客观行为和心理现象,但作为心理学的研
究对象必须满足“可检验”这一标准,超验的、超
感官的问题不在科学心理学的研究之列;另外,

并不是说心理学不能研究血型、星座和超感知,
实际情况是,这类现象和理论在历史上都曾经是
心理学的研究对象,但已被各种科学的方法所证
伪并从心理学的研究对象中剔除了出去。还有一
种观点认为,心理学是无所不能的,学了心理学
就能读心、能算命,甚至能千里之外控制他人的
大脑并操纵其行为,还兼具其他种种神奇的功
效。我们说心理学很神奇,是因为它能在一定程
度上解释心理现象和预测行为,并能提供一些行
之有效的干预方法,但是,科学心理学所有的预
测和解释都基于客观数据,所有的结论都具有概
率的性质,有一定的适用范围和条件,干预方案
也必须符合客观的心理和行为规律。因此没有能
够完美解释一切现象的心理学理论,也没有超出
人类经验以外的干预和应用。
第二个关于催眠的问题则揭示了另外一种对
于心理学常见的误解:心理学就是弗洛伊德的精
神分析,就是心理咨询。弗洛伊德这位伟大的心
理学家确实让后世的心理学研究者“既爱又恨”。
弗洛伊德的功绩在于,他以其非凡的工作投入和
严谨的思辨构筑了一套宏大、晦涩而让人着迷的
理论体系,开启了一片探索人类心灵世界的全新
领域,对社会文化、艺术创作产生了不可估量的
影响,并真正让世人开始了解和重视心理学;迄
今为止他的理论仍然广泛应用于心理治疗和干预

的诸多领域。今天人们都能熟练用“焦虑”、“压
抑”、“潜意识”这些词来描述或解释分析自己的心
理状态,也是拜弗洛伊德和他的精神分析学派所
赐。说到心理学家,或许很多人不知道冯特和斯
金纳,但没有人会不知道弗洛伊德。然而,弗洛
伊德的盛名也带来了一系列问题,最主要的是两
点:一是他的光芒掩盖了其他领域心理学研究者
的工作和成就,二是弗洛伊德所构建的这些精巧
的理论很难用实证的方法加以验证,这也为后来
众多伪心理学和虚假治疗手段的滋生和发展留下
了一道后门。
最后一个问题也是最关键的——公众不了解
主流的科学心理学已经在实证主义的道路上行进
了很远。心理学是一门科学,必然要遵循科学的
标准,即研究的必须是实证可解的问题;方法上
要遵循系统的实证主义;研究结论是公开知识,
即能够被重复验证(可再现性),并能经过同行
评议。这三条标准也是区分科学心理学和其他伪
心理学的分水岭。心理学的研究因此也与操作定
义、实验组和控制组、变量控制、数据统计等词
汇联系起来,而不是个人化的体验及感悟、头脑
风暴或纯粹的逻辑推导。
那么,是什么阻碍了公众了解和认知真正的
科学心理学?原因应该是多方面的。首先,对心

理学的渴求使得大众对心理学产生了特殊的期
待。心理现象和心理问题与每个个体戚相关,人
们试图通过心理学解释这些问题和现象,并从中
获得行之有效的帮助和建议。在这方面,针对个
体的精神分析和治疗技术有一定的优势,但其他
大多数心理学研究则针对的是群体的普遍行为规
律,偏重于解释和预测,其研究结论都具有概率
性和领域特异性,因此无法有针对性地、面面俱
到地解决个体所有的心理问题。这有时难免会让
一部分抱着“求医问药”的心态来了解心理学的人
感到失望。此外,以“求医问药”为动机接触心理
学的人,也往往对心理学的其他领域缺乏关注。
第二,术语体系产生的阻隔。心理学作为一
门科学,为了让研究者之间形成共识并利于重复
验证,产生了一套严谨的术语体系,这一点和其
他科学学科并无二致。但不同的是,没有人会因
为不懂量子力学的各种晦涩的术语而鄙视物理
学,但他们却会因不能忍受心理学术语所造成的
隔膜而对科学心理学产生拒斥,继而转向了那些
通俗易懂但科学性无法得到保证的理论或方法。
究其原因,还是因为心理问题和现象与每个人的
关系太为紧密了,最近的需要总是要以最快捷的
方式介入和解决,这就构成了快速实用和科学研
究之间的一对矛盾。

第三,心理学许多基础研究确实和大众生活
有一定的距离。在所有的科学门类中,基础研究
转化为实际应用需要时间,有的研究发现甚至要
几十年之后才能体现出其应用价值,心理学的基
础研究向应用的转化也概莫能外。这种滞后性有
时会让人产生一种科学心理学研究毫无意义的错
觉。
最后一个,也是非常重要的一个原因,就是
大众媒体在科学心理学的传播方面做得并不够
好。随着心理学的热度持续升温,许多电视、电
台、网站和出版商和纸媒也不断推出与心理学相
关的节目、书籍或专栏,但由于种种原因(如专
业限制、商业考虑等等),最终呈现在大众面前
并得到广泛传播的往往并不是科学的心理学,而
是包装精美的伪心理学;有一些所谓的“心理学
家”甚至在媒体平台上用错误的理论误导大众。
与之相对应的是,真正的心理学家和专业书籍无
人问津,而星座、血型、养生以及各种未经实证
检验的古怪疗法却打着心理学的旗号招摇过市,
让心理学蒙受了许多质疑和指责。
基于以上种种,如何让公众了解真正科学的
心理学变得十分必要。市场上有关心理学的书籍
很多,但对象分化的情况也很突出:针对心理学
专业学生和心理学工作者的专业书籍能够提供很

多有用的信息和知识,但有专业门槛的隐形限
制;而针对普通读者的非专业书籍相对通俗但在
信息质量方面良莠不齐。斯坦诺维奇教授所写的
这本《这才是心理学:看穿伪心理学的本质》的
定位则兼顾心理学的初学者和对心理学感兴趣的
更广大的读者群体,从质量来说应为此类心理学
入门读物中之翘楚。在这本20万字左右的书里,
作者以生动而严谨的笔触告诉了读者什么才是真
正的心理学。书中重申了科学心理学诸多重要标
准和核心理念,澄清了有关心理学的种种误解和
迷思,有破有立,言之凿凿;理论讲述与精彩的
实验案例交相呼应,集科学性和趣味性于一体,
十分耐读;有些犀利的论点足以对读者原有的知
识信念构成挑战,但这种不安很快就会被知识重
构的提升感和思辨的乐趣所取代。
这本书先前的版本曾经由杨中芳老师翻译,
已使很多读者从中受益。从第8版开始到今天的
第10版,由我与刘肖岑老师共同翻译,对这3版
的翻译也让我们处于知识更新的喜悦中。书已近
付梓,但译者水平所限,难免有不周或纰缪之
处,还请广大读者给予指正。
本书第10版在第9 版的基础上有所更新,删
除了一些比较陈旧的文献和被最新的研究证明是
有争议的结论,同时补充了最新的研究结论和案

例,反映了所涉领域最新的进展。此外,作者对
一些评述文字的说法和措辞进行了调整,使之更
切合所论述的主题。全新升级之后,这一版不仅
原汁原味地保留了之前版本的精髓,同时在内容
上更为丰富和具有时效性。
我们要感谢北京师范大学心理学院邹泓教
授,华东师范大学心理系桑标教授,美国加州大
学伯克利分校教授、清华大学心理学系教授彭凯
平,山东师范大学心理系张文新教授,首都师范
大学心理系方平教授,以及中央财经大学社会发
展学院辛自强教授,在本书翻译过程中给予的指
点和帮助,以及一直以来在学术和思想方面的引
导和教诲。同时,第10版的顺利出版,与人民大
学出版社各位编辑认真严谨的工作是分不开的,
在此一并致谢。
要感谢的还有:中央财经大学的张杰、姜
涛、高霖宇、丁志宏、赵然、张红川、黄四林、
翁学东、冯源、辛志勇、于泳红、孙铃、苑媛、
张梅、侯佳伟、马敏、汪波、赵娜;首都师范大
学的王建平、李莉、田汉族、许晓晖、于开莲、
高维华、严冷、刘昊、梁九清、黄翯青、夏婧、
钱国英、周楠、孟繁华、丁锦红、郭春彦、王争
艳、王异芳、梁熙等诸位老师,以及我们的学生
陈婷、钱天月、张玉洁、杜宇、弓仲冬、谭洁、

张惠、张缙、郭晓红、王娟和齐小琳。感谢你们
在本书翻译、出版过程中提供的各种帮助和支
持。
美国心理学会前任主席、积极心理学创始人
马丁·赛利格曼教授曾用一个、两个和三个词形容
心理学现在的状态,分别
是:“good”(好),“not good”(不好)和“not
good enough”(还不够好)。的确,心理学是一
门蓬勃发展的科学,当前虽然有不尽如人意的地
方,但我们坚信,伴随着每一位科学心理学工作
者的不懈努力,心理学必将变得更好,帮助人们
实现更大的福祉。心存此志,无远弗届。
窦东徽 刘肖岑

序言

有这样一门尚不为大多数人所知晓的知识,
它涉及人类行为和意识的不同形式,可以被用来
解释、预测和控制人类的行为。学习这门知识的
人能够更好地理解他人,对决定他人想法和行为
的原因有更加全面和精确的认识。
你可能想不到,这门不被知晓的知识就是心
理学。
当我说心理学仍不为人所知时意味着什么?
你一定认为此话不能当真。如今,书店里充斥着
大量标题为心理学的书籍,电视和广播脱口秀定
时播放关于心理学的主题,报纸和杂志也辟有心
理学专栏,怎么能说心理学无人知晓呢?但从某
种关键的意义上来讲,心理学确实仍是一个不为
人知的知识领域。

尽管心理学似乎得到了众多媒体的关注,但
是心理学这个知识体系的绝大部分内容仍不为公
众所知。经由大众媒体传播的“心理学”知识在很
大程度上只是一种幻象。很多人不知道他们在书
店里看到的大部分所谓心理学书籍,都是由一些
在心理学界根本站不住脚的人写的;很多人也不
知道,多数在电视上号称心理学家的人,根本得
不到美国心理学会(American Psychological
Association, APA)和美国心理协会(Association
for Psychological Science, APS)的承认;他们更
不知道,大多数频频亮相的心理学“专家”,其实
对心理学领域的知识积累没有作出丝毫的贡献。
媒体这种对于“心理学”话题的浅薄关注,不
仅向公众传递了许多错误信息,还遮蔽了心理学
领域中真正的、不断发展的知识基础。公众不能
肯定到底哪些是心理学,哪些又不是,也不知道
该怎样独立对有关人类行为的主张作出判断。更
大的问题在于,很多人始终觊觎着那些要么缺乏
判断能力、要么认为无法对心理学主张作出判断
的公众。后一种观点有时被称为“无一定之规”的
态度,是本书要讨论的谬误之一,这种心态对社
会危害极大。公众不知道,关于行为的言论是可
以验证的,很多伪科学正是利用公众的这些无知
建立起百万美元的产业。人们并不知道许多伪科
学(例如占星术、通灵外科手术、超速阅读、生

物节律、接触治疗、潜意识自助录音带、辅助沟
通和灵媒侦探等)所宣称的主张,其实早已被证
明是错误的。本书提到的这些伪科学产业的存
在,助长了媒体对伪科学进行炒作式报道的趋
势。这种趋势对心理学的危害远比对其他学科的
危害要大,理解个中缘由,是学习如何正视心理
学的一个重要环节。
本书面向的不是即将成为心理学的研究者,
而是面向一个更大的读者群——心理信息的消费
者。本书的读者对象是心理学初学者,以及那些
在大众媒体上得知一些心理学话题、又想知道如
何去判断这些信息的合理性的广大读者们。
本书不是一本标准的心理学入门教材,它没
有对心理学领域已取得的研究成果进行总结。事
实上,单靠到大学里选修一门心理学导论的课
程,对于纠正公众心中已经被媒体误导了的对心
理学的看法来说,可能并不是终极的解决方案。
因为众多对心理学抱有很大兴趣的非专业人士没
有时间、没有钱或是没有机会进入大学进行正规
的学习。更重要的原因是,作为一名大学心理学
的教师,我不得不承认我和同事们在大学里教心
理学时,也总是没能引导初学者对心理学这门科
学产生一个正确的认识。原因在于初级的课程设
置中通常没有包含对批判性分析思维技巧的训

练,而这正是本书讨论的焦点所在。作为教师,
我们常常只会忙于 将“研究发现”塞入教学内容当
中。每次我们在和学生讨论到诸如媒体眼中的心
理学等稍微偏离教学大纲的话题时,都会感到有
些内疚,并开始担心自己会不会因为跑题而不能
在学期结束前完成所有授课内容。
现在的心理学导论类教科书通常都有
600~800页厚,并且引用了数百篇已经发表的文
献。当然,包含如此丰富的材料并没什么错,至
少它反映了心理学知识在不断增长。然而不幸的
是,负面效果也同时存在。教师们常常只忙于给
学生灌输一大堆的理论、事实和实验,而没时间
去关注那些会被学生带入心理学研究的基本问题
及错误观念。这主要是因为教师们(包括入门类
教科书的作者)想当然地认为,只要学生接触了
足够多的心理学研究,自然就能从中推导出问题
的答案。简而言之,他们希望学生可以从对心理
学各领域实证研究的讨论中,自行挖掘出各类问
题的隐含答案,但是这类希望往往都落空了。到
这门课的最后复习阶段或学期结束之前,教师们
才无比震惊和沮丧地发现,学生提出的一些问题
及说法,是他们在课程开始第一天就应该提出来
讨论的,而不是在14周之后。比如:“既然心理
学实验不同于现实生活,那么它们能告诉我们什
么呢”、“心理学能像化学那样成为一门真正的科

学吗”、“可是,我在电视上听一位心理大师讲的
正好与我们教科书上说的相反”、“我认为这个理
论相当愚蠢,因为我弟弟的行为和这个理论所说
的截然相反”、“心理学不过是些常识”、“每个人
都知道什么是焦虑,何苦还要去定义它呢”、“心
理学不过是一堆观点而已”。对于很多学生来
说,仅靠思考书中的内容是无法为这些问题找到
答案的。在本书中,我将对这类问题和说法背后
的误区进行澄清。
不幸的是,研究发现,普通的心理学入门课
程并不能有效地纠正初学者对心理学所持的诸多
误解(Keith Beins, 2008; Kowalski Tayloer, 2009;
Standing Huber, 2003)。这一不幸的事实赋予了
本书以合理性。心理学学生需要批判思维方面的
正确指导,批判性思维能够使其对心理学信息作
出独立的评估。
即使若干年后学生们不再记得心理学入门课
程中的内容,但他们仍然可以运用本书所涉及的
基本原理去判断心理学的主张。即使埃里克森
(Erikson)的人生发展阶段论被忘得一干二净,
他们也仍可以运用本书介绍的思维工具去辨别媒
体中出现的心理学信息的真伪。一旦掌握,这些
技能就可以成为终身受用的思维工具,帮助我们
去评判各种知识主张:首先,它将使我们能够对

那些看似合理的事实做出一个初步和总体的判
断;其次,这些技巧提供了一些评估“专家”观点
可信度的标准。因为在复杂的社会中,人们对专
家观点依赖始终存在,在获取知识时,对专家观
点可信度的判断就变得尤为重要了。虽然这些批
判性思维技巧可运用于各个学科或知识门类,但
它们在心理学领域里尤其重要,因为此领域经常
被大众媒体所歪曲。
许多心理学家都对试图阻止心理学被歪曲的
努力持悲观态度。虽然这种悲观并非没有道理,
但是这本类似“消费者指南”式的书源自一个信
念,那就是心理学家不能让这一问题成为一种自
我实现式的预言。
尽管我很高兴这本书能有多次再版的机会,
但令人遗憾的是,本书存在的原因仍和本人当初
撰写本书第一版时完全一样。媒体对心理学的介
绍一如既往地是在误导大众,而学生在开始上心
理学入门课程时,还是带着与以往同样多的对于
心理学的误解。正因为如此,本书后续几个版本
的目标始终如前。这些目标也正在被越来越多心
理学教师所共享。斯坦福大学心理学家罗杰·夏佩
德(Roger Shepard)表达了与本书第一版写作初
衷相同的看法:“虽然大多数心理学的本科生或
许不会走上学术科研的道路,但我们仍然希望他

们有能力去对那些不断出现在媒体上的片面、幼
稚、混乱及夸张的所谓社会科学‘发现’的报导作
出判断……那些广为流传、认为可以通过片面的
常识或更为糟糕的星相学之类的伪科学就能充分
理解人类行为和心理现象的谬论,势必向我们持
续发出挑战。”(Shepard, 1983, p.855)
批判性思维技能帮助人们更好地理解心理学
的主题,以及他们周围的世界所发生的事情。本
书将对此技能作一个简略的介绍。

第10版更新的内容
因为之前版本已经进行了章节重组,本书第
10版在结构上没有作很大的改动,各章节的内容
和顺序也保持原样。并且应评审者和读者的要
求,这一版与第9版篇幅相当。我更新和重写了
书中的许多例子(保留了读者反响最好的例
子),用最近的研究和主题替换掉了那些过时的
案例。本版最大的修订在于引用与本书所提及的
各种概念和实验相关的最新研究资料。因此,大
量新的引文出现在这一版中(确切来说是172条
新引文),读者可以获得有关样例和概念最新的
参考文献。

本书一如既往会对批判性思维技能作简略介
绍,帮助学生更好地去理解心理学的主题。在过
去的15年里,大学里强调批判性思维技能的呼声
越来越高(Abrami et al., 2008; Sternberg, Roediger,
Halpern,2006)。的确,美国一些州立大学系统
已经进行了以加强批判性思维教育为目的的课程
改革。与此同时,也有其他教育学学者认为,批
判性思维技能不应该脱离特定的学科内容。而
《这才是心理学》正好融合了这两种取向,在帮
助教师教授丰富的现代心理学知识的同时传授批
判性思维的技巧。
欢迎读者们将对本书的意见发送到以下邮
箱:Keith.stanovich@utoronto.ca.

Chapter 1
心理学充满生机:在科学阵营里
左右逢源

弗洛伊德问题
在大街上随便拦住100个人,请他们说出一
个健在的或已故的心理学家的名字,然后记下他
们的答案。毫无疑问,他们提到的会是菲尔博士
(Dr. Phil)、韦恩·戴尔[1](Wayne Dyer)以及其
他一些“媒体心理学家”。如果我们把这类媒体和
通俗心理学家排除在外,只考虑那些对心理学作
出过卓著贡献的心理学家,那么这项非正式小调
查的结果就几乎没什么悬念了——西格蒙德·弗洛
伊德会名列榜首,B. F. 斯金纳可能会屈居次席,

但得票数会远远落后于弗洛伊德。任何其他心理
学家都缺乏足够的知名度来撼动这两位的地位。
因此,可以说弗洛伊德和那些在媒体上频频露脸
的通俗心理学共同定义了公众心目中的心理学。
弗洛伊德的声名远播,极大地影响了普通公
众对心理学的理解,同时也造就了诸多认识上的
误区。例如,许多刚入门的心理学学生会惊讶地
发现,如果对美国心理学会(APA)会员中所有
认同弗洛伊德精神分析的人数进行一下统计,他
们的人数居然没有占到会员总数的10%。在另一
个主要的心理学组织美国心理协会(APS)中,
这一比例也绝不会超过5%(Engel, 2008)。有一
本受欢迎的心理学入门教科书(Wade Tavris,
2008),在其超过700多页的篇幅中,只有15页
内容提到弗洛伊德或精神分析学派,而且这15页
中经常出现的是对其的批判(“大多数弗洛伊德
的观点都曾经并且现在依旧被大多数实证取向的
心理学家排斥”,p.19)。
简而言之,现代心理学并没有像媒体和一些
人文学科那样被西格蒙德·弗洛伊德的理论所左
右,也没有被其限定。在现代心理学家所关注的
大量研究主题、数据和理论中,弗洛伊德的工作
只占其中极小的一部分,在这些研究和理论中占
更大比重的则是5位诺贝尔奖得主所做的工作:

大卫·胡贝尔(David Hubel)、丹尼尔·卡尼曼
(Daniel Kahneman)、赫伯特·西蒙(Herbert
Simon)、罗杰·斯佩里(Roger Sperry)和托斯腾
·维瑟(Torsten Wiesel)以及美国国家科学基金的
前负责人理查德·阿特金森(Richard Atkinson)的
贡献。然而,这些人的名字对公众来说却相当陌
生。
弗洛伊德对于现代心理学的重要性被无限地
夸大了,这事儿已经足够糟糕了。更糟的是,弗
洛伊德的调查方法完全不能代表现代心理学家是
如何进行研究的。事实上,弗洛伊德式的研究方
法彻底误导了人们对心理学研究的印象。例如,
弗洛伊德并不采用控制实验,而我们将在第6章
讲到,控制实验是现代心理学家“兵器库”中最有
力的武器。弗洛伊德认为,个案研究足以证明理
论的真实或谬误,在第4章中,我们将谈谈这一
理念为何是错误的。正如一位心理治疗领域的史
学家所说的那样,如果弗洛伊德本人是一名科学
家,那么他所宣扬的是一门很奇怪的科学……精
神分析包含理论和假设,但是缺少实证观测的方
法(Engel, 2008, p.17)。
最后,弗洛伊德的工作中最大的问题是理论
和研究数据的联系。正如我们将在第2章看到
的,对于一个科学理论来说,理论和研究数据的

联系必须满足一些标准,而弗洛伊德的理论常常
不能满足这些标准(Dufresne, 2007; Engel,
2008)。简而言之,弗洛伊德根据他得到的数据
(个案研究和内省)建立了一套精细的理论,而
这些数据并不足以支撑此理论;他专注于构建复
杂的理论构架,但并没有像许多现代心理学家那
样,保证这些理论建在可靠、可重复的因果关系
之上。总之,人们对于弗洛伊德式的工作太过熟
悉,这严重阻碍了他们对现代心理学的正确理
解。
在这一章中,我们将采用两种方法来解
决“弗洛伊德问题”:首先,当我们展示现代心理
学的多样性时,就能非常清楚地了解到弗洛伊德
的工作所占的比重其实是很小的;其次,我们将
讨论一下,在广泛而多样的心理学研究中,哪种
特征是最为普遍的。有关弗洛伊德工作的那种过
时的认识遮蔽了普通大众的双眼,使之无法看到
现代心理学所共有的唯一而普遍的特性:用科学
的方法去寻求对行为的理解。
注释
[1]这两位是活跃于美国媒体的所谓心理学家的代表,他
们这类人通常有着丰富的媒体经验,有广泛的受众,但他们
没有受过严格的学术训练,不被真正的心理学学术团体认

可,所传播的往往是一些似是而非的心理学知识。——译者
注

现代心理学的多样性
事实上,现代心理学包含了大量不同的内容
和观点。这种多样性使得作为一门学科的心理学
显得不那么浑然一体。美国心理学基金会杰出教
学奖得主亨利·格雷特曼(Henry Gleitman, 1981)
将心理学描述为“一个松散地联合在一起的学术
王国,它横跨了生物科学和社会科学两个领
域”(p. 774)。心理学圈以外的人批评这种多样
性。例如,人类学家克利福德·格尔茨(Clifford
Geertz, 2000)抱怨道:“至少从外部来看,心理
学不像是一个单一的领域,能够像通常那样被分
为学派和专业。它看起来像是不同的、不相关的
调查方法的大杂烩,这些调查之所以能够归为一
类,是因为它们都以这样或那样的方式探究所谓
心智功能。”(p.187)
心理学有着令人惊叹的广泛性和多样的调查
方法,知道这一点对于理解心理学的本质至关重
要。可以简单列举一些具体指标来证明这一点:

美国心理学会(APA)有56个分支机构,每个分
支都代表了一个特定的研究或应用领域(见表1
—1)。从表1—1中,你可以看到心理学研究主
题、研究背景和研究方法的丰富性和多样性。另
一个大型心理学组织——美国心理协会(APS)
也同样分支众多。其实,表1—1对于心理学领域
的多样性的描述还是较为保守的,因为它给我们
造成了一种印象,即每个分支都是一个特定的专
业领域。事实上,56分支机构中的每一个都是非
常宽泛的研究领域,包含更小的不计其数的分
支。简而言之,要穷尽心理学领域主题的多样性
是非常困难的。
表1-1 美国心理学会(APA)的分支机构

1.普通心理学(General Psychology)
2.心理学教学(Teaching of Psychology)
3.实验心理学(Experimental Psychology)
5.评价、测量和统计(Evaluation,
Measurement, and Statistics)

6. 神经行为科学和比较心理学(Behavioral
Neuroscience and Comparative Psychology)
7.发展心理学(Developmental Psychology)
8.人格和社会心理学(Personality and Social
Psychology)
9.社会问题的心理学研究(Psychological
Study of Social Issues)
10.审美、创造力及艺术心理学(Psychology
of Aesthetics, Creativity, and the Arts)
11.临床心理学(Clinical Psychology)
12.应用咨询心理学(Consulting Psychology)
13.工业和组织心理学(Industrial and
Organizational Psychology)
14.教育心理学(Educational Psychology)
15.学校心理学(School Psychology)
16.理论咨询心理学(Counseling
Psychology)

17.公共服务中的心理学家(Psychologists in
Public Service)
18.军事心理学(Military Psychology)
19.成人发展与老龄化(Adult Development
and Aging)
20.应用实验和工程心理学(Applied
Experimental and Engineering Psychology)
21.康复心理学(Rehabilitation Psychology)
22.消费者心理学(Consumer Psychology)
23.理论和哲学心理学(Theoretical and
Philosophical Psychology)
24.行为分析( Behavior Analysis)
25.心理学史(History of Psychology)
26.社区心理学(Community Psychology)
27.精神药理学和药物依赖
(Psychopharmacology and Substance Abuse)

28.心理治疗(Psychotherapy)
29.心理催眠(Psychological Hypnosis)
30.国家心理学常务联合会(State
Psychological Association Affairs)
31.人本心理学(Humanistic Psychology)
32.智力缺陷和发展性障碍(Mental
Retardation and Developmenta Disabilities)
33.人口与环境心理学(Population and
Environmental Psychology)
34.女性心理学(Psychology of Women)
35.宗教心理学(Psychology of Religion)
36.儿童、青少年和家庭服务(Child, Youth,
and Family Services)
37.健康心理学(Health Psychology)
38.心理分析(Psychoanalysis)
39.临床神经心理(Clinical

Neuropsychology)
40.心理学和法律(Psychology and Law)
41.独立从业的心理学者(Psycholigists in
Independent Practice)
42.家庭心理学(Family Psychology)
43. 男女同性恋及双性恋的心理学研究
(Psychological Study of Lesbian, Gay, and Bisexual
Issues)
44.少数民族的心理学研究(Psychological
Study of Ethnic Minority Issues)
45.媒体心理学(Media Psychology)
46.锻炼和运动心理学(Exercise and Sport
Psychology)
47.和平心理学(Peace Psychology)
48.团体心理学和团体治疗(Group
Psychology and Group Psychotherapy)
49.成瘾(Addictions)

50.男性和男性化的心理学研究
(Psychological Study of Men and Masculinity)
51.国际心理学(International Psychology)
52. 临床儿童心理学和青少年心理学
(Clinical Child Psychology and Adolescent
Psychology)
53.幼儿心理学(Pediatric Psychology)
54.药物疗法(Pharmacotherapy)
55.创伤心理学(Trauma Psychology)
注:没有分支4和11。

多样性的含义
许多人学习心理学是希望能够学到一套宏大
的心理学理论,以此来概括和解释人类行为和意
识的方方面面。但这类愿望总是会落空,因为构
成心理学的不是一整套宏大的理论,而是许许多
多不同的理论,每个理论仅仅能够解释行为的有

限方面(Griggs, Proctor, Bujak-Johnson, 2002)。
心理学的多样性使得理论整合变得极为困难。事
实上,在许多心理学者看来,“整合”本身就是“不
可能的任务”。尽管如此,另外一些心理学家却
正在寻求领域内的理论整合(Cacioppo, 2007a,
2007b; Cleeremans, 2010; Gray, 2008; Henriques,
2011; Sternberg, 2005)。例如,在过去的20年
间,心理学的学科统一性有所增强,这要归功于
进化心理学家的努力。这些研究者将人类心理过
程视为服务于某些重要进化功能(诸如亲缘关系
识别、择偶、合作、社会交换及后代抚养等)的
机制(Buss, 2005, 2011; Cartwright, 2008; Ellis
Bjorklund, 2005; Geary, 2005, 2008),并试图以此
来实现概念的整合。卡乔波(Cacioppo, 2007b)
同样也指出,像社会认知神经科学这样的分支,
将心理学中的大量专业如认知心理学、社会心理
学和神经心理学紧密地联系在一起。
一些研究者认为心理学的多样性反映了学科
的潜在优势(Cacioppo, 2007a; Gray, 2008)。例
如,卡乔波(Cacioppo, 2007a)将心理学视为所
谓的“枢纽学科”——会对其他领域产生广泛影响
的学科。他引用证据表明,和其他科学相比,心
理学的发现有着更深远的影响。然而,无论心理
学家对心理学主题的统一性持何立场,他们都承
认,即便有一天能够实现理论的整合,其过程也

是极为困难的。缺乏理论的整合为心理学招来了
一些批评,贬低了它作为科学所取得的进步。这
类批评源于一个错误的观念,即所有真正的科学
都必须具备一个宏大的、统一的理论。之所以说
它错误,是因为它忽视了其他科学同样也缺乏一
个完备统一的概念体系这个事实。哈佛大学心理
学家威廉·艾斯特斯(William Estes, 1979)已经
强调过这一点:
实验心理学家所面临的这种困境既不新
鲜,也非独有。20世纪早期,物理学在本科
水平的教学中便被分成了若干独立学科。因
此,我是通过分别学习力学、热力学、光
学、声学和电学而了解这门科学的。同样,
化学也曾被分为无机化学、有机化学、物理
化学和生物化学。当时这些分支之间的交流
和融合并不比现在的心理学好到哪里去。它
们都仅仅在抽象的数学理论水平上才实现了
整合。医学也被分为众多分支,而且和心理
学一样,没有新的整合出现(pp. 661622)。
一旦我们知晓了决定某一门学科结构的社会
和历史因素是怎么回事,就能认识到,要求所有
领域具备高度统一性是不合逻辑的。事实上,许
多学者认为“心理学”这个暗示学科内容具有统一

性的词汇并不能反映学科的特性。其结果就是,
许多美国的知名大学的学院已经把它们的名字改
为心理科学学院(Department of Psychological
Sciences)(见Jaffe, 2011)。“科学”这一术语承
载了本章的两个重要信息:其一是多元化标志,
即我们讨论过的这个学科内容的多样性的观点;
其二“科学”这一词汇也标志着,应该从方法而非
内容上去寻找心理学这门学科的统一性。只有这
样,我们才有望从不同研究者的研究目的中发现
更多的统一性。但即使是在方法领域,也依然存
在着有关这门学科的一些很深的误解。

科学的统一性
仅说心理学是关于人类行为的科学,并不能
将它和其他学科区分开来。许多其他专业团体和
学科——包括经济学家、小说家、法律、社会
学、历史、政治科学、人类学和文学研究——都
或多或少与人类行为有关,心理学在这方面并非
独树一帜。
应用性也不能证明心理学具有任何独特性。
例如,许多大学生选择主修心理学是因为他们有
一个要帮助他人的崇高目标。但是在许多领域,
如社会工作、教育、护理、职业咨询、物理治
疗、警事科学、人力资源以及语言矫正等,“帮
助他人”都是其中的重要组成部分。同样,培训
应用性的、通过咨询来帮助他人的专业人才并不
需要单独开辟一门叫做“心理学”的学科。
只有两点能证明心理学是一门独立的学科:
其一,心理学研究采用科学方法来探究人类及动
物的所有行为;其二,从这一知识衍生出的实际

应用是具备科学基础的。如果不是这样,心理学
就失去存在的理由了。
心理学不同于其他行为研究领域的地方在
于,它试图向公众保证两点:第一,心理学中有
关行为的结论都有科学证据;第二,心理学的应
用都源于科学方法,并经过了科学方法的检验。
心理学是否曾经偏离过这两个目标呢?有过,而
且经常如此(Lilienfeld, 2007; Lilienfeld, Ruscio,
Lynn, 2008)。本书就是关于怎样更好地实现这两
个目标的。在第12章中,我将回到这一主题——
一些心理学工作者因为不遵守适当的科学标准而
自我损害了其作为心理学家的合法性。但是,从
原则上讲,科学性正是保证心理学作为一门独立
学科的标准。如果有朝一日心理学不再追求这些
目标,即它不再愿意坚守科学标准,那它也就该
关张大吉,将其关注的领域拱手让给先前提到的
那些学科——因为此时它已成为了一个完全多余
的知识领域。
毫无疑问,任何人想要理解心理学,第一步
也是至关重要的一步,就是要意识到心理学的首
要特征——它是有关行为的、以数据为基础的科
学研究。对这一事实及其全部内涵的理解将贯穿
本书的始终,因为这是我们认识真正心理学的最
基本的途径。反过来说,人们之所以对心理学的

理解会出现各种各样的偏差,正是因为未能意识
到它是一门科学的学问。例如,我们常常会听到
学术圈外的人宣称心理学不是科学。为什么还会
有这样的误解?
那些想让公众相信“心理学不能成为一门科
学”的企图,其产生的背景各不相同。正如我们
在后面的章节中所要讨论的,许多有关心理学的
错误认识,都是由那些伪心理学的代理人处心积
虑制造的。在我们的社会中,一个经营伪科学信
念系统的巨大产业正在兴起,这一信念系统出于
既得利益的考虑,总是想让大众相信,无论什么
都能纳入心理学的范畴,而且心理学的主张不能
以理性标准来衡量。这无疑为“催眠减肥”、“激发
潜在心灵能量”、“睡觉时学法语”这类广告以及利
润高达数百万的“心理自助”产业里其他诸多门道
的营销创造了绝佳的氛围。此类门道要么不是建
立在科学证据基础上,要么(在许多时候)与已
有的证据相冲突。
另一种对于科学心理学的排斥是由于一些人
不愿看到科学进入到长期以来由不容置疑的权威
或“常识”统治的领域里。历史上此类例子不胜枚
举——人们拒绝使用科学,而更喜欢利用哲学沉
思、神学谕告或世俗智慧去解释现实世界。每一
门科学都会经历过一个受到阻碍的阶段。与伽利

略同时代的知识分子拒绝透过他的新望远镜观察
天空,因为“木星存在卫星”颠覆了他们的哲学和
神学信仰。几个世纪以来,人类解剖学的发展可
谓步履蹒跚,因为世俗和宗教禁止对人类尸体进
行解剖(基督徒认为,身体的内部是“上帝的辖
区”,见Grice, 2001)。查尔斯·达尔文总是受到
不断的抨击。保罗·布洛卡(Paul Broca)的人类
学协会(Society of Anthropology)在19世纪的法
国受到抵制,因为有人认为关于人类的知识会颠
覆国家。
关于人类的知识每向前迈进一步,都会引发
反抗。然而,当人们开始意识到科学并没有通过
调查和研究对人性造成亵渎,而是以扩展知识的
方式促进了人类的自我实现时,反抗终将烟消云
散。谁现在还认为星系图以及宇宙是由无数星球
所组成的复杂理论会摧毁我们对于宇宙的向往?
谁会选择禁止人体解剖时的医疗保健系统,并进
而拒绝从社区中获得的现代医疗保健?对于星球
和人类身体的实证性态度并没有磨灭人性。更近
的例子是,达尔文的进化论体系为遗传学和生物
学取得非凡的进步奠定了基础。但是,在我们更
接近人类的本质及起源的同时,残余的反抗势力
仍然存在。在美国,一些政客继续施压,意欲在
公立学校推行“神创论”教学;同时调查显示,有
很大比例的美国人(欧洲和加拿大人亦如此)并

不接受“人类是经过自然选择进化而来的”这一科
学事实(Barnes, Keilholtz, Alberstadt, 2008;
Frazier, 2009, 2010; Laden, 2008)。进化生物学有
着无数辉煌的科学成就记录,时至今日还是照样
被公众所排斥。如此看来,心理学这门志在将所
有关于人类的固有信念都置于科学检验之下的新
兴科学,时下还会引发人们对其正确性的否定,
这又有什么好奇怪的呢?

那么,什么是科学
为了理解什么是心理学,我们必须理解什么
是科学。或许我们可以从“什么不是科学”入手。
按这种方法,我们能摒弃大部分常见的错误观
念。首先,科学并不是由内容来定义的。宇宙万
物的任何方面对于一门科学学科的发展来说,都
是一场公平的游戏,当然也包括人类行为的所有
方面。我们不能将宇宙万物分为“科学的”和“非科
学的”两类。尽管历史上始终有一股强大的力
量,试图将人类排除在科学研究的范围之外,但
正如我们所见,它们均以失败告终。拒绝将心理
学作为一门科学学科来对待,可能代表了这一历
史争论的余音。
科学也不能按照特定实验器材的使用来定
义。试管、电脑、电子设备或研究者的白大褂都
定义不了科学。这些都是科学的附属物而不是其
本质特征。科学是一种思考和观察事物以便深入
理解其运行机制的方法。

在本章的剩余部分,我们将讨论科学的三个
相互关联的重要特征:(1)应用系统的实证主
义;(2)产生公共知识;(3)验证可解决的问
题。尽管我们将逐一检验每一条特征,但请记住
这三条特征构成了相互联系的统一整体(更多有
关科学的普遍特征的详细讨论,参见书后参考文
献部分列出的Bronowski、Cournaud、Medawar、
Popper、Raymo以及Sagan的著作)。

系统的实证主义
如果在任何辞典中查找“实证主义”,你会发
现它的意思是“基于观察的实践”。科学家通过验
证来找寻世界的规律。这个事实可能对你来说是
显而易见的事实,而这正是过去两个世纪以来科
学态度传播的结果。在过去,它却不是显而易见
的。回想一下伽利略的例子,伽利略借助他那原
始的望远镜,宣称看见了环绕木星的一些卫星。
而在当时,有学识的人们都认为只存在七个“天
体”(五颗行星、太阳、月球)。长久以来,人
们认为获得知识的最佳途径是纯粹思考或诉诸权
威。一些同时代的学者甚至拒绝透过伽利略的望
远镜进行瞭望。还有一些人认为望远镜是设计用
来骗人的。更有一些人指责说望远镜是在地面上

而非天空中工作(Shermer, 2011),另外一位叫
弗朗西斯科·西奇(Francesco Sizi)的学者试图驳
倒伽利略,但他并不是通过观察,而是通过下面
的一番话:
人的脑袋上有七个窗口:两个鼻孔,两
只耳朵,两只眼睛和一张嘴;因此在天界有
两颗吉星,两颗灾星,两颗发光星(指日
月),以及性状不明但无关紧要的水星。从
这点和其他无数相似的自然现象诸如七种金
属等中,我们就可以归纳出行星必然是七
个……除此之外,犹太人和其他古老的民
族,都将一周分为七天,并以七大行星来命
名;如果现在我们增加了行星的数目,将导
致整个系统的崩溃……进一步来说,卫星用
肉眼无法看到,因此对于地球没有影响,既
然没有用处,也就不存在(Holton &
Roller, 1958, p. 160)。
关键问题不在于以上论述多么愚蠢可笑,而
在于它被视作可与真实观察抗衡的一种辩驳。今
天我们嘲笑它是因为我们都是事后诸葛亮。三个
世纪以来,业已证明力量的实证取向使我们强于
可怜的西奇。要是没有经历这些实证主义的岁
月,我们中的许多人可能都会点头同意并对他大
加褒奖。的确,实证取向并不一定显而易见,这

就是为何即使在一个科学占统治地位的社会中,
我们也不得不经常强调它的原因。
纯粹、单一的实证主义还不够。注意本小节
的标题是“系统的实证主义”。观察很好,而且很
有必要,但是对于自然世界单纯的、非结构化的
观察并不能导致科学知识的产生。假使你记录下
自己一天中从起床到睡觉之间观察到的所有情
况,完成这一任务时,你会拥有一大堆事实,但
仅凭此并不能让你更好地理解这个世界。科学观
察被称为“系统性的”,是因为它是结构化的,所
观察的结果能够揭示自然世界一些潜在的本质。
科学观察通常都是理论驱动的;它们检验有关世
界的各种不同解释观点。它们是结构化的,因此
可以根据观察结果,决定哪些理论得到支持而哪
些则被拒绝。

公共性的、可检验的知识:可重复性和
同行评审
从某种特殊意义上说,科学知识是公共性
的。当然,并不是说把科学发现张贴在社区中心
的公告牌上就叫“公共性”了。我们指的是这样一
个事实,即科学知识并不单独存在于特定个体的

头脑之中。从某种重要意义上说,科学知识在没
有提交给科学团体、接受他人批评和验证之前,
是根本不存在的。那些被认为隶属于特定个体思
维过程中、不可接受他人审查和批评的“特殊”知
识,永远都无法获得科学知识的地位。
科学通过可重复性来实现其公共可检验性的
理念。一项发现如果想在科学界获得公认,就必
须以一种能够让其他科学家尝试相同实验并获得
相同结果的方式呈现给科学团体。当这一切都完
成,我们就可以说,这一发现是可重复的。科学
家利用可重复性来定义公共知识。可重复性保证
了特定发现并不是由于个别调查者的错误或偏差
而产生的。简而言之,一项发现如果想要被科学
团体所接受,它必须能够被原始调查者以外的其
他人所重复。当一项发现以这种方式被呈现出来
时,它就成为了公共性的。它不再仅仅为原始研
究者个人所有,它还能够被其他人获取、扩展、
批评,或以他们的方式得到应用。
诗人约翰·唐尼(John Donne)告诉我们“任
何人都不是一座孤岛”。在科学中,没有一个研
究者是一座孤岛。每个研究者都与科学团体及其
知识基础相联系。正是这种相互联系使得科学累
积性地发展。研究者不断在原有知识的基础上进
行新的探索,力求超越已知。而这一过程的前提

便是,先前的知识以一种适当的方式予以陈述,
使任何研究者都能以之为基础来进行探索。
公共性的、可检验的知识,指的是我们可以
将研究发现递交给科学团体,团体中的任何人都
能对其进行重复检验、批评或拓展。这个标准不
仅对于科学家,同时对于作为消费者的外行人来
说也是最重要的,因为他们必须对来自媒体的科
学信息进行评估。正如我们将在第12章所看到
的,区分大搞伪科学的江湖术士和真正的科学家
最主要的一个方法就是,前者常常避开科学出版
的常规渠道,而选择直接通过媒体公开他们
的“发现”。当公众面对真实性可疑的科学发现
时,一个屡试不爽、颠扑不破的标准就是,考察
这些发现是否在得到认可的科学期刊上发表过以
及是否经过了同行评审。对这一问题的回答往往
能够区分“李鬼”和“李逵”。同行评审是指每一篇
投到研究性期刊的文章都要经过数位科学家的评
审,并将批评意见提交给编辑(通常都是此期刊
所覆盖的某一领域中有资深研究经历的专家),
再由编辑权衡这些意见,确定这篇文章可以立即
发表,还是需进一步实验研究和统计分析之后再
发表,或是因为有缺陷或价值太低而拒绝接受。
大多数期刊在每期中都刊有编辑条例说明,因此
很容易知道此期刊是否经过同行评审。

并非所有经过同行评审的科学期刊中的信息
都必然正确,但至少它已满足了同行批评和监督
的标准。同行评审是一个最低标准,而非严格的
标准,因为大多数学科领域中都会有几十种质量
参差不齐的期刊。大部分科学观点在满足一些基
本标准的前提下,都可以在某些地方以正规的方
式出版。那种认为只有很小部分的数据和理论才
能够在科学界获得出版的观点是错误的。当一些
心理救助或治疗方面的江湖术士试图说服媒体和
公众时,往往会暗示,一种所谓“正统科学”的阴
谋将他们排除在科学出版渠道之外。但是,稍微
想一想,心理学领域中有多少这样的合法渠道
啊!APA的数据库 《心理学文摘》(PsycINFO)
收录了来自2000种不同期刊的文献,其中大部分
期刊都有同行评审。几乎所有待检验的理论和实
验都能在如此众多的出版物中找到自己的发表渠
道。
再次强调,我不认为所有发表在具有同行评
审机制的期刊上的所有观点都必然正确。相反,
正如我先前所强调的,发表只是一个最低的标
准。然而关键在于,任何一种理念、一个理论、
一项主张或疗法如果不能在有同行评审的学科文
献中获得适当的收录,问题就很明显了。尤其是
当某一主张缺乏证据却伴随着媒体的宣传活动
时,此理念、理论或疗法显然是骗人的。例如,

2005年美国宾夕法尼亚州有一桩著名的诉讼,有
人试图在学校的生物课上教授神创论,鼓吹智力
设计(神创论的一种形式)理念的一个证人说,
他很难举出任何一个经过同行评审的有关智力设
计的研究,尽管这一运动已经兴起了十年有余
(Talbot, 2005, p.68)。
同行评审机制在不同学科之间有所区别,但
是根本理念是相同的。同行评审是科学将客观性
和公开评议标准制度化的一种方法(另一种是重
复验证)。观点和实验要提交给其他评估,经过
一个仔细推敲的过程。只有通过这一严格过程的
观点才算符合了公共验证的标准。同行评审程序
绝非完美,但它对我们消费者来说是唯一的保护
机制。忽略它就等于让我们自己被巨大的伪科学
产业玩弄于股掌之间,而这一产业又极其善于操
纵媒体来达到自己的目的(见第12章)。在随后
的章节中,我们将更详尽地讨论,如果忽视这些
心理科学实践中固有的审查与制衡,我们将要付
出多么高昂的代价。

实证可解的问题:科学家对于可检验理
论的研究

科学针对的是可解决的、明确具体的问题。
这意味着就其类型来说,科学家们所致力解决的
问题是能通过现有的经验技术获得答案的。如果
在当前所掌握的经验技术条件下,问题无解或理
论不可验证,科学家们将不会对它展开研究。例
如,“在日托期间,给予结构化语言刺激的3岁儿
童,与那些没有给予这些额外刺激的儿童相比,
是否可以更早地做好接受阅读指导的准备”就是
一个科学问题,因为在现有的经验方法之下,这
是一个可解的问题。“人性本善还是本恶”就不是
一个可实证的问题,因此不属于科学领域。“生
命的意义是什么”同样也不是实证问题,因此也
不属于科学领域。
科学通过以下方式得以进步:提出理论解释
世界中的特定现象,根据这些理论作出预测,实
证地检验这些假设,基于检验的结果对理论进行
修正,通常次序为:理论→预测→检验→修正。
因此对于科学家来说,“可解问题”这个词的意义
通常是“可验证的理论”。什么样的理论才算是“可
验证”的呢?这一理论必须与真实世界中可观察
的事件具有特定的关联;这就是“实证可检验”的
含义。可检验性标准在学术上通常被称为“可证
伪标准”,这也是本书第2章的主题。
我们说科学家解决实证可解问题,并不是说

在不同类别的问题中,有的本质上是可以解决
的,而有的则注定无法解决,并且这种区分是固
定不变的。恰恰相反,有些当前无法解决的问
题,在理论和经验技术更加进步的时候会成为可
解的。例如,20年前,对于“托马斯·杰斐逊是否
与其奴隶萨丽·海明斯生下了她的某个孩子”这一
争议话题,不会有历史学家认为它是一个实证可
解的问题。然而到了1998年,由于基因技术的进
步,这个问题已成为可解的,发表在《自然》
(Nature)杂志的一篇文章(Foster et al., 1998)
指出,杰斐逊极可能是埃斯顿·海明斯·杰斐逊的
父亲。
这就是科学得以发展而新的科学得以诞生的
方式。但对于“当前什么是可解的”这一问题,总
是存在巨大分歧。因为涉及特定问题时,科学家
们自己在这点上的意见都难以统一。因此,尽管
所有科学家都认同可解性标准,但是他们对其特
定应用可能存在不同的意见。诺贝尔文学奖得主
彼得·密达沃(Peter Medawar)就曾把他的一本
书定名为《可解的艺术》(The Art of the Soluble,
1967),并在书中指出,科学的一部分创造力就
在于寻找处于人类知识最前沿、并可以用实证技
术加以解决的问题。
心理学本身就提供了许多从无解到可解的好

例子。有许多问题,诸如“一个孩子如何获得其
父母的语言”、“为什么我们会忘记我们曾经知道
的事情”、“身处一个群体中会如何改变一个人的
行为和思想呢”等,在人们意识到可以以实证的
方法来解答之前的几个世纪里,都只能被猜想而
已。随着这一认识的慢慢发展,心理学逐渐集合
了来自各个领域中关于行为的各种问题。心理学
科逐渐脱离哲学,并成为了一门独立的实证科
学。
认知心理学家史蒂芬·平克(Stephen Pinker,
1997)讨论了“未知”可以划分为“问题”或“玄
谜”。如果是“问题”,我们知道其答案是能找到
的,即使我们目前还没有答案,我们也知道它大
概是什么样子。如果是“玄谜”,我们甚至不能想
象答案可能会是什么样子。利用这些术语,我们
可以看到,科学就是将玄谜变为问题的过程。事
实上,平克(1997)指出,他之所以要写《思维
的运作》(How the Mind Works)这本书,正是
因为“从心理表象到浪漫的爱情,几十个心理和
思维方面的玄谜最近已经升级为问题了”(p.
9)。

心理学和世俗智慧:“常识”的误
区
我们每个人都有一套内隐的有关行为的模
型,这些模型影响着我们的互动以及我们如何看
待自己和他人。事实上,一些社会、人格和认知
心理学家正在探究这些内隐的心理学理论的本
质。我们很少会清晰并有逻辑地表达我们的理
论。相反,我们通常只有在特意关注它们,或者
发现它们正遭遇某种挑战时,才会意识到其存
在。其实,我们个人的行为模型并不像真正的理
论那样具有内部一致性。相反,当我们觉得需要
对行为作出解释时,往往搬出一箩筐关于人类行
为的普遍真理、说教及谚语。这些关于行为的常
识存在一个问题,它们之中有不少是自相矛盾
的,因此也是不可证伪的(证伪原则是第2章的
主题)。
人们爱用一些民间谚语来解释行为事件,即
使之前在解释同一类型的事件时曾用过与之完全

矛盾的谚语。例如,我们中的大多数人都听到或
说过“三思而后行”——若不是我依稀记得之前有
人告诫说“该出手时就出手”,我还会觉得这是个
有用的、直接的行为建议呢!“小别胜新婚”明确
预测了一种对于事件的情绪反应,但“眼不见,
心不烦”不也同样如此吗?如果“欲速则不达”,那
为什么有时我们又听到“时不我待”?既然“三个臭
皮匠,顶个诸葛亮”,为什么又说“三个和尚没水
吃”?如果我认为“行走江湖,安全第一”,为什么
也相信“不入虎穴,焉得虎子”?如果“异性相
吸”,为什么又“物以类聚”?我劝许多学生“今日
事今日毕”,但我希望没跟我刚刚指导过的那个
学生说过这番话,因为我刚还跟他说“要顺其自
然”。这类谚语和俗话构成了对行为的固有“解
释”,人们爱用它们,就是因为它们难以驳倒。
不管发生什么事,可以拿一条出来解释一番。难
怪我们都认为自己是判断他人行为和人格的高
手。天底下发生的事我们都能解释。世俗智慧的
可鄙之处就在于,它们压根不承担被驳倒的风
险。
世俗智慧属于“后见之明”的智慧,并且它在
真正预测性的意义上是无用的,这也就是为什么
邓肯·沃茨(Duncan Watts)将他的一本书命名为
《一切都显而易见:一旦你知道了答案》
(Everything Is Obvious: Once You Know the

Answer)(2011)。沃茨论述了拉扎斯菲尔德
(Lazarsfeld)的一篇经典文章(1949),60多年
之前,拉扎斯菲尔德在应对“社会科学不能告诉
我们不知道的任何事情”这一普遍的批评时,他
列举了对600000名参加第二次世界大战的士兵进
行调查后得到的一系列发现,例如,农村背景的
士兵在服役期间比城市背景的士兵有更好的精神
风貌。人们可能会倾向于认为所有的这些调查结
果都显而易见。但是让我们以这个结果为例:人
们倾向于认为,显而易见,农村出来的人更加适
应严苛的物理环境,因此也肯定能更好地适应军
旅生活。其他类似的结果同样显而易见。接着拉
扎斯菲尔德使出了他的杀手锏:其实所有的发现
都与最初呈现的陈述观点完全相反。例如,事实
上,来自城市的士兵比来自农村的士兵在服役期
间有更好的精神面貌。最后一部分的内容是为了
让人们认识到,他们也能非常容易地对相反的结
果作出解释。如果一开始就被告知了真实的结
果,人们可能解释说他们认为城市的人已经习惯
了拥挤的环境和等级化的权威。人们可能永远也
不会意识到他们编造对相反的结果的解释是如此
容易。
所以说,有时我们内隐的心理理论不容反
驳。我们将在第2章中看到为什么这种不可反驳
性造成了理论的失效。然而,即使我们的世俗观

念有一些特定用处,甚至是经验可证的,也会产
生问题。问题在于,心理学研究表明,在接受实
证检验后,许多关于行为的普遍文化信念都被证
明是错误的。
世俗观念(或称“常识”)出现谬误的例子俯
拾皆是。比如说,有一种说法是,学习好或读书
多的孩子都不擅长交际和体育。这个观点虽然错
得离谱,但在当今社会上极为流行。有大量证据
表明,与“常识”世俗观念正好相反,爱读书的人
和追求学术成就者与不读书者相比,有着更强健
的体魄,而且更常参与社交活动(Zill & Winglee,
1990)。再比如,学习成绩好的儿童比学习成绩
差的更容易被同伴接纳。读书多的人比不读书者
更愿意运动、慢跑、露营、远足、维修汽车等。
许多关于行为的世俗观念一经产生便生生不
息。例如,20世纪90年代风行于社会和学校的一
种世俗观念是,低自尊导致攻击行为。但实证研
究显示,攻击行为和低自尊并无关联
(Baumeister, Campbell, Krueger, & Vohs, 2003,
2005; Krueger, Vohs, & Baumerster, 2008)。相
反,攻击行为似乎往往与高自尊相关同样。与之
相似,过去20年间有一个非常流行的假说认为,
低自尊会导致学业不良的问题。事实上,自尊和
学业成绩之间的真实关系可能与教育工作者和家

长的假设恰恰相反:是在校成绩(以及生活的其
他方面)的优秀导致了高自尊,而非后者引起了
前者。
考虑另一个常见的世俗观念——“孩子会给
父母带来幸福”。如果我们考虑退休后孩子会带
来的好处,这个陈述在一定程度上可能是对的。
人们回首往昔时,的确会发现孩子带来的幸福。
问题在于,人们常常混淆回忆的观点和对真实事
件的体验。从有孩子的例子看,两个观点是十分
不同的。在年老时,觉得有个孩子确实令人开
心。但是,就连续性、继时性的快乐(与追溯性
的回忆相反)来说,孩子实际上让人的快乐减
少。现在有一系列文献采用所谓“经验取样
法”(experience-sample)观察人们在不同时刻的
幸福程度(Brooks, 2008; Gilbert, 2006; Gorchoff,
John, & Helson, 2008; Lyubomirsky & Boehm, 2010;
Wargo, 2007),研究发现了一系列的趋势,例如
结婚会增加幸福感。同时还发现,父母的幸福感
会随着第一个孩子的降生降低。当第一个孩子成
年时,幸福程度回弹一些,但随后又降低得更
多。只有当最小的孩子离家自立后,婚姻幸福感
才回归到没有孩子时的水平。
简言之,当世俗观念“孩子给父母带来幸
福”接受科学检验时,情况就变得复杂起来。只

有从回溯性的角度看,当孩子终于离开家时,我
们可以品味将孩子抚养成人的成就感时,“孩子
带来幸福”才是正确的。但这与这个世俗观念通
常所表述的意思大相径庭。它通常指抚养孩子会
让你立刻或在近期感到幸福。这就是世俗观念的
惊人谬误之处。
世俗智慧是错误的另一个例子就是对学生来
说常见的劝诫:做多选题时,即使对所选答案感
到不确定,也千万不要更改最初的答案。不仅大
多数学生认为他们不应该更改不确定题目的答
案,而且《GRE巴朗指南》(Barron’s Guide to
GRE)也建议“当你决定更改答案时要极其谨
慎,经验表明更改答案的学生都会改
错”(Kruger, Wirtz, & Miller, 2005, p.725)。这一
建议完全是错的,错误的原因是,世俗迷思有关
更改答案会降低一个人的分数的观点本身就大错
特错。实际研究表明,当对一个多选题的答案有
怀疑时,学生最好改变他们最初的选择(Kruger
et al., 2005; Lilienfeld, Lynn, Ruscio, & Beyerstein,
2010)。
世俗智慧大行其道的例子还有关于“我们只
用了10%的大脑功能”的世俗观念。虽然这一说法
完全缺乏认知神经的基础(Boyd, 2008; Lilienfeld
et al., 2010),但这一观念已流行了几十年,且

俨然已成为所谓的“心理学公理”——即并不正
确,但是已经重复了无数遍,以至于普通人认为
就是事实的心理学观点。同样,一些人相信有些
人是“左脑型”,有些人是“右脑型”;或者说人格
的某些特定方面受左脑控制,另一些方面受右脑
控制。尽管现代神经科学研究确实显示大脑中的
一些功能专门化,但是对左右脑观点的这些通俗
化说法却是胡说八道,尤其是在发现我们的大脑
以联合的方式工作的情况下(Lilienfeld et al.,
2010; Radford, 2011)。
世俗观念并不总对证据免疫。有时,当与之
矛盾的事实广为人知时,世俗心理学(“常识”)
也会改变。例如,几年前,一个广为流传的有关
儿童的俗语是“早熟者必早衰”(Fancher, 1985, p.
141)。这条俗语反映了“童年早熟与成年异常存
在关联”这一信念,这一信念得到了许多“小时了
了,大未必佳”的例子的支持。但在这件事上,
心理学证据证明上述俗语并不准确,这一结论已
被大众文化所吸收,所以你以后几乎不大会再听
到这个世俗“智慧”了。
最后这个例子是一个警告,提醒我们注意当
下的“常识”,因为不难看出,昨日的常识往往变
成今天的谬论。毕竟,常识就是“尽人皆知的知
识”,对吧?对。那么,人人都知道妇女不能投

票,对吧?非裔美国人不应该接受教育,对吧?
残障人士不该在社会里出现而应当被送到收容所
去,对吧?事实上,150年前,这些观念都是尽
人皆知的常识。当然,我们现在视这些过去的常
识为谬论,都是些以完全未经证实的假设为基础
的信念。但是,从这些例子中,我们可以看到心
理学在常识面前扮演的关键角色。常识总是基于
一些假设,而心理学对这些假设的经验基础进行
检验。正如我们之前看到的许多例子,有时候假
设得不到实证支持。这样的例子还有很多,通过
它们,我们可以看到,心理学扮演着一种世俗智
慧检验者的角色,常常难免和诸多根深蒂固的文
化信念发生冲突。心理学往往是“传递坏消息的
信使”[1],宣告原本为人们所接受的世俗观念再无
立足之地。这就不难理解,为什么许多人不仅无
视这些消息,还想消灭这些信使。
注释
[1]此处为“花剌子模信使”的典故,传说中亚古国花剌
子模有位国王,会奖赏带来好消息的信使,而处死带来坏消
息的信使。——译者注

心理学是一门年轻的科学
建立在实证基础上的心理学始终存在反对意
见。仅仅100多年前,剑桥大学还拒绝建立一个
心理物理学实验室,因为这样的一个主题研
究,“以把人类的灵魂放在天平上的方式侮辱了
宗教信仰”(Hearst, 1979, p. 7)。心理学致力于
证明其问题是实证可解的,这一战斗也是最近才
取得胜利。不过随着科学的进步,心理学家将涉
足越来越多的主题,这些主题涉及人类某些牢固
的信念,而很多都是可以通过实证方法验证的。
心理学家现在正研究的话题性主题包括道德推理
的发展、浪漫之爱、种族偏见的性质以及宗教信
仰的心理和社会决定因素等。童年期性行为的研
究最近引发了很多争议(Lilienfeld, 2010; Rind,
2008)。尽管有些人反对对这些领域进行实证调
查,但这些领域都取得了科学进展。
美国心理学会前任主席杰拉尔德·库彻
(Gerald Koocher, 2006)通过将他的一个首席专

栏命名为“心理科学并不政治正确”来提醒我们有
关心理学性质的问题。在文章中,他讨论了一些
研究主题,例如肥胖的原因、决定政治态度的因
素、宗教和性行为的关系、家庭暴力等。他指出
这些标题下的研究结果都是有争议的,但是“心
理科学不能被社会自由派或保守派制定的政治正
确的标准所挟持”(p. 5)。
作为一门学科,心理学总是处于一种两难境
地:一方面,一些人反对把心理学称为科学,否
认心理学家可以建立关于行为的实证理论;另一
方面,另一些人则由于惧怕心理学在某些行为领
域揭示的真相会威胁到他们的信仰,而反对心理
学家在这些领域进行研究。斯金纳学派的心理学
家就总是面对这类相互矛盾的指责。例如,有批
评者认为行为主义的强化法则不适用于人类行
为。同时,另一些批评者则担心人们会运用这些
规律去对人类进行严酷的、不人道的控制。因
此,行为主义者腹背受敌,一些批评者否认行为
主义者所发现的行为定律有用,而另一些批评者
则害怕这些定律被滥用!
上述现象的产生主要是由于年轻的心理科学
刚刚开始揭示行为方面的一些事实,而在过去,
这些问题总是游离于研究之外的。它的青涩多多
少少也解释了为什么许多人总是对这一学科产生

误解。但无论如何,在过去的40年里,心理学已
经在我们称之为科学的这个相互关联的知识体系
中站稳了脚跟。认识不到这一点,就会对心理学
产生各种各样的误解。

小结
心理学是一个主题非常广泛,但又相对松散
的学科,它包含一些通常不被归入同一概念的众
多研究主题。然而,它们都使用科学方法来理解
行为,从而实现了学科的统一。科学方法绝非是
指一套生硬的规则,而是指一些非常普遍的原
则。最重要的三点是:(1)科学采用系统的实
证主义的研究方法;(2)它以可公开验证的知
识为研究对象;(3)它研究实证可解的问题,
并产生可检验的理论(第2章的主要内容)。构
成系统实证主义基础的结构化及可控制的观察是
本书随后几个章节的主题。科学通过同行评审等
程序和重复验证等机制来保证知识的公共性。
心理学是一门新兴的科学,因而经常会和世
俗智慧相冲突。这种冲突是任何新兴学科都会遇
到的,了解这种冲突有助于我们理解为什么有人
反对将心理学视为一门科学,并对心理学持敌意
态度。同时,与世俗常识之间的碰撞,也令心理

学成为一门激动人心的学科。很多人进入这一领
域正是因为它提供了一个机会,让人们能够检验
那些被毫无争议地接受了数百年的“常识”。

Chapter 2
可证伪性:如何挫败头脑中的小
精灵

1793年,一场严重的流行病——黄热病袭击
了费城。当时,这座城市里有一位顶尖的医生名
叫本杰明·拉什(Benjamin Rush),他是美国《独
立宣言》的签署人之一。在灾难过程中,拉什是
少数几位确实治疗了几千例黄热病的医生。拉什
信奉一种医学理论,认为黄热病必须用大量放血
的方法治疗(用手术刀或水蛭吸血的方法使血液
离开身体)。他为许多病人实施了这种疗法,当
他自己感染这种疾病的时候,他也如法炮制。评
论家指责他的治疗方法甚至比疾病本身更危险。
然而,随着疾病的流行,拉什对他的疗法却更加
自信了,即便曾有几个病人死去。这是为什么
呢?

有人这么总结拉什的态度:“一方面坚信自
己的理论是正确的,另一方面又缺乏有效的方法
对治疗效果进行系统研究,因此他将每个好转的
病例都归为治疗方法的功效,而将每个死亡的病
例都归为病情的严重性。”(Eisenberg, 1977, p.
1106)换句话说,如果病人情况好转,就被作为
放血疗法有效的证据;如果病人死掉了,就被拉
什解释为病人已经病入膏肓,无药可救。我们现
在知道为什么对拉什的批评是正确的了:他的治
疗方法和黄热病本身一样危险。在本章中,我们
将要讨论拉什错在哪里。他的错误为阐明科学思
维中最重要的一项原则提供了样本,而这一原则
在评估心理学理论时尤其有用。
本章中,我们关注在第1章中已经讨论过的
科学的第三个基本特征:科学只研究可解的问
题。科学家们所说的“可解的问题”,通常是指可
检验的理论。科学家要确认某个理论是不是可检
验的,采取的方法就是确保该理论是可证伪的,
也就是说,理论对应着自然世界中的真实事件。
接下来,我们就要看一看为何所谓的可证伪性标
准在心理学中如此重要。

理论和可证伪性标准
本杰明·拉什在评估其疗法的效果时跌入了一
个致命的陷阱。他的评价方法根本就不可能让人
得出其治疗方法无效的结论。如果说,病人的恢
复是对他治疗方法有效性的肯定(对其医疗理论
的肯定),那只有当病人的死亡是对其治疗方法
的否定时才算公平。但事实上,他却把这种否定
合理化了。拉什解释证据的方式,违反了科学理
论建构和检验应遵循的最重要原则之一:他令自
己的理论不能被证伪。
科学理论的表述应该遵循这样的原则——从
中得出的预测有可能被表明是错误的。因此,对
某理论的新证据进行评价,必须使新的数据具有
证伪该理论的可能性。这项原则通常被称为“可
证伪性标准”。一位叫卡尔·波普尔(Karl
Popper)的哲学家一直致力于强调可证伪性标准
在科学进程中的重要作用,现在他的文章仍被从
事科研工作的科学家们广泛阅读。

可证伪性标准主张,一项理论如果有用,它
所作出的预测必须是明确的,理论必须两面兼
顾,也可以说,这项理论在告诉我们哪些事情会
发生的同时,应该指出哪些事情不会发生。如果
不会发生的事情确实发生了,我们就得到了一个
明确的信号——这项理论有问题:它可能需要修
正,或者我们需要去寻找一个全新的理论。不管
哪种方式,我们将最终有一个更接近真理的理
论。相反,如果一项理论预测包括了所有可能观
察到的数据,那么它将永远不能被修正,同时我
们将被禁锢在当前的思维方式中,失去了取得进
步的可能。这就是说,一项成功的理论并不是可
以用来解释所有可能的结果,因为这样的理论本
身就丧失了任何预测能力。
在这本书的余下部分,我们会经常涉及理论
的评估,因此我们必须澄清一个关于理论的常见
误解。这个误解体现为我们常说的一句
话:“哦,这只不过是一种理论。”这句话代表了
外行人使用“理论”这个词时通常所指的意思:一
项未经证实的假设,一个纯粹的猜想或直觉。这
意味着一个理论与其他理论并无优劣之分。“理
论”这个词在科学上绝对不是这么用的。当科学
家说到“理论”的时候,他们指的不是未经验证的
猜想。

科学上的理论是一组具有内在联系的概念,
它们能对一组数据作出解释,并对未来实验的结
果作出预测。假设是从理论中产生的具体预测
(理论则更加普遍和全面)。目前可行的理论是
那些产生了一些假设,并且其中许多已经得到了
验证的理论。因此这种理论的理论结构与大量的
实证观察相一致。然而,当观察数据开始与理论
中提出的假说相矛盾的时候,科学家们会尝试构
建一个能为数据提供更好解释的新理论(或者在
更通常的情况下,只是修正已有的理论)。因
此,目前在科学范畴内所讨论的,都是在一定程
度上已经被证实了的、所作出的预测并没有与现
有的数据相矛盾的理论。它们并非纯粹的猜想和
直觉。
外行人和科学家们使用“理论”这个词时的这
种差异,经常会被一些试图将神创论纳入公立学
校教育的虔诚的正统基督教徒所利用(Miller,
2008; Scott, 2005)。他们的论点通常是“进化论
毕竟只是理论”。这种观点试图借用外行人对“理
论”术语的用法,蓄意将理论歪曲为“只是一个猜
想”。然而,通过自然选择的进化理论不是外行
人所理解的“理论”(相反,在外行人的理解中,
它应被称之为“事实”,见Randall, 2005),而是
一个科学意义上的理论,是由一系列庞大而多样
的数据支持的结论(Dawkins, 2010; Shermer,

2006; Wilson, 2007)。它并不等同于其他任何猜
想,不是一个纯粹的猜测。相反,它与从属于其
他学科的知识密切相关,这些学科包括地质学、
物理学、化学以及生物学的各个分支。著名的生
物学家西欧都萨斯·杜赞斯基(Theodosius
Dobzhansky, 1973)在他的一篇题为《生物学中除
了进化论以外,别无他物》(Nothing in Biology
Makes Sense Except in the Light of Evolution)的著
名文章里就阐述了这一观点。

敲门节奏理论
下面假设的例子展示了可证伪性标准是如何
起作用的。一个学生在敲我的门。跟我同一办公
室的同事有一套“不同的人以不同的节奏敲门”的
理论。在我开门之前,我的同事预言门后是一位
女性。我打开门,这个学生确实是女性。事后我
告诉同事,他的表现令我惊叹,但这种惊叹程度
非常有限,因为即使没有他所谓的“敲门节奏理
论”,他也有50%的正确几率——实际上这一概率
要更高一些,因为在大多数校园里,女性都比男
性多。他说他的预测能高于随机水平。另一个人
来敲门,我的同事预测说,这是个男性,而且不
到22岁。我打开门,果然是个男生,而且我知道

他刚从中学毕业。我承认我有点被震撼了,因为
我所在的大学有相当数量的学生是大于22岁的。
当然,我仍然坚持说,校园里年轻的男性相当普
遍。见我如此难以被说服,我的同事提出做最后
一次测试。在下一个人敲门之后,我的同事预
测:女性,30岁,5英尺[1]2英寸[2]高,左手拿书
和挎包,用右手敲的门。打开门后,事实完全证
明了预测,对此我的反应截然不同了。我不得不
说,如果我的同事不是使用诡计事先安排这些人
出现在我门口的话,我现在的确非常震惊。
为什么我的反应会不同呢?为什么我同事的
三次预言会让我产生三种不同的从“那又怎么
样”到“太不可思议了”的反应?答案与预测的具体
性和精确性有关。越精确的预测在被证实的时候
会给我们越大的触动。要注意,不管怎样,精确
性的变化和可证伪性直接关联。预测越具体和精
确,有可能证伪它的观测现象就越多。例如,有
很多不是30岁和5英尺2英寸高的女性。请注意这
里暗含的信息:从我截然不同的反应可以看出,
一个能够最大限度地将不可能发生的事件预测出
来的理论最容易令我折服。
好的理论作出的预测总是会显示自己是可证
伪的。坏的理论不会以这种方式把自己置于危险
的境地,它们作出的预测是如此笼统,以至于总

会被证明是正确的(例如,下一个来敲我门的人
会是100岁以下),或者,这些预测会采用一种
能免于被证伪的措辞方式(如本杰明·拉什的例
子)。事实上,当一种理论被置于“不可被证
伪”的保护下,那么可以说它已经不再是科学
了。事实上,哲学家卡尔·波普尔正是由于试图界
定科学和非科学的区分标准,才会如此强调证伪
原则的重要性。这里的讨论和第1章中我们有关
弗洛伊德的讨论,甚至与心理学之间都有直接的
联系。

弗洛伊德与可证伪性
在20世纪最初的几十年,波普尔一直在探
寻,为何一些科学理论似乎导致知识的进步,而
其他一些则导致智力停滞(Hacohen, 2000)。例
如,爱因斯坦的广义相对论引发了一系列惊人的
发现(例如,从一个遥远的恒星发出的光线经过
太阳附近时发生弯曲),恰恰是因为它是这样建
构预测的:许多事件或现象一旦被证实与之相矛
盾,就可以证伪该理论。
波普尔指出,一些使知识停滞的理论却并非
如此,并以弗洛伊德的精神分析法作为例子。弗

洛伊德的理论使用一个复杂的概念结构,在事后
解释人类行为,但并不作事前的预测。简而言
之,弗洛伊德的理论可以解释一切,但是波普尔
认为,也正是这个属性使得它在科学上毫无用
处。它不作具体的预测。精神分析理论的拥护者
花费大量的时间和精力试图用他们的理论解释人
类所有已知的活动——从个人的怪癖行为到广泛
的社会现象,但他们在使这个理论成功地成为事
后解释的丰厚资源时,也剥夺了其所有的科学实
用性。如今,弗洛伊德的精神分析理论在激发文
学想象力方面的作用比在当代心理学中扮演的角
色更重要。它在心理学中的地位日益下滑,部分
原因就是未能满足可证伪性标准(Wade & Tavris,
2008)。
这种不可证伪理论的存在会导致实际的危
害。例如,对于孤独症(部分基因紊乱所致的疾
病)成因的解释就曾被精神分析的解释带入了死
胡同。受到精神分析学派的影响,心理学家布鲁
诺·贝特海姆(Bruno Bettelheim)让“冰柜母亲”这
个如今已被证伪的概念在当时广为流传,认
为“造成婴儿时期孤独症的原因是父母不希望孩
子存在”(Offit, 2008, p.3)。像这样的观念不仅
有破坏作用,还阻碍了孤独症的研究。
作为另一个例子,回想一下抽动性秽语症的

历史。这是一种以身体抽搐和痉挛为特征的紊
乱,并伴有言语症状,如嘟囔、吠叫、模仿言语
(无意识地重复他人的话)和秽语(强迫性重复
淫秽词语)。抽动性秽语症是一种器质性的中枢
神经系统紊乱,并已经成功地被药物治疗所攻克
(Scahill et al., 2006; Simth, Polloway, Patton, &
Dowdy, 2008)。纵观历史,抽动性秽语症患者一
直遭受着迫害,早期被宗教统治者视为妖魔,近
代又被认为是鬼怪附体,要被强制驱魔(Hines,
2003)。更重要的是,在1921至1955年之间,对
这种病的解释及疗法一直被精神分析学派的概念
体系所把持,这在很大程度上阻碍了人们对此病
成因及治疗的理解(见Kushner, 1999)。有关这
种病症的不可证伪的精神分析解释层出不穷。这
些似是而非的解释所造就的概念泥潭蒙蔽了这一
病症的实质,也阻碍了对其进一步的科学探究。
例如,有一位作者曾经这样写道:
(抽动性秽语症是)精神分析导致脑部
疾病研究发生倒退的典型例子。勒·图雷特
(La Tourette)将疾病归因于大脑的退行
性变化过程。而在20世纪最初的几十年,由
于弗洛伊德理论的盛行,对这种病的关注偏
离了大脑……这一倒退的结果使病人往往被
转到精神科医生(通常是精神分析学派的医
生)而非神经科医生那里,因此没有接受生

理检查和研究(Thornton, 1986, p.
210)。
夏皮罗等人(Shapiro, Bruun, & Sweet,
1978)提到,一位精神分析师认为,他的病
人“不愿意放弃抽动,因为这成了她性快感的源
泉和潜意识性欲的表达”;另一位精神分析师则
认为抽搐“等同于手淫……与生殖器快感相联系
的力大多转移到了身体的其他部位”;第三位认
为抽搐是一种“肛门施虐的迁移症状”;第四位认
为,抽动性秽语症的患者具有“强迫型人格以及
自恋倾向”,病人的抽动“代表了一种情感症状,
对想表达情感的压抑性防御”。
事实上,这类例子不胜枚举,在他们无知自
大的过度自信中尤为典型。发展心理学家杰罗姆·
卡根(Jerome Kagan, 2006)告诉我们:“弗洛伊
德的弟子桑德尔·费伦齐(Sandor Ferenczi),其
本人从未见过抽动性秽语症病人,但是却犯下了
同样严重的错误,他曾写过,抽动性秽语症病人
的频率性的面部抽搐是由于对手淫的压
抑。”(p.179)
夏皮罗等人(1978)对这类理论现状的总
结,很好地说明了忽视可证伪性标准的有害影
响:

精神分析这种理论化的方式简直面面俱
到。抽搐是迁移性的症状而非歇斯底里症、
肛门的而又是性欲的、受意志控制的而又是
强迫性的、器质性病变同时又与原始心理动
力有关……这些心理标签、诊断和治疗被不
幸而且是以一种毫不谦卑、相当武断、伤害
巨大的方式强加在病人及其家属身上。因为
其随后的广泛影响,这些观点为对此病症的
认识和诊治造成了极大的障碍(pp. 39-42,
50, 63)。
当研究人员承认精神分析的“解释”对治疗该
疾病毫无用处的时候,对抽动性秽语症的认识和
治疗才开始获得进展。那些毫无用处的解释是诱
人的,因为它们似乎能对事情进行解释。事实
上,它们都是在事后对所有事情作出解释的。然
而,它们提供的解释不过是制造了理解的幻觉。
由于总试图在事后解释一切,它们也就堵死了前
进的大门。只有当一种理论并不预测所有事情,
而是提出具体的预测——提前告诉我们哪个特定
的情形会出现时,该理论才会出现进步。当然,
从这样的理论推导出的预测可能是错误的,但这
是优势,而非缺点。

小精灵

如果人们能够从所研究的问题里跳出来,尤
其是人们若能以史为鉴(如本杰明·拉什的例子)
的话,就不难识别出那些不能证伪的概念体系。
当其例证明显是编造的时候,也很容易察觉其不
可证伪性。举例来说,大家还不知道,我已经发
现有一种大脑机制在控制行为,你很快就会在随
处可见的八卦杂志上看到这个发现。我发现在大
脑左半球的语言区附近住着两个小精灵,它们有
能力控制大脑许多区域中的电化学过程。而且,
长话短说,它们基本上控制了一切事情。但是,
有一个问题阻止我们看到它们,那就是小精灵有
能力发现任何对大脑的侵入(外科手术、X光
等),一旦觉察到外界的探测,它们就会消失
(我忘记说了,它们具备隐身能力)。
毫无疑问,我在这里是用一个更适合小学生
的例子来侮辱你的智慧。很明显,这个例子是我
捏造的,但我对小精灵的假设永远无法被证实是
错误的。不妨考虑一下。作为心理学导论的讲师
和公开演讲者,我经常被问到,为什么不讲授在
过去几年里在超感官知觉(extrasensong
perception, ESP)和通灵学方面取得的那些惊人
的新发现。我不得不告诉这些提问者,他们所获
悉的大多数相关信息,无疑都是来自于大众媒

体,而非科学界所承认的信息来源。事实上,一
些科学家曾关注过这类说法,但没能够重复这些
发现。我要提醒各位读者,要将一个研究成果认
定为确定的科学事实,可重复性是至关重要的,
尤其是当研究结果与以前的数据或现有的理论相
矛盾的时候。
我甚至可以坦率地说,许多科学家对ESP研
究已经失去了耐心。原因当然与此领域充斥着欺
诈、江湖骗术和媒体炒作的现象有关,但令科学
界觉醒的更重要的原因是马丁·加德纳(Martin
Gardner, 1972)所谓的“ESP研究的22条军规”。其
运作方式如下:一名“信奉者”(在开始调查之前
就相信ESP现象存在的人)声称已在实验室证明
了ESP。一名“怀疑者”(质疑ESP存在的人)被邀
请证实这种现象。通常,在观察实验情境之后,
怀疑者会要求信奉者进行更多的控制(我们会在
第6章中讨论这种类型的控制),虽然这些要求
有时候会被拒绝,但通常善意的信奉者们会同意
他们的要求。当加入了实验控制之后,这种现象
就不再出现了(Farha, 2007; Kelly, 2005; Milton &
Wiseman, 1999; Park, 2008;Wiseman, 2011)。怀疑
者会对这种失败作出正确的解释——早先对这个
现象的证实是由于缺乏足够的实验控制,因此结
论不能被接受。但他们往往吃惊地发现,信奉者
并不承认早先的证明是无效的。相反,他们搬出

超感知的“22条军规”:他们坚称,心理能量是很
敏感的、微妙的,并极易受到影响。怀疑者
的“负面感应”是瓦解这一“超感官能量”的罪魁祸
首。信奉者认为,怀疑者的“负面气场”被移开
后,这种心理能量无疑将会回归。
这种对无法在实验室中证实ESP的解释方
式,在逻辑上与我编造的小精灵的故事相似。
ESP的运作就像小精灵一样。只要你不侵入性地
仔细观察它,它就在那儿。如果你观察它了,它
就不见了。如果我们接受这种解释,那么向怀疑
者证明这一现象就变得不再可能。这种现象只为
信奉者现身。当然,这种说法在科学领域是不能
接受的。我们没有磁力物理学家和非磁力物理学
家之分(即磁场只对前者存在)。以这种方式解
释ESP的实验,使得ESP的假设变得像小精灵的
假设一样不可证伪。正是这种解释方式,将ESP
排除在了科学殿堂之外。

不是所有的证实都等价
可证伪性原则对于我们如何看待一个理论的
证实过程具有重要的意义。许多人认为,一个好
的科学理论就是被多次证实的理论。他们假设,

被实的次数是对理论进行评价的关键。但是,可
证伪性原则意指理论被证实的次数并不是最重要
的因素。原因在于,正如“敲门节奏理论”所展示
的那样,并不是所有的证实都是等价的。证实能
否令人信服,取决于预测在何种程度上将自己暴
露在可能被证伪的情境下。一个非常具体的、可
能被证伪的预测(例如,一位女士,30岁,5英
尺2英寸高,左手拿书和挎包,用右手敲门),
比20个不可证伪的预测(例如,一个小于100岁
的人)拥有更强的说服力。
因此,我们不能仅关注理论被证实的数量,
更要关注验证本身的质量。将可证伪性作为一种
评价标准,就可以使那些使用研究结果的人抵制
不科学的、全能理论的诱惑。这种全能理论会不
可避免地妨碍我们对世界和人类本质进行更深入
的探索。事实上,这种理论的死角也正是最魅惑
人的地方,因为它们永远不能被证伪。在纷繁多
变的现代世界中,这种理论千年不变。
波普尔经常指出:“这些(不可证伪的)理
论拥有巨大的心理吸引力,其秘密在于它们能够
解释一切事情。预先知道无论什么事情发生,你
都能理解它,不仅给你智力上的掌控感,而且,
更重要的是,让你拥有应对这个世界所需的安全
感。”(Magee, 1985, p. 43)但是,这种安全感的

获得并不是科学的目标,因为对这种安全感的追
求是以知识发展的停滞为代价的。科学是一套不
断挑战原有信念的机制,在这种机制里,原有信
念以一种能够被证伪的方式接受实证检验。这一
特点往往使科学(尤其是心理学)与所谓的世俗
智慧或者常识直接发生冲突(正如我们在第1章
中所讨论的)。

可证伪性和世俗智慧
心理学威胁到世俗智慧所提供的安逸感,因
为作为一门科学,它不能只提供无法被反驳的解
释。心理学的目标是对各种行为理论逐一进行实
证检验和筛选。某些世俗智慧表述得很清晰,经
得起实证检验,这当然是心理学所欢迎的,而且
其中许多已经被纳入了心理学理论。然而,心理
学并不追求那类事后能解释一切,但事先无法作
出任何预测的理论,不追求这种解释系统所带来
的安逸感。它不接受那些被设计得永不可变、并
代代相传的世俗智慧体系。试图向学生和公众隐
瞒这一点无疑是自毁长城。不幸的是,一些心理
学指导教师和普及者觉察到了心理学对世俗智慧
的威胁给一些人造成的困扰,于是他们有时会试
图通过传递错误信息来安抚这种情绪,如“你会

学到一些有趣的东西,但别担心,心理学不会挑
战那些你深信不疑的观点”。这是一个错误,并
且会对“什么是科学”和“什么是心理学”造成混
乱。心理学建构了有关于性行为、智力、犯罪、
经济行为及其他诸多人们感受强烈的主题。如果
对上述这些主题的调查没有发现一些令某些人感
到颠覆的事情,这才奇怪呢!
科学寻求概念上的变化。科学家试图描绘世
界的真实图景,而此图景可能与我们的固有信念
正好相反。现代思潮中有一种危险的趋向——认
为应避免让一般大众知道世界的真正本质,一种
无知的面纱是必要的,以防公众面对真相时手足
无措。心理学与其他科学一样,拒绝向人类隐瞒
真相。
此外,当我们被那些对人类行为有误解的人
们所包围的时候,大家都会蒙受损失。公众对于
教育、犯罪、健康、生产力、儿童福利和许多其
他重要问题的态度塑造了我们的世界。如果这些
态度源于错误的行为理论,那么我们大家都会受
到伤害。

承认错误的自由

科学家们发现,可证伪性原则的一个最具解
放意义和最有用的启示是:在科学上,犯错并不
是罪过。哲学家丹尼尔·丹尼特(Daniel Dennett,
1995)曾说过,科学的本质就是“在公众面前犯
错——在众目睽睽下犯错,以期他人能够帮助其
修正这些错误”(p. 380)。当数据与理论不符
时,通过对理论进行不断地修正,科学家们最终
共同构建起能更好地反映世界本质的理论。
事实上,如果我们能够在日常生活中使用可
证伪性原则的话,我们的生活品质将会大大改
善。这就是为什么我在本节的第一句话中使
用“具有解放意义”这个词的原因。它包含着一种
个人化的期许,即此处产生的理念能够同时对科
学之外的领域有所启示。如果我们能够理解这一
切,当我们的信仰与观察到的事实相冲突时,我
们最好是调整信仰,而不是否认事实和坚持错误
的想法,这样我们将会很少遇到一些个人和社会
问题。
当你与某人激烈地争论的时候——也许就是
当你给出一个有力的反击来捍卫你的观点的时候
——有多少次你会突然意识到你搞错了某个关键
事实或论据?这时你会怎么做?你会收回前面的
话,并向别人承认错误,同时承认别人的解释现
在看起来比你的更合理吗?或许不会。如果你和

我们中的大多数人一样,那么你一定会采用“无
限合理化”的策略,即没完没了地寻找一些理由
为自己先前的错误辩解。你试图在不承认失败的
情况下使自己从争论中全身而退。你最不可能做
的就是承认自己错了。这样的话,你和争论对手
都会更加疑惑:到底哪一种信念更接近真理?如
果争论不能成为公共性的(如在科学中那样),
如果正确和错误的信念以同样激烈的方式争辩,
如果争论的结果不能得到正确的反馈(如本
例),那就没有更可靠的机制使信念与现实相吻
合了。这就是为什么那么多私人和公开的对话令
人困惑,为什么相比所谓的常识或世俗智慧,心
理科学在解释人类行为的原因方面更加可靠。
如果理解了我们的信念在历史上多么地因事
而异,可能就会发现我们在证据面前是多么容易
改变自己的信念。也就是说,信念的改变与否仅
仅取决于他们成长时在某地某时发生的事件的多
少。然而调查显示,大多数人对这种情况不够重
视。在我自己的实验室中,我们对设计来评定人
们鉴别信念的历史可变性的能力问卷中的数据进
行分析。以问卷中的一个项目为例,被试必须对
于“即使我周围环境(家庭、邻居、学校)与现
实情况不同,我也会有与现在相同的宗教思
想”这一陈述表达“非常、中等地或些许地同意或
者不同意”。宗教问题是信念随环境变化的典型

案例(欧洲、美国人信奉基督教;非洲和中东人
信奉伊斯兰教;印度信奉印度教等)。虽然如
此,我和我的同事在几个调查中发现,大约40%
到55%的大学生会认为他们的宗教思想无论如何
也不会随着他们的历史环境(父母、国家、教
育)而改变。
证伪态度有益于科学本身的原因是,科学通
过排除不正确的假设而非集中精力研究完美的理
论而进步,这种态度在研究一个问题的初期尤为
重要。事实上,生活中诸多领域的情况都是如
此。通常定位最正确的表现方式是很困难的,但
是聚焦表现的错误却相对容易。评论家尼尔·波兹
曼(Neil Postman, 1988)指出,医生很难去定
义“完全健康”,但却很擅长发现疾病。同样,律
师能够轻易判断不公正,却很难定义“完全公
正”。证伪态度对于科学家来说很有用也正是基
于这一原因。尤其在研究问题的早期,研究的焦
点在什么是错误的——排除不正确的信念——对
科学家来说是很有成效的方法。
在科学过程中犯错是正常的,对于科学进步
来说,最大的危险在于我们人类极力避免将自己
的固有信念暴露在可能被证明是错误的环境中的
倾向,许多科学家已经意识到了这一观点的重要
性。科学家们必须避免这种倾向,诺贝尔奖得主

彼得·米德瓦(Peter Medawar, 1979)认为科学家
应当牢记:一个假设在何种程度上被确信为正
确,实际上与其是否为真无关(p. 39; 原文为意
大利语)。
可以通过这样一种途径来理解米德瓦的话。
喜剧演员斯蒂芬·科尔伯特(Stephen Colbert)在
其2005年12月17号的表演中,创造了术语“感实
性”。感实性是指“内心感到真实,但是没有证据
支持”(Manjoo, 2008, p.189)。米德瓦说的意思
是,科学拒绝感实性。这常常使科学在现代社会
中成为异类,因为现代社会中,感实性比以往更
为普遍。
心理学界许多最具声望的科学家都遵循米德
瓦的建议——“一个假设在何种程度上被确信为
正确,实际上与其是否为真无关。”在一篇报道
实验心理学家罗伯特·克诺德(Robert Crowder)
职业生涯的文章中,引述了他的一位同事马扎林·
巴纳吉(Mahzarin Banaji)的话:“他是我认识的
最不维护自己理论的科学家。如果你发现一种方
法证明他的理论有漏洞,或者他的实验发现有局
限性或有缺陷,他会非常高兴,并会和你一起计
划如何推翻该理论。”(Azar, 1999, p. 18)艾泽
(Azar, 1999)描述了克诺德如何提出了一个叫
作“前分类听觉存储器”的记忆成分理论,然后又

仔细地设计了一个实验研究证伪了自己的模型。
物理学家杰罗米·格鲁普曼(Jerome Groopman,
2009)描述了证伪态度在医疗诊断中是多么实用
和有效:“所以医生学会去质疑他提取的病历数
据的有效性……最有启发性的时刻是你被证实是
错误的,并且意识到你相信自己知道的比实际的
多,其实是忽略了能够否认你的推诊或是未能考
虑到病人患有不止一种疾病的关键信
息。”(p.26)
早于达尔文数百年前,亚里士多德曾经说
过:“受过教育的标志是可以去思考一种思想,
而不去接受它。”更有意思的是,经济学家约翰·
梅纳德·凯恩斯在经济大萧条期间阐明了证伪态
度,他批判亚里士多德道:“事实改变,我就会
改变我的观念。你能吗,先生?”(Malabre,
1994, p.220)
但是,要让科学发挥作用,并不需要每位从
事科学工作的科学家都具备证伪的态度。科学那
种揭示世界真知的独特力量,并不产生于科学家
们独特的德行(即他们是完全客观的,他们在解
释研究结果时从来不带偏见等)。实际上,这种
力量的产生是因为会犯错的科学家们身处一个证
实与平衡的程序中。在这个程序中,总会有其他
科学家提出批评并发现他们同行的错误。哲学家

丹尼尔·丹尼特提出过相同的论点:“不是每位科
学家都必须表现出罗伯特·克诺德的客观性。”丹
尼特强调“科学家和其他任何人一样容易犯错,
但认识到他们及其所属团体的犯错根源之后,他
们设计出精巧的系统来约束自己,努力防止自身
弱点和偏见影响自己的研究结果。”(p. 42)心
理学家雷·尼克尔森(Ray Nickerson, 1998)以一
种更为幽默的方式道出了相同的观点:“科学家
们的虚荣心实际上在科学进程中起着作用,“科
学家对自己的想法抱有的批判性态度并没有在很
大程度上导致科学的成功……更真实的情况是,
每个科学家都积极地想要证明某些科学家所持有
的观点是错误的。”(p. 42)科学知识的力量并
不是来自于科学家的德行,而是源于他们不断交
叉检验彼此的知识和结论的这一社会过程。

想法不值钱
先前关于检验世俗智慧的讨论,将我们引向
了可证伪性原则的另一个有趣推论:想法不值
钱。说得更准确些,我们的意思是某些类别的想
法不值钱。生物学家和科学作家史蒂芬·古尔德
(Stephen J. Gould, 1987)对此有所阐述:

15年的月刊专栏写作生涯,让我收到各
个科学领域非专业读者的海量来信……我发
现一个常见的、同时是压倒性的错误观点。
人们会告诉我他们提出了一项革命性的理
论,它会拓展科学的边界。这些理论通常以
单倍行距打印在几张纸上,内容通常是对最
深层的终极问题的猜测——什么是生命的本
质?宇宙的起源?时间的起点?但是,这些
想法不值钱。任何智力正常的人都能在早饭
前想出几个这样的念头。科学家们自己也很
容易就能想出来。但我们不这样做(或者
说,我们只让它们留在自己脑子里),因为
我们不能找到方法来验证它们以决定它们的
对错。一个既不能被证实也不能被证伪的可
爱想法,对科学来说又有什么用呢?
古尔德对最后一个问题的回答是:“没
用。”古尔德这里所说的廉价想法正是我们早先
在对卡尔·波普尔观点的讨论中提到的那些:包罗
万象、复杂、“模糊”、能够用来解释一切的宏大
理论——这种理论的建构更多是为了提供情感支
持,因为它们没打算被改变或抛弃。古尔德告诉
我们,这种理论对于科学目标是无用的,无论它
们多么有抚慰功能。科学是创造性的过程,但是
这种创造性需要让概念结构符合实验数据。这并
不容易做到。那些如实解释真实世界的想法一点

儿也不廉价。也许这就是为什么好的科学理论很
难提出、而不可证伪的伪科学信仰体系泛滥的原
因,因为后者很容易建构。
科学理论与世界紧密联系。它们是可证伪
的,并能作出明确具体的预测。事实上,形成真
实的、科学真正可以解释的理论是一项困难的任
务。但是,理解科学运作的一般逻辑并没有那么
困难。事实上,现在已经出版了大量专为儿童撰
写的关于科学思维逻辑的书籍(Binga, 2009;
Bower, 2009; Dawkings, 2012; Epstein, 2008;
Swanson, 2001, 2004)。
注释
[1]1英尺≈0.305米。——译者注
[2]1英寸=2.54厘米。——译者注

科学中的错误:逼近真理
在解释可证伪性原则的过程中,我们已经勾
勒出科学进步的简单模式:提出理论、从中推导
出假设,然后让假设接受各种技术或方法的检验
——我们将在本书余下的部分讨论这些技术。如
果假设通过了某些实验的检验,该理论就得到了
某种程度的确证;如果假设被实验证伪,这个理
论就得做出某种程度的改变,或者被一个新理论
所取代。
当然,虽然科学上的知识是暂时性的,由理
论得出的假设可能是错误的,但这并不是说所有
的一切都要被拿来检验一番。科学中有很多理论
已经被确认过无数次,它们被称为“公理”,因为
它们几乎不可能被未来的实验推翻。我们不大可
能在某一天发现,血液不是循环的,或者地球并
没有在环日轨道上。这些众所周知的事实并不是
我们一直在讨论的假说。它们也不是科学家们的
兴趣关注点,因为它们已经是确定无疑的。科学

家只对已有知识范围之外的问题感兴趣。对于确
定无疑的事实,他们毫无兴趣。
科学实践的这一面——科学家侧重于已知事
实的前沿,而忽视那些已经被充分证实的问题
(所谓的公理)——对大众来说很难理解。科学
家们似乎总是更强调未知的事物而非已知事物。
这千真万确,而且科学家有很好的理由这么做。
为了推进知识的进步,科学家们必须一直身处已
知的前沿。当然,这里是很多事情都不确定的地
方。但科学进步正是通过这个过程来实现的,即
试图在已知的前沿减少不确定性。这种特点常常
使得科学家被公众视为“没谱的”。但这只是表面
现象,科学家们只是对知识的前沿不确定——这
使我们对于事物的理解不断加深。科学家们不怀
疑那些被很多研究重复证实的事实。
同样需要强调的是,当科学家通过观察法证
伪一个理论或用一个新理论代替旧理论的时候,
并不意味着他们要将先前用以建立旧理论的事实
全都扔到一边(我们会在第8章展开讨论这个话
题)。相反,新理论应该能够解释所有旧理论能
解释的事实,还能够解释旧理论不能解释的事
实。理论被证伪并不意味着科学家非得建构一个
全新的理论。复杂的理论通常是大体正确而非完
全正确的,大体正确的判断可能更接近事实的真

相(Radcliffe Richard, 2000)。
科普作家伊萨克·阿西莫夫(Isaac Asimov)
在一篇题为《错误的相对性》(The Relativity of
Wrong, 1989)的文章中很好地说明了理论修正的
过程,文中谈到我们对地球形状的理解是如何完
善的。他首先提醒我们,不要以为“地球是平
的”这一古老信念是愚蠢的,在平原上(大部分
有文字的人类文明都发源于平原),地球看上去
相当平坦。阿西莫夫要求我们试着对不同的理论
进行定量的比较,看结果会告诉我们什么。首
先,我们能够将不同理论表述为它们预测地球表
面每公里曲率的大小。“地平理论”会说每公里的
曲率为0。现在我们都知道,这种理论是错误
的。但从某种意义上说,它又很接近真理。正如
阿西莫夫(1989)所说:
亚里士多德之后的一个世纪,古希腊的
另一位哲学家埃拉托塞尼斯
(Eratosthenes)指出,太阳在不同纬度上
投射不同长度的影子(如果地球是平面的,
所有的影子都应该一样长)。根据影子长度
的不同,他计算出地球的周长为2.5万英
里,那么这个球体曲率是0.000126度/英
里。正如你所见,这个数值非常接近0……
这从0到0.000126的差别解释了为何我们用

了如此长的时间,才放弃“地球是平的”这
一观念,并转而相信地球是球状的。提醒你
一下,即使是像0~ 0.000126之间这样细小
的差别也是至关重要的。失之毫厘,谬以千
里。如果这点小差别没有被考虑到,如果地
球被认为是一个平面,而不是一个球,那么
我们将无法精确地绘制地球上大面积区域的
地图(pp. 39-40)。
当然,科学并没有止步于“地球是球体”这一
理论。我们早先讨论过,科学家们一直在尝试尽
量改进他们的理论,并挑战当前知识的局限。例
如,牛顿的引力理论预言地球并不是完美的球
形,这个预言确实被证实了。现在已经证明,地
球在赤道附近略微凸起,而在两极附近略微扁
平。这是个被叫做“扁球体”的形状。地球从北极
到南极的直径是7900英里,赤道直径是7927英
里。所以,地球的曲率并不是一个常数(像一个
理想的圆球那样),而是在每英里上有约7.973英
寸到8.027英寸的微小变化。正如阿西莫夫
(1989)所言:“从球体到扁球体的修正比从平
面到圆的修正要小得多。因此,虽然‘地球是球状
的’这一理解有误,但严格地说,它没有错到‘地
球是平的’那种程度。”(p.41)
阿西莫夫关于地球形状的例子为我们展示了

科学家们使用“错误”、“误差”和“证伪”这些术语
的不同情境。这些术语并不是说被检验的理论错
得一无是处,这些理论仅仅是不完善的。所以,
当科学家强调说理论是暂时性的、可能被未来的
研究发现所修正的时候,他们所指的就是例子当
中的情形。当科学家相信地球是球状的时候,他
们认识到在未来某一天,这个理论需要在细节上
进行修正。无论如何,从球体到扁球体的变化维
持了地球是一个球体的“大体正确性”。我们绝不
会在某天醒来突然发现它其实是一个立方体。临
床心理学家斯科特·利连恩费德(Scott Lilienfeld,
2005)向心理学专业的学生这样介绍阿西莫夫的
观点:
当向学生解释心理学知识本来就是暂时
性的、可以被修正的时候,有些学生会错误
地得出结论,认为真正的知识是不存在的。
这种观点在某些后现代主义圈子里非常流
行,它忽视了对不同确定程度的知识的区
分。虽然绝对的肯定在科学中无法实现,但
一些科学理论,如达尔文的自然选择学说,
已经被极好地证实了,而其他一些理论,如
支持占星术的理论,已经遭到了有力的驳
斥。还有一些理论,如认知失调理论,仍处
在科学争议当中。因此,科学理论是个确定
程度不同的连续体:有些已经成为了确定的

事实,另外一些则被完全地证伪了。对于科
学问题,方法论上的怀疑主义并不产生完全
确定的答案(原则上说,这些答案可能会被
新的证据推翻),这个事实并不意味着知识
是不存在的,只是说知识是暂时性的。
(p.49)
“科学必须产生确定的知识”这一错误信条常
常被用来攻击科学。古生物学者尼尔·舒宾(Neil
Shubin)描述了神创论者如何利用这一策略。在
和科学作家纳塔利·安吉尔(Natalie Angier,
2007)的访谈中,舒宾说:“神创论们首先试图
将科学描绘成铁板一块的事实,然后攻击那些‘确
定’中不是特别确定的事情。他们叫嚷着‘哈!你
自己都理不清思路了吧,你太不不靠谱了。那我
们为什么要相信你所说的一切呢?’其实是他们首
先竖起了一个‘科学毫无瑕疵’的稻草人当靶
子。”(p.20)

小结
科学家们提到“可解的问题”时,通常指的
是“可检验的理论”。“可检验的理论”的定义在科
学上是非常明确的:这个理论是有可能被证伪
的。如果一个理论不可证伪,并且和自然界的真
实事件没有关联,那么它就是无用的。心理学里
一直充斥着不可证伪的理论,这也正是心理学发
展缓慢的原因之一。
好的理论能够作出具体的预测,具有高度的
可证伪性。相比于一个不精确的预测,如果一个
明确具体的预测得到证实,就会为产生这个预测
的理论提供更大的支持。简言之,可证伪性原则
的一个含义就是,并非所有理论的验证都具有同
样的价值。可证伪性越高,预测越具体,得到证
实的理论就越受青睐。即使预测并没有得到证实
(比如它们被证伪了),可证伪性对于理论的发
展也是有用的。一个被证伪的预测说明,原有理
论要么应当抛弃,要么需要进行改变,以解释不

一致的数据。正是通过这种由被证伪的预测所引
发的理论修正,像心理学这样的科学才能逐步向
真理逼近。

Chapter 3
操作主义和本质主义:“但是,
博士,这到底是什么意思?”

物理学家真正理解地心引力是什么吗?我的
意思是“真正”。他们知道“地心引力”这个术语的
真正含义是什么?它的内在本质是什么?说到地
心引力时,最终所要表达的意思是什么?说到
底,它究竟是什么?类似这样的问题反映了一种
科学观点,哲学家波普尔称其为“本质主义”。这
种观点认为,从内在本质或者本质属性的角度对
现象作出最终解释,才算得上是好的科学理论。
支持这种观点的人通常也相信,无法对现象作出
最终解释的任何理论都是无用的,这样的理论不
能反映真实的内在情况,不能反映世界存在方式
的本质。本章,我们将讨论为什么科学不去回答
本质主义者的问题,而是通过对概念进行操作性

定义得以进步。

为什么科学家不是本质主义者
事实上,科学家并不企图获得本质主义者所
追求的那类知识。从这一意义上讲,对于本章一
开始提出的问题的正确回答是:科学家不知道地
心引力是什么。科学并不试图回答关于宇宙
的“终极”问题,彼·得米德瓦(1984)曾写道:
确实存在那些科学不能回答并且在科学
发展的可预见的范围之内也不可能得到答案
的问题。比如,那些孩子们会提出的问题
——“终极问题”……我能想到的这样的问
题有:世界是如何开始的?我们来到这世间
是为了什么?生活的意义是什么?(p.
66)
然而,即使科学不能回答终极问题,也
不意味着必须接受其他的答案;也不能理所
当然地认为,既然这类终极问题能被提出,
就一定能够被回答。就我们目前的理解力而
言,这类问题是无从回答的。(p. 60)

但是,最终就其能回答的那类问题而
言,科学的潜力是无穷的……没有什么可以
阻挡或终止科学的发展,除了诸如缺乏勇气
之类的道德方面的缺陷。(p. 86)
科学家之所以质疑那些自称为终极问题给出
绝对答案的人、理论或者观念体系,一个原因就
是科学家认为终极问题是无法回答的。科学家并
不会宣称他们可以提供完美的知识;科学的独特
优势并不在于它是一个不会犯错的过程,而在于
它提供了一种消除错误的方式,它能不断消除我
们认识中的错误。再者说,自称完美或绝对知识
的主张及做法,却往往会阻碍人们的探索。自由
而开放地探索知识是科学活动的一个先决条件。
科学家们总是在怀疑那些号称已经找到问题最终
答案的言论。

本质主义者喜欢咬文嚼字
本质主义者的态度通常有一种表现:在探求
知识之前,过于关注术语或概念的定义。“但
是,我们必须首先界定我们的术语”是本质主义
者常用的一个口号。“某理论性概念的真正含义
是什么”这种理念似乎意味着,当一个词被当作

理论中的概念使用之前,我们必须对这个词的使
用所涉及的所有潜在语言问题有一个全面且清晰
的理解。事实上,这正好与科学家的工作方式相
反。在对物理世界开展研究之前,物理学家不会
花费气力讨论如何使用“能量”一词,或者当我们
讨论物质的基本组成时,“粒子”一词是否真正表
达了我们要表达的本质含义。
在科学领域里,确定某概念的意义,是在与
该术语有关的现象得到一定程度的研究之后,而
非研究之前。一个精确的概念性术语来自科学过
程中固有的那种数据和理论间的相互作用,而不
是关于语言用法的辩论。本质主义者让我们陷入
无休止的文字争论,而许多科学家坚信这样的文
字游戏使我们脱离了事物的实质。例如,对
于“生命一词的真正含义是什么”这个问题,两个
生物学家给出的令人惊讶的回答是“没有什么真
正的含义,它只是足够好地满足我们生物学家工
作需要的一种用法,并不是争论或辩驳的主
题”(Medawar & Medawar, 1983, pp. 66-67)。总
之,科学家的目的是解释现象,而非对措词进行
分析。在所有的科学学科里,进步的关键在于放
弃本质主义,接受操作主义。这正是本章中我们
探讨的主题。

操作主义者将概念和可观测的事件联系
在一起
那么,如果不是来自语言文字的争论,科学
中概念的含义又来自哪里呢?正确使用某一科学
概念的标准是什么?为了回答这些问题,我们必
须讨论操作主义。它对于在科学领域中建构理论
至关重要,尤其对于评估心理学中的理论及观念
具有重要作用。
尽管操作主义形式多样,但是对于科学信息
的使用者来说,用最宽广的思路去思考操作主义
是最有效的。“操作主义”只是这样一种思想:科
学理论里的概念必须立足于可观测事件,或与可
观测事件相关联,而这些可观测事件是可以被测
量的。将概念与可观测事件相联系的是概念的操
作性定义,这使概念公开化了。操作性定义使得
概念从个人化的感觉和直觉中分离出来,并且允
许任何实施可测量操作的人对概念进行检验。
例如,把“饥饿”这个概念定义为“我胃里不好
受的感觉”,并不是一个操作性定义,因为它与
个人对于“不好受的感觉”的体验相联系,因此不
能被其他观察者知悉。相反,涉及一些可测量的
食物剥夺时间或者像血糖水平这样的生理指标的

定义才是可操作性的,因为它包含了任何人都可
以实施的可观测的测量。同样,心理学家不同意
将“焦虑”定义为“我不时会感到的不舒服和紧
张”,而是必须用像问卷和生理指标测量这样的
操作来定义概念。上述那个定义是个人对身体状
况的解释,他人无法复制;而后者则是把概念放
在公共科学领域进行解释。
在科学领域里,定义一个概念靠的是一系列
操作,而非单独的行为事件或任务,意识到这点
非常重要。相反,一些差别细微的任务和行为事
件通常聚合在一个概念上(在第8章我们将会更
多地讨论聚合性操作)。例如,教育心理学家根
据利用诸如《伍德库克阅读能力量表》之类
(Woodcock, 2011)包含一系列任务的标准化工
具测得的成绩来定义“阅读能力”这个概念。该量
表测出的阅读能力总分包含了一些不同分量表测
得的能力指标。这些分量表测查的能力稍有不
同,例如,阅读一篇文章、想出一个合适的单词
在文章中填空、写出一个词的同义词、独立拼读
一个较难的词,等等。所有这些任务上的表现综
合地定义了“阅读能力”这个概念。操作性定义促
使我们认真地、经验性地思考我们如何定义一个
概念,所谓经验性,是指要根据我们对真实世界
的观察。试想,我们要给一个看起来相当简单的
概念“打字能力”下一个操作性定义。想象一下你

这么做是为了比较两种打字教学方法的优劣。思
考一下你所要做的所有决定。当然,你想要测
量“打字速度”。但是要打多长的一段文章呢?仅
有100个单词的文章可能太短,而10000个单词的
文章又似乎太长。那么到底多长才算好呢?打字
速度维持多久才最符合我们对打字能力这一概念
的理论建构?用什么类型的文章来测试呢?文章
是否要包含数字、公式和不常见的间距?我们如
何处理错误?当我们测量打字能力的时候,时间
和错误似乎都应被考虑在内,但是如果把这两个
指标同时考虑进去的话,要如何来计算一个总分
呢?我们想要让时间和错误具有相同的权重,还
是一个比另一个更重要?寻求一个好的操作性定
义会迫使你认真考虑所有这一切:它会让你对如
何将“打字能力”进行概念化做一番透彻的思考。
考虑美国食品和药物管理局(the Food and
Drug Administration, FDA)的任务,他们决定什
么是各类食物“不可接受”的污染水平,什么被认
为是食品中“不可避免的缺陷”(Levy, 2009)。作
为FDA这样的联邦机构也不能够依靠主观作出判
断。这需要在检查每种食物时,对每种污染物的
操作定义进行严格规范。例如,它构建了以下类
型的操作定义(Levy, 2009):番茄汁中“不可接
受”的污染水平是每100克中超过10个苍蝇卵,蘑
菇中“不可接受”的污染水平是每100克有五个以

上的2毫米以上的蛆。简单粗暴却极具操作性!

信度和效度
对一个概念下操作定义包括测量:通过一些
法则给观测结果赋值。科学作家查尔斯·塞费
(Charles Seife, 2010)指出,当我们在测量使用
数字时,我们才突然开始重视它们。他认为,如
果数字不作为抽象符号使用,非数学家几乎不关
注数字的性质。我们不会关注数字5本身。但是
一旦数字5变成“5磅”或“5美元”,或是“通货膨胀
率为5%”,又或是“智商5分”——突然之间,我们
便开始关注这了。塞费(2010)说:“没有单位
的数字是抽象而缥缈的。有了单位,它获得了意
义,但是同时它也失掉了自身的纯粹
性”(p.9)。赛费所说“失去纯度”的意思是一旦
涉及测量,就是说给数字附加单位,我们突然关
心数字的“正确”性质。在科学上,什么是数字
的“正确”性质呢?这个问题的答案是,在科学
上,数字应该有的“正确”性质是信度和效度。
概念的操作性定义要想有用,必须同时具备
信度和效度。信度是指测量工具的一致性。如果
你对同一概念进行多次测评,是否能够得到相同

的测量结果。信度的科学概念很容易理解,因为
它与常识中的定义以及字典里的定义非常相
似:“任何总能够产生相同结果的系统所具备的
一种属性”。
试想一下,一个外行人士会如何评价一件事
是否可信呢?想象一个每天早上要赶公共汽车从
新泽西去曼哈顿上班的人。按照时间表,公共汽
车每天应该在上午7:20到达此人等车的站点。在
一个星期中,如果公共汽车到达的时间分别是
7:20、7:21、7:20、7:19和7:20, 那么我们就可以
说在那一周汽车的到达时间是可信的,如果下周
汽车到达的时间分别是7:35、7:10、7:45、7:55和
7:05, 那么我们就可以说在那一周汽车的到达时间
是非常不可信的。
在科学领域中,一个操作性定义的信度以类
似的方式来评估。如果我们多次测量同一概念得
到的结果是近似的,那么我们就说测量工具表现
出较高的信度。如果在同一星期的周一、周三和
周五,用同一IQ测验的不同版本测量同一个人的
智力,得到的分数分别是110、109、110, 那么我
们可以说这一IQ测试是非常有信度的。相反,如
果三个测试分数分别是89、130和105, 那么我们
就可以说这一IQ测试没有显示出高信度。有一些
专门的统计方法可以评估不同类型的测量工具的

信度,所有标准的方法论入门教材中都有介绍。
但是请记住,信度仅仅是指前后一致,而不
包括其他内容。对于一个操作性定义而言,仅有
信度是不够的,信度是一个必要而非充分条件。
作为一个好的操作性定义,操作必须被证明对于
概念来说是有效的测量。“结构效度”这个术语是
指一个测量工具(操作性定义)是否测量了它本
应测量的内容。保罗·考兹比教授(Cozby, 2012)
在其所著的方法论教材中为我们讲述了一个只有
信度而没有效度的搞笑例子。假设你想测测自己
的智力,测试者让你站到一个类似鞋码器的测试
仪器上,然后仪器给出一个读数。当然,你会认
为这是一个笑话。但是请注意,这个测量工具可
以显示许多类型的信度,而这些信度在方法论教
材中都会讨论到。这个仪器在星期一、星期三和
星期五会呈现出相当一致的读数(这称之为“重
测信度”),并且无论谁操作它,它都会给出一
样的读数(称之为“评分者信度”)。
用鞋码器来测量智力,其问题不在于信度
(这是有信度的),而在于效度。它不是一个测
量其本应测量的概念(智力)的合理方式。断定
它不是测量智力的有效方式的证据之一,就是我
们发现它和其他一些被认为与智力相关的变量无
关。鞋码器的测量结果与学业成就无关,与脑功

能的神经生理学测量无关,与职场成功无关,与
认知心理学家提出的信息加工效率的指标无关;
相反,真正的智力测验与所有这一切都有关
(Deary, 2001; Deary et al., 2008; Duncan et al.,
2008; Flynn, 2007; Geary, 2005; Hunt & Carlson,
2007; Lubinski, 2004)。在心理学领域,真正的
智力测验要兼顾效度与信度,而智力的鞋码器测
验只有信度而没有效度。
在这一点上,你可能想知道信度和效度的其
他组合方式是否可行。因此,让我来重申一下我
们的立场。在操作性定义中,我们寻求信度和效
度兼备,因此高信度和高效度结合才是理想的目
标。我们刚刚讨论了鞋码的IQ测试,目的是论证
高信度和低效度是没用的。第三种情况是低信度
和低效度,这绝对没有用,因此不值得讨论。但
是你可能想知道第四种,也就是最后一种可能的
组合方式:如果高效度和低信度又怎么样呢?答
案是和低效度和高信度的例子(鞋码器例子)一
样,这种组合也是没用的。事实上,更准确的说
法是,这类情况压根儿不可能出现。因为,如果
不能进行可信的测量,你根本无法宣称测量是有
效的。
当形成有效的操作定义时,精确我们要测量
的概念是十分重要的。例如,美国橄榄球联赛

(NFL)中评价四分卫时会用到“传球评
分”(passer rating)这个指标(Sielski, 2010)。
意识到这个指标被精确地确定为“传球评分”很重
要。也就是说,它很明确不是四分卫评分指数。
那是因为“传球评分”的操作定义把只是四分卫传
球而不是四分卫做的每件事情考虑了进去。具体
地说,传球率是一个数学公式,包括四个方面:
完成传球百分比、每次传球尝试的码数、每次传
球尝试的触地得分、每次传球尝试的拦截。传球
评分指数统计数值不包括:四分卫跑的码数、呼
叫战术能力、胜负记录、在争球线后抱摔、掉球
和其他一些可量化的四分卫变量。为此,在另一
个操作定义下的叫做“四分卫总评分”的概念产生
了。

直接和间接的操作性定义
概念和可观测的操作之间的联系,在直接和
间接性程度上变化很大。很少有科学概念几乎完
全是通过可观测的操作来定义的。大部分概念的
定义采用更为间接的方式。例如,一些概念的使
用既取决于一系列的操作,又取决于它和其他概
念之间的特殊关系。最后,还有一些概念不通过
可观测的操作直接定义,而是通过它与另外一些

概念间的关系来定义的。这种概念有时被称
为“潜在概念”,在心理学中非常普遍。
举个例子来说,许多研究关注所谓的A型行
为模式,因为它与冠心病的发病率有关(Chida &
Hamer, 2008; Martin et al., 2011; Matthews, 2005;
Smith, 2003; Suls Bunde, 2005)。在第8章中,我
们将会更加详细地讨论A型行为模式。但是,这
里重点要说的是,A型行为模式实际是通过一系
列二级概念来定义的:强烈的竞争欲望、潜在的
敌意、赶时间行为、达成目标的强烈驱力,等
等。然而,每一个用于界定A型行为模式特征的
概念本身也都需要操作性定义。事实上,研究者
们已经为对每个概念进行操作性定义而付出了很
多努力。我们讨论的要点是,A型行为模式是一
个复杂的概念,它并不是被操作所直接定义的。
相反,该概念与其他一些各自具有操作性定义的
概念联系在一起。
A型行为模式提供了一个间接操作性定义的
例子。在临床心理学上,有一个相似的概念定义
是痛苦耐受性(Zvolensky, Vujanovic, Bernstein, &
Leyro, 2010)。这个整体的概念由几个简单的依
赖于操作测量的子概念构成:对不确定性的容忍
度、歧义容忍度、挫败容忍度、负面情绪容忍度
以及身体不适容忍度。

简而言之,尽管不同的概念与可观测操作的
联系程度各有不同,但所有的概念都在一定程度
上通过其与可观测操作之间的联系来获得意义。

科学概念的演进
一个科学概念的定义并不是固定不变的,而
是随着相关观测结果的不断丰富而发生变化。意
识到这一点非常重要。如果一个概念的原始操作
性定义在理论上被证明是无效的,那么该定义就
会被抛弃,以另外一套定义的操作取而代之。这
样,随着相关知识的积累,科学概念不断演进,
其抽象性逐渐增加。例如,在一段时间里,人们
认为电子是一个围绕原子核旋转的带负电的微小
球体。而如今,电子被视为在特定实验条件下,
具有似波特性的概率密度函数。
在心理学领域,智力概念的发展提供了一个
类似的例子。起先,智力仅有一个严格的操作性
定义:智力是通过心理功能测验所测到的东西。
随着实验证据的不断积累,智力被证明与学业成
就、学习、脑损伤、神经生理学及其他行为和生
物学变量有关,这一概念在逐渐丰富的同时又得
到了提炼(Deary, Penke, & Johnson, 2010; Duncan

et al., 2008; Sternberg & Kaufman, 2011)。现在看
来,在定义智力概念时,最好用一种高等级的建
构,通过多种更为具体的信息加工操作来定义。
当然,这些假设的信息加工过程应该具备更为直
接的操作性定义,可以用可测量的指标来表述。
人类记忆理论中的概念也以同样的方式发
展。现代心理学家很少使用类似“记忆”或“遗
忘”这样的笼统概念;相反,他们测量那些可以
进行明确定义的记忆子过程,如短时听觉记忆、
符号存储、语义记忆以及情景记忆。传统的“记
忆”或“遗忘”的概念通过更加明确的操作性概念得
到了细化。
因此,理论术语的用法在科学实践中不断演
进,而不是在针对文字意义的争论中获得发展。
这是科学的操作态度和本质主义者在追求绝对定
义之间最显著的区别。哲学家保罗·邱吉兰德
(Churchland, 1988)强调,在科学中,对概念的
定义不是源于文字界定,而是源于与之相关的观
察和其他概念:
要想完全理解“电场”这个概念,我们
就必须熟悉这一表述所处的理论原则体系,
它们会共同告诉我们,电场是什么、做什
么。这是一个典型的例子。通常来讲,理论

性术语的意义不是从单一的、具体描述其所
适用的必要充分条件的定义中获得的,它们
往往通过所在的理论原则体系而被间接地定
义。(p. 56)
随着科学概念的演进,概念常常与许多不同
的理论体系交织在一起,并且获得多种操作性定
义。这种情况的出现并不是因为概念本身出了问
题。例如,许多人认为心理学不可信,因为心理
学中许多重要的理论概念——例如智力,可以用
不止一种方法来操作化和概念化。但这种情形并
非心理学所独有,也不是一件令人绝望或束手无
策的事情。事实上,在科学领域里,这种情况是
普遍存在的。例如,“热”既可以从热力学理论,
也可以从动力学理论的角度来概念化。物理学并
未因此遭到贬斥。想想电子,它的许多特性都是
以波的概念来解释的。可是,如果将其视为粒
子,它的另外一些属性则更好理解。到目前为
止,还没有一个人会因为物理学中存在着这些多
重概念化现象就提出要抛弃它。
2006年,人们在这一点上有了深刻的认识。
当时媒体报道国际天文联合会(International
Astronomical Union)对“行星”的定义重新进行了
操作化,并将冥王星排除在外(Adler, 2006;
Brown, 2010)。像“行星”这样基础的概念都会发

生变化,确实让公众大为震惊,但这在科学领域
是司空见惯的。在行星定义这件事儿上,一些天
文学者倾向于强调天文主体的构成和地质因素;
另一些天文学者则强调行星的动力属性,例如它
们的轨道和重力影响。在前一组天文学家的操作
性定义中,冥王星是行星,而在后一组天文学家
的操作性定义中,冥王星则不是行星。不同的操
作性定义反映的不是天文学界的混乱,它们只是
反映从不同角度定义概念的方式。在心理学上也
是一样,一个概念也有许多可选择的操作性定
义。有些事物难以定义,并不代表没有可研究的
东西。

心理学领域的操作性定义
许多人在思考物理学或化学的时候,能够理
解操作主义的必要性。他们知道,如果科学家准
备谈论某一类型的化学反应、能量或者磁场,就
必须有相应的方法来测量。不幸的是,当人们谈
到心理学的时候,却经常无法认识到操作主义的
必要性。为什么人们没有同样地认识到这一显而
易见的事实:为了成为科学理论中有用的解释体
系,心理学术语必须被直接或间接地操作化定
义?
人们对心理学产生误解的原因之一,就是心
理学上所说的“预设偏见”。在第1章中,我们提
到过这个问题。人们不会因为执着于某种关于岩
石性质的信念来研究地质学,而在心理学中,情
况就大为不同了。我们每个人都有关于人格和人
类行为的直觉理论,我们用它们来“解释”自己以
及他人的行为。我们所有的个人心理学理论里都
包含着理论性概念(例如聪明、攻击和焦虑)。

因此人们会很自然地发问:“为何我们必须接受
一些其他的定义?“尽管这种态度从表面上看来
是合理的,但对于任何致力于理解人类行为的科
学来说,它都是一个巨大的障碍,也是公众对心
理学产生困惑的一个原因。
误解产生的最主要原因,就是心理学中的许
多专业概念都是用日常用语来表达的,这也是媒
体在准确呈现心理学成果方面最大的障碍。这些
日常用语为大量误解的传播敞开了大门。外行人
很少意识到,当心理学家把“智力”、“焦虑”、“攻
击”、“依恋”等词语当作理论性概念来使用时,它
们的含义和大众平常所说的意思不一定相同。
从之前关于操作主义的讨论中,就能看出这
种区别的本质。当在心理学理论中使用如“智
力”、“焦虑”这些术语时,它们直接或间接的操作
性定义决定了它们的正确用法。那些定义常常具
有高度技术性,通常具有特定意义,并且在许多
方面都不同于这些术语在日常生活中的运用。例
如,当我们听到“对大样本的认知任务进行因素
分析所得到的第一个主成分”这段话时,许多人
都意识不到它是术语“智力”的操作性定义。
同样,如果外行人使用术语“抑郁”,那就意
味着“感觉糟透了”。相反,在《精神疾病诊断与

统计手册》(Diagnostic and Statistical Manual of
Mental Disorders)中,对抑郁症的专门定义占用
了超过12页的篇幅(American Psychiatric
Association, 2000),并且与“感觉糟透了”有着很
大的区别。临床心理学家所谓的抑郁,并不等同
于外行人所说的抑郁(Hollon, Thase, &
Markowitz, 2002)。在其他科学领域也都存在同
样的问题,尽管可能没有心理学这么严重。回想
一下前面对“生命”概念的讨论。正如米德瓦等
(1983)指出的,问题在于,像科学中的其他专
业术语一样,“生命”一词出自人们的日常用语,
但在科学场合中的含义已远不同于日常谈话中的
用法(p. 66)。
物理学家丽萨·兰道(Randall, 2005)曾讨论
过这类问题如何阻碍了公众对物理学的理解。她
指出爱因斯坦相对论中的“相对性”一词被公众理
解为“绝对是不存在的,因为任何事物都是相对
的”,而事实上,该理论的意思正好相反!兰道
指出,其实爱因斯坦的相对论都是有关事物的不
变和绝对属性的。实际上,爱因斯坦也曾坦陈这
一理论如果被命名为“恒定论”可能会比“相对
论”更加贴切,但是“相对性”一词的地位在当时很
快就已深入人心了。兰道继续指出,即使在物理
学中,模糊的词语选择也是造成某些误解的根
源,科学家经常使用一些口语化的术语,但外行

人无法区分这些词语的用法是通俗意义上的还是
技术意义上的。在心理学中也是如此。当心理学
家和外行人用同一词语来表达不同含义的时候,
他们之间常常产生误解。如果有新的词语产生出
来用以描述心理概念,这样的困扰可能会少一
些。有时会有这样的词语出现,正如物理学家有
了“尔格”和“焦耳”一样,心理学家有了“失
调”和“编码”,这些词不是凭空编造的,但在日常
用语中比较生僻,从而可以防止混淆。
“但是,”外行人可能提出这样的反对,“为什
么心理学家这样折磨我们?为什么有这么多新的
术语、高度专业性的定义、生僻的词语?为什么
我们需要这些?为什么我对‘智力’概念的定义得
不到他们的认可呢?”
在这里,我们来看一个对心理学研究有严重
误解的例子——这一误解经常出现在关于心理学
研究的媒体报道中。一份全国性的报纸以“你能
用一般人听得懂的话重新说一遍吗?”为标题报
道了1996年美国心理学会的一次会议,并说“心
理学家所用的语言只有他们自己能听懂”。该文
嘲讽了在会上报告的一份题为《用Gf-Gc理论解
释对WJ-R和KAIT的联合因素分析》的论文。尽
管记者表示他“不敢贸然猜测这个标题的真正意
思”,但几乎所有接受过培训的心理学家都能理

解这个标题是有关智力测验理论方面新进展的。
的确如此。Gf-Gc理论是智力理论方面的一个技
术性进展,记者基本不会听说过这个概念——就
如同我们不会期望这位记者知道物理学家最近刚
发现的一种基本粒子的细节一样。可是有时候,
记者对科学术语的无知(这是完全可以理解的)
却对现代心理学造成了负面影响。当话题是物理
学时,记者似乎知道是他们的无知妨碍了他们的
理解。但是,当话题是心理学时,他们就表现得
好像心理学家要为他们的不懂负责一样。
我们来看看问题的症结所在。解决它的第一
步,就是强调我们已经讨论过的一个观点:操作
主义不是心理学所独有的,它是所有科学门类的
特征。大多数情况下,我们很容易接受它,理解
它的显而易见的本质。如果一位科学家是研究放
射性的,我们会理所当然地认为他肯定有办法测
量此种现象——其他研究者也能使用该方法获得
相同的结果。操作定义因此导致科学的公开化,
而公开化是科学的关键特征之一。如果两个科学
家对同一个操作性定义达成一致,其中一个人就
可以用它去复制另一个人的结果。但是,在其他
情况下看来显而易见的事情,在我们谈到心理学
的时候却不怎么明晰了。人们经常意识不到“智
力”和“焦虑”这些概念的操作性定义的必要性,因
为我们总是在使用这些术语,难道我们还不“知

道”它们是什么意思吗?
答案是:是的,我们确实不知道它们是什么
意思——不是从科学家必须知道的意义上,而是
从公众的意义上。一个科学家必须通过如下方
式“知道”智力是什么意思:他必须精确地定义一
种方法,使其他实验者能够以完全相同的方法测
量这一概念,并且得到有关此概念的相同结论。
就其明确性和精确性来说,这与日常交谈中为了
实现相互理解而使用的模糊语言间有很大的差
别。

作为人性化力量的操作主义
如果过分依赖于我们“知道”的东西,肯定会
产生问题,这个问题同样困扰着所有的直觉(非
经验主义的)信仰体系。关于某个事物,你
所“知道”的和张三、李四所知道的可能并不一
样,我们如何决定谁是正确的呢?你或许会
说:“我强烈地感觉到我所知道的是正确的。”但
是,如果张三的观点和你有出入,但比你拥有更
强烈的感受呢?李四的观点与你俩都不同,也宣
称自己是正确的,因为他的感受甚至比张三还要
强烈。

讲这个简单的小段子,仅仅是想阐述科学知
识的一个基本特点,它在人类历史中是一股重要
的人性化力量:在科学中,知识的正确与否并不
取决于个体提出主张时自己的肯定程度。所有建
立在“直觉”基础上的信念体系都有一个共同的问
题,即当出现矛盾观点时,它们缺乏一种机制来
判别哪个是对的,哪个是错的。因为人人都凭直
觉认为自己是对的,但当大家的直觉观点发生冲
突时,我们该如何决定谁正确呢?令人悲哀的
是,历史表明,这种冲突的结果通常是权力斗
争。
一些人错误地宣称,心理学的操作取向使人
们丧失了人性,而且我们应该把我们关于人类的
观点建立在直觉基础之上。心理学家唐纳德·布罗
德本特(Donald Broadbent)在1973年论证说,真
正人性化的观点是将关于人类的理论观点建立在
可观测的行为基础上,而不是以理论者的直觉为
基础:
除非我亲眼看到别人在特定情况下亲自
做了或说了什么,否则无法对别人作出判
断……实证主义的方法是一种调和差异的方
式。如果拒绝这一方式,那么处理争论的唯
一方式就是面红耳赤地争辩了(p. 206)。

因此,科学中人性化的力量就是让知识公开
化,让任何有冲突的观点都能以一种双方都接受
的方式得以检验。回想第1章中提到的“重复”的
概念。这让我们可以通过一种大家都事先同意
的、平和的方式来从理论中进行选择。科学的公
共性本质在很大程度上依赖于操作主义的理念。
通过对概念操作化的界定,概念进入了公共的领
域——任何人都可以对其进行批判、验证、改进
或否定。
心理学概念不能以某些人的个人定义为基
础,因为这类定义可能是不常见的、个人化的或
者模糊的。由于这个原因,心理学必须摒弃所有
对概念所做出的个人化定义(就像物理学拒绝对
能量的个人化定义,气象学拒绝云的个人化定
义),而坚持公众可以知悉的定义,这种定义用
操作来界定概念,并确保了任何一个接受过适当
训练并拥有适当设备的人都可以实施这些操作。
就摒弃个人化定义而言,心理学并没有将外行人
拒之门外,而是将这一领域向公众敞开,就像所
有学科那样,以期寻求所有人都可以共享的、普
遍的、公众可以利用的知识。
只有当概念以操作性定义为基础,并且不关
注于本质主义者所讨论的文字意义时,这类具有
公众可用性的知识才能够用来解决人类的问题。

例如,蒙克(Monk, 1990)描述了第二次世界大
战期间“创伤性休克”这个概念是如何在医学领域
产生问题的。一些医师对此症状的诊断依据是过
高的血红细胞浓度,并认为其原因在于血液中的
血浆渗透到了组织中。其他医师诊断“创伤性休
克”则根据低血压、皮肤苍白和脉搏过速。换言
之,医生们对这一概念的操作性定义是不一致的
(甚至是带有个人色彩的)。因此,英国医学研
究会的格兰特(Grant)医生建议说,“创伤性休
克”这个概念应该被抛弃,并且对伤者进行详细
观察时也不使用这个术语……由于在诊断方面缺
乏共同的基础,无法对各种治疗措施的效果进行
评估(Monk, 1990, pp. 445-446)。换句话说,这
种概念弊大于利,因为缺乏一个获得普遍认同的
定义使之成为公共知识(也就是被广泛地分享与
认同)。
有时候,在科学领域中,概念意义的改变会导致
对这一概念的科学理解与外行人士的理解产生冲
突。法伯和邱吉兰德(Farber & Churchland,
1995)讨论过一个关于“火”这一概念的例子。经
典的概念是这样定义火的:“不仅是含碳物质的
燃烧,而且还包含了太阳及各种星体上的活动
(实际是核聚变)、闪电(实际上是电引起的白
热化现象)、北极光(实际是光谱发射)和萤火
虫的闪光(实际上是发出磷光)。在现代概念体

系中,这些现象都与氧化无关,因此和木材燃烧
不属于同一类型。另外,有一些现象原本认为是
与燃烧没有任何关系(由于那时放热被认为是燃
烧的本质特征)的过程——如生锈、锈蚀和新陈
代谢——却被证实属于氧化现象。”(p. 1296)
总之,氧化的原则使得篝火和生锈联系了起来,
而将闪电与它们区分开来。对于科学家而言,这
也许是一个进步的标志,但却让外行人士感到迷
惑和无所适从了。

本质主义者问题和对心理学的误解
许多人在接触心理学时,放弃操作主义观点
的另一个原因是,他们想为特定的人类问题找出
本质主义的答案。回想本章开头提出的问
题:“地心引力”这个术语的真正含义是什么?它
的内在本质是什么?在谈到地心引力一词时,我
们到底指的是什么呢?大部分人认为这些问题需
要绝对性的知识,需要理解现象的潜在本质,而
物理学当前的理论不能对这类问题提供答案。对
关于物理科学近几百年来发展的通俗读物比较熟
悉的人都能意识到,地心引力是一个高度复杂的
理论建构,并且其概念性和操作性关系也处在不
断变化之中。

可是,如果将上述问题中的“地心引力”全都
换成“智力”,奇迹就出现了。那些问题此时立刻
被赋予了重大意义。它们看起来是那么自然和富
有深意,它们就是在寻求一个终极答案。可是当
心理学家给出和物理学家一样的答案,即“智力
是一个复杂的概念,它的意义是由测量它的操作
以及它与其他概念之间的理论关系来界定
的”时,却会被鄙视和指责为回避真实问题。
心理学所面临的一个难题就是,公众要求心
理学去回答本质主义问题,而通常其他科学家并
不需要回答类似的问题。这类要求常常导致人们
贬低心理学领域已经取得的进步。尽管这类要求
不能阻止这一领域自身的发展——因为就像其他
科学家一样,心理学家无视本质主义问题并继续
他们的工作——但那些问题成了公众理解心理学
的障碍。当一个不了解情况的批评家声称心理学
没有取得进步时,公众就会迷惑了。这类责难极
少遇到挑战,这也反映了本书序言中所述的不幸
事实:对于心理学领域所取得的科学成就及其意
义,公众的了解是极度匮乏的。当我们仔细审视
那些对心理学的批评,不难发现它们通常归结于
一点:心理学至今没有为它提出的问题提供终极
答案。对于这种指责,心理学毫不犹豫地低头认
罪——像所有其他科学学科一样。

一些人可能会很不舒服地发现,包括心理学
在内,没有任何科学可以对本质主义问题作出回
答。霍尔顿和罗勒(Holton & Roller, 1958)讨论
过当外行人被告知物理学不能够回答本质主义问
题时所表现出的那种不安。他们谈论的是与放射
性衰变有关的现象:发生衰变的放射性元素的原
子数量与时间是呈指数函数关系的。可是,这种
函数并不能解释为什么放射性衰变现象会发生。
它不能回答外行人为什么它会遵循这个函数,也
不能回答放射性衰变到底是什么。霍尔顿和罗勒
告诉我们:“我们必须平静地接受现代科学的局
限性,它并没有声称可以发现‘事物究竟是什
么’”(pp. 219-220)。科学作家罗伯特·怀特
(Wright, 1988)解释说:
伊萨克·牛顿的地心引力理论有些地方
不如尽人意……毕竟,“在一定距离外作
用”如何实现?牛顿回避了这样的问题……
自牛顿开始,物理学家们一直在效仿他的做
法……物理学家们不再尝试解释为什么事物
必须遵守电磁学规律或地心引力规律(p.
61)。
同样,那些为人类本性问题寻求本质主义答
案的人若是诉诸心理学,注定将会失望。心理学
不是宗教,它是一个试图对所有行为作出科学解

释的广阔领域。因此,心理学现在的解释是对行
为的暂时性的理论建构,就目前来说,这些建构
在解释行为方面优于其他解释。这些建构在将来
注定会被更好的、更接近事实的理论概念体系所
取代。
在评估一个心理学理论的可证伪性时,操作
性定义的理念是一个非常有用的工具。概念有没
有直接或间接地建立在可观测操作的基础上,是
识别不可证伪的理论的重要线索。所以,那些不
严格的概念——理论学家不能为它们提供直接或
间接的操作性联系——都应该引起怀疑。与之相
关的是科学家称之为“节省”的原则。节省原则是
指,当两个理论有同样的解释能力的时候,较为
简单的理论(涉及更少的概念和概念性关联)胜
出。原因是,拥有较少概念性关联的理论在将来
的检验中会更具可证伪性。
深刻理解操作主义的原则,也有助于我们识
别不具备科学意义的问题。例如,在我的电脑文
件夹里有一篇来自于国际联合出版社的在线服务
文章,标题为《动物会思考吗》。这篇文章讲述
了动物行为方面最新的实验。文章中所引述的研
究没有任何错误,但是很显然,这个标题仅仅是
一个玩笑。这个标题的问题在于没有科学意义,
没有关于“思考”的操作性标准。许多报纸的标题

中存在类似的问题,比如“计算机会思考吗”没有
操作性标准的话,这个问题也没有科学意义,但
在鸡尾酒会上倒是可以派上大用场。

小结
操作性定义是利用可测量、可观察的操作来
表述的概念定义。我们确信某个理论具有可证伪
性的主要途径之一,就是确定理论中的关键概念
具备可以用可重复性很强的行为观察来表述的操
作性定义。操作性定义是让科学知识变得公开可
检验的主要机制。这样的定义被置于公共领域,
使其所界定的理论性概念能够接受所有人的检
验,而不是像“直觉的”、非经验性的定义那样,
只属于特定个体,检验它的机会并不向所有人开
放。
由于心理学使用一些来源于日常生活的词
语,如智力和焦虑,许多人对于这些术语的含义
有着预设的想法,因此往往意识不到对这些术语
进行操作性定义的必要性。心理学和所有其他科
学门类一样,也需要对其术语进行操作性定义。
可是,人们常常要求心理学家回答本质主义的问
题(有关概念的纯粹深层本质的问题),而其他

科学家就不必回答这类问题。没有科学能够回答
这样的终极问题。心理学和其他科学门类一样,
正在试图不断地完善其操作性定义,使理论概念
能够更加准确地反映真实世界的原貌。

Chapter 4
见证和个案研究证据:安慰剂效
应和了不起的兰迪

画面切换到《奥普拉脱口秀》——过去十年
中最著名的电视脱口秀节目之一的脱口秀现场。
今天的嘉宾是俄狄浦斯人类潜能研究所的所长阿
尔弗雷德·庞蒂菲科特(Alfred Pontificate)博
士。这位博士新提出了一个有关出生次序的激进
理论,这一理论的基本理念是:个体的生命进程
是被家庭互动所设定的,而家庭互动是由出生次
序决定的。奥普拉鼓励观众对此理论进行提问。
讨论不可避免地由最初的理论关注,转向了为观
众个人生活中的重要事件作出解释。这位博士欣
然应允。
例如,“博士,我的哥哥是个不要命的工作

狂。他对妻子和家庭完全不管不顾,并且把与工
作有关的问题看得比什么都重。他有溃疡和酗酒
问题,但他拒不承认。他们家在近两年内从没过
过一个真正意义上的假期。他的婚姻也快玩完
了,但他似乎并不是特别在乎。他为什么要选择
这样一种自我毁灭式的生活呢?”
博士反问道:“亲爱的,他在家中排行第
几?”
“哦,他是子女中的老大。”
“这就对了,”博士说道,“这在生活中比较常
见。我们在临床上经常见到这种现象。这类现象
出现的深层次原因是,父母将自身的愿望和挫折
都转移到他们第一个出生的孩子身上。通过愿望
的这种无意识的转化过程,即使父母从未明确要
求过孩子,孩子也在内化这些愿望和挫折。然
后,通过这种我称之为‘期望上旋’的动力过程,
父母的抱负转化为孩子对于成功的病态渴求。”
当嘉宾挑战观众的信念时,《奥普拉脱口
秀》的观众有时会提一些尖锐的问题,但当行
为“专家”似乎是在印证观众的传统观念的时候,
这种情况就很少发生。然而曾经有过那么一次,
节目因为一位观众质疑嘉宾的主张而显得异彩纷

呈。有一位热切而直率的观众当时正身处演播
室,“但是请等一下,博士,”提问者开始了他的
问题,“我哥哥也是家里的老大。我的父母把那
个笨蛋送到哈佛,而让我去了一个将来能够成为
一名牙医的两年制专科学校。但他们的‘神童’在
一年之后就辍学了,跑到了科罗拉多州的山顶
上。我们最后一次见到他时,他正在编篮子!我
搞不懂你关于‘长子’的说法。”
这位观众使现场气氛骤然紧张,但是博士总
是能够逢凶化吉:“哦,是的,我也曾经见过很
多你哥哥这样的个案。是的,我经常可以在我的
从业经历中遇到这样的人。他们的‘期望上旋’的
动力过程发生中断,生成潜意识的要求来抵抗父
母转化到他们身上的期望。这样的话,个体的生
活规划会朝着与传统成就标准相反的方向发
展。”一阵肃然的沉默之后,讨论转向了下一
个“案例”。
这些场面我们都再熟悉不过了,只不过又是
一个第2章讨论过的本杰明·拉什问题的例子罢
了。关于出生次序的“理论”是在没有一个事例能
够证明其“不成立”的思维框架下被构想出来的。
由于它是一个不能证伪的理论,搬出再多能证明
它的证据也没有意义,因为这个理论不能排除任
何可能的情况。

然而,我们在本章所关注的并非这一理论本
身,而在于那些用于支持它的证据。当被迫出示
证据时,庞蒂菲科特博士搬出了他的“临床经
验”或“个案研究”。这在媒体心理学领域是一个惯
用的套路。脱口秀节目和通俗心理学图书中充斥
着基于作者临床经验的心理学理论。他们通过这
类渠道提供给公众的许多疗法,能够支持这些疗
法的无非是那些曾接受治疗并认为得到了改善或
被治愈了的人的个人见证。在本章中,我们将为
心理学信息的消费者建立一个非常有用的原则:
个案研究和见证作为评估心理学理论和治疗的证
据是毫无价值的。
在本章中,我们将要证明这个原则为什么是
正确的,并且还要讨论个案研究在心理学中的正
确作用。

个案研究的地位
个案研究是对一个个体或很小的群体集中而
详细的调查。个案研究的作用,很大程度上取决
于科学探索在某个特定领域进展到什么程度。从
个案研究或临床经验中获得的灵感,在特定问题
的早期研究阶段或许比较有用,因为它们可以提
示哪些变量需要进一步研究。个案研究在开启心
理学新的研究领域方面起到过关键作用(Martin
& Hull, 2006)。让·皮亚杰的工作就是很著名的
例子。皮亚杰的研究提出了一种可能性,即儿童
的思维并不只是成人思维的简易版或低级版,而
是有其自身结构的。皮亚杰关于儿童思维的部分
推测已经被证实,但很多还有待证实(Bjorklund,
2011; Goswami, 2008)。然而,对于我们这里的
讨论来说,更重要的不是皮亚杰的哪些思想被证
实了,而是要理解皮亚杰的个案研究尽管没有证
实任何事情,但它为发展心理学家的研究提供了
难以置信的广阔领域。第5章和第6章中所要介绍
的相关研究和实验研究,为皮亚杰个案研究中提

出的假设提供了或支持或否定的证据。
然而,当我们从科学研究的早期阶段(在此
阶段个案研究可能是极为有用的)步入更为成熟
的理论检验阶段之后,情况就大大不同了。由于
个案研究在特定理论的检验中不能作为证实或证
伪的证据,所以它在科学研究的后期不再有效。
其原因就是:个案研究和见证叙述都是所谓
的“孤立事件”,缺乏比较性信息,而这种信息对
于排除其他可能的解释来说是必要的。
弗洛伊德工作的一个缺陷就是,他从不进入
第二步,即从个案研究中建立的有趣假设转向对
这些假设的真正检验(Dufresne, 2007)。研究弗
洛伊德的重要作家之一弗兰克·萨洛韦(Frank
Sulloway)说:“科学是一个两步走的过程。第一
步是提出假设。弗洛伊德提出了一系列令人瞩目
的、当时看上去非常有道理的假设,但他从未以
严格的、科学所要求的方式采取关键的第二
步。”(Dufresne, 2007, p.53)
见证叙述与个案研究相似,因为它们都是孤
立事件。依赖见证叙述的问题在于,如果累积起
来的见证几乎能够为每一种疗法提供支持,那么
它也就不可能用来支持任何一种特定的疗法,因
为所有相互对立的疗法都有各自的见证。当然,

我们想知道的是哪种疗法是最好的,但我们不能
依据见证来决定。正如心理学家雷·尼克尔森
(Ray Nickerson, 1998)在评论我们用以欺骗自己
的认知过程时所说的那样,“江湖郎中的骗术往
往得逞,是因为他们总能找到一些病人愿意为他
们做见证,这些病人总是发自内心地告诉别人,
他们自己的确从治疗中获益匪浅。”(p.192)例
如,有大量的见证声称潜意识自助式录音带(用
一种低于听觉阈限的信号制作出来的录音带)可
以提高人的记忆力,甚至提高人的自尊,然而,
在严格控制条件下进行的研究显示,这类录音带
对记忆力或自尊没有任何改进(Lilienfeld et al,
2010)。
“其他可能的解释”这一理念,对于理解理论
检验来说至关重要。实验设计的目标就是构建某
一事件或现象,使其只能用某一种特定的理论来
解释,而其他理论则解释不通。正如第2章在可
证伪性上所说的,只有当我们收集的数据排除了
其他可能的解释时,科学才能进步。科学为理论
观点的自然选择创设了条件。
有些理论观点经过实证检验存活了下来,而
另一些则被淘汰出局,凡保留下来的都更接近真
理。但是,这是个慢工出细活的过程,各种理论
观点都必须经过细致审查,以便发现哪些更接近

真理。但是这一过程必须有所取舍:为支持某一
特定理论所收集的数据,不能同时支持许多其他
可能的解释。基于这一理由,科学家在他们的实
验中设有控制组,或称为对照组,以期得到比较
性信息。这样做的目的,就是为了能够在比较控
制组与实验组的结果时,排除其他可能的解释。
至于实验设计如何能做到这一点,将是后面几章
的主题。
个案研究和见证叙述作为孤立的现象而存
在,它们缺少必要的比较性信息,不能证明某一
特定的理论或疗法更优越。因此,引用某个见证
叙述或个案研究的结果来支持某一特定理论或疗
法是错误的。如果这么做的那些人不指明他们所
提供的所谓证据其实也适用于大量其他可能的解
释,那他们就是在误导公众。简言之,针对某个
现象的孤证具有高度的误导性。安慰剂效应的例
子将更清晰具体地阐释这一论点。

为什么见证叙述毫无价值:安慰剂
效应
几乎每种产生于医学和心理学的疗法都有一
定数量的支持者,并且总能催生出一些发自内心
认可其疗效的人。医学文献记载了猪牙齿、鳄鱼
粪便、埃及木乃伊的粉末,以及很多更富想象力
的东西都曾经具有疗效(Begley, 2008; Harrington,
2008)。事实上,人们早已熟知,仅仅暗示正在
接受某种治疗,就足以使许多人感觉病情好转。
无论治疗是否有效,人们都会报告某种疗法
曾对他们有所帮助,这种倾向被称为安慰剂效应
(Begley, 2008; Benedetti, Carlino, & Pollo, 2011;
Buhle, Stevens, Friedman, & Wager, 2012;
Harrington, 2008; Novella, 2010)。安慰剂效应的
概念在电影《绿野仙踪》中有绝佳的阐述。仙女
并没有真的给铁皮人一个心脏,没有给稻草人一
个大脑,也没有给狮子以勇气,但是他们都感觉
更好了。实际上,直到近一百多年,医学才发展

出较多具有确凿疗效证据的治疗方法,因此有人
曾经这样说:“本世纪以前,整个医学史只能说
是安慰剂效应的历史罢了。”(Postman, 1988, p.
96)
我们可以通过对生物医学研究的考察来说明
安慰剂效应这一概念。在生物医学研究中,所有
的新药研究程序都必须包括对安慰剂效应的控
制。一般来说,如果在一组病人身上试验一种新
药,就要组建一个患同样病症的对等组,给他们
服用等量不含任何药物的药剂(安慰剂)。两组
病人都不知道他们吃的是什么药。这样,两组进
行比较时,安慰剂效应——即给予病人任何一种
新的治疗都会使他们感觉好些的这种倾向——就
能得到控制了。仅仅报告百分之几的病人吃了新
药后症状得以缓解是不够的,因为如果没有控制
组的数据,就不知道报告症状缓解的病人是由于
安慰剂效应,还是药物本身的疗效。
安慰剂效应在抑郁症治疗中是29%(即29%
的病人服用安慰剂后报告症状缓解了),在十二
指肠溃疡中是36%,在偏头痛中是29%,食道炎
是27%(Cho, Hotopf, & Wessely, 2005)。将安慰
剂效应与当下流行的抗抑郁剂百忧解结合起来,
将会最大限度地发挥药物自身的作用(Kirsch et
al., 2008)。安慰剂效应的效力是很强大的,以

至于曾有报告说有人对安慰剂成瘾(Ernst &
Abbot, 1999),这些人需要服用剂量越来越大的
安慰剂来保持他们的健康状态!一个怪异的研究
(见Begley, 2008)发现,一组接受了虚假外科手
术(有创口,但是没有进行实际手术)的被试,
和真正接受手术的被试一样,报告了几乎相同程
度的骨关节炎症状的缓解。与此类似,另一项研
究发现许多进行肩袖肌腱撕裂手术的患者报告他
们的疼痛消失了,虽然MRI显示结果表明他们的
撕裂没有痊愈(Kolata, 2009)。
这些例子解释了为什么接近一半的医生报告
说他们故意给患者开安慰剂(Tilburt, Emanuel,
Kaptchuk, Curlin, & Miller, 2008)。最后,安慰剂
效应会受到情境预期的调节。研究者证明
(Waber, Shiv, Carmon, & Ariely, 2008),价格较
贵的安慰剂比价格便宜的安慰剂更能缓解痛苦!
当然,在有关药物治疗的实际研究中,安慰
剂控制并不只是一个什么都不含的药片,而是含
有当前认为最有效的药用成分。实验比较的目的
在于揭示,新药是不是比当前最有效的药还要
好。
你每次吃处方药时都会得到安慰剂效应的提
示信息,下次吃处方药的时候(如果你非常健

康,就看看你祖母的药吧!),仔细查看一下药
物附带的说明书(或者登录药品制造商的网站浏
览一下),你将在药物问题说明里看到安慰剂效
应的信息。例如,我吃一种叫作Imitrex(琥珀盐
酸)的药物来缓解偏头痛。它附带的说明书告诉
我:控制研究已经证实,在服用一定量的药物之
后,57%的病人在两个小时内其症状得到了缓解
(我就是这幸运的57%之一)。但是说明书同时
告诉我,同样的研究显示,这类偏头痛中安慰剂
效应是21%——有21%的人在服药后两小时内症
状得到缓解,即使他们服用的药物里是中性材料
而非琥珀盐酸。
安慰剂效应在心理治疗中也很常见
(Lilienfeld, 2007)。许多有轻度和中度心理问
题的人,在接受心理治疗后说他们的情况有所好
转。然而控制研究证明:这一康复比例中,有相
当一部分是由于安慰剂效应和时间推移这两个因
素共同作用的结果,时间推移通常被称为自然康
复现象。大多数有效的治疗都是由于治疗效果和
安慰剂效应以某种不为人知的组合而产生的效
果。正如多兹(Dodes, 1997)指出的:“即使严
重的疾病也有恶化和缓解的时候,关节炎和多发
性硬化症就是典型的例子。”(Dodes, p.45)
大多数具有疗效的疗法都是有效治疗成分和

安慰剂效应的未知组合。多兹(Dodes, 1997)同
时也警告说,对于安慰剂的积极反应并不意味着
病人的病是虚构出来的,他还警告,与流行的观
念正相反,安慰剂可以是有害的:“安慰剂效应
能够通过证实或强化想象中的疾病来‘诱发’慢性
病。病人会对那些利用安慰剂效应的非科学从业
者产生依赖。”(Dodes, p. 45)
在关于心理治疗效果的研究中,怎样合理地
对待安慰剂效应控制组,往往令人颇费周折。但
是,这些复杂的问题不是我们在这里所要关注
的,理解研究者为什么要将药物治疗的真实效果
与安慰剂效应及自然康复区分开却很重要。
例如,研究表明,心理疗法确实优于只用安
慰剂所产生的效果(Engel, 2008; Shadish &
Baldwin, 2005)。但是,使用了安慰剂控制组的
实验也表明,仅报告有多大比例的人感觉自己有
所好转,会严重高估治疗的实际效果。问题就在
于,得到见证叙述简直不费吹灰之力。康奈尔大
学的心理学家托马斯·吉洛维奇(Thomas
Gilovich, 1991)指出:“人类拥有如此容易自愈
的身体,即使医生不做任何事情,很多寻求医学
帮助的人也将体验到积极的疗效。如此一来,当
自然康复的比率很高的时候,即使是毫无价值的
治疗手段也能显得有效。”(p. 128)简而言之,

无论干预的效果如何,只要运用治疗干预,潜在
的安慰剂效应就会显现。问题在于,安慰剂效应
是如此强大,以至于无论某个人使用的疗法多么
荒唐,只要是被应用于一大群人的话,总有一些
人会乐于为它的效果作出见证(清晨头部击打疗
法,每天使用让你神清气爽!给我寄10.95美元,
你就可以得到这个特制的、经过医学测试的橡胶
锤)。
但我们确实不应该拿这种严肃的事情开玩
笑。轻信见证叙述和个案研究的证据可能会导致
灾难性的后果。回顾第2章,曾为抽动性秽语症
作出科学界定——将之定义为器质性紊乱——的
研究小组指出,人们对于个案研究证据的错误依
赖,使得关于该病的、不可被证伪的精神分析理
论长期盘踞不去,阻碍了对于该病病理进行真正
的科学研究。发表在《新英格兰医学杂志》
(New England Journal of Medicine)上的一篇社
论,论述了在医学科学的从业者眼中个案研究和
见证叙述的地位。“如果这本杂志收到一篇论
文,说一个患胰腺癌的病人在服用了大黄根
(rhubarb)后康复了……我们可能会发表一篇个
案报告,但是,我们发表它并不是宣告它为一种
新的疗法,而仅仅是推荐它作为一个值得用正规
的临床实验进行验证的假设。与之相反,关于各
类偏方秘方的轶闻(通常发表在通俗书籍和杂志

上)则没有作出这样的声明,并且这些轶闻本身
也不足以作为支持那些疗效的文献。”(Angell &
Kassirer, 1998, pp. 839—840)

“鲜活性”问题
安慰剂效应的存在,宣告了见证叙述作为证
据是无效的。这么做尽管很痛快,但是我们必须
意识到,还存在着另外一个障碍,它阻碍了人们
理解这一问题。社会和认知心理学家已经研究了
人类记忆和决策中的所谓“鲜活性效应”。当面临
问题解决或决策情境的时候,人们会从记忆中提
取与当前情境有关的信息。
因此,人们倾向于利用更容易获得的、能够
用来解决问题或做出决策的信息。对可获得性造
成强烈影响的一个因素,就是信息的鲜活性。问
题在于,再没有比发自内心的个人见证更鲜活、
更引人注目的了,这都是一些已经发生的事或者
是真实的事。个人见证的鲜活性常常令其他一些
更可靠的信息黯然失色。购物时,我们在不同的
品牌前权衡了半天,最后却由于某个朋友或某则
广告对另一产品的推荐,而在最后一刻放弃了自
己的选择。买车就是一个典型的例子。在翻看了

《消费者报告》(Consumer Reports)中的数千份
消费者调查之后,我们终于决定要购买一辆A品
牌的车;又参考了几本汽车杂志之后,看到里面
的专家们也都推荐A牌子的车,这更坚定了我们
的选择。直到在一次聚会上,我们遇到一位朋
友,他说他一个朋友的朋友买了一辆A牌子的
车,结果是辆残次品,光维修就花了几百美元,
而且这哥们决定再也不会买这个牌子的车了。显
而易见,这样一个个案本不该在很大程度上影响
到我们的决定,因为我们是在收集了针对数千名
用户所做的调查报告和众位专家的评判之后才决
定要买A牌子的车的。然而,我们中究竟有多少
人能做到不把这个个案看得很重呢?购买汽车的
例子说明,鲜活的个人见证所造成的问题并非心
理学领域所独有。鲜活性会影响人们的决策,这
样的例子无论在哪个领域都不难找到。作家迈克
尔·刘易斯(Michael Lewis, 1997)描述了政治评
论家乔治·威尔(George Will)——一个声名狼藉
的反对政府干预的人,是如何在目睹了一场发生
在其家门口、导致有人死亡的车祸之后,发表专
栏文章呼吁强制使用安全气囊的。
设想一下,一个周五的早上,你在报纸上看
到下面这样一个标题:“喷气式客机坠毁,413人
死亡。”天啊,你也许会想,多可怕的事故啊!
发生了多么糟糕的事情啊!继续设想,在接下来

一周的周四,你起床看到报纸写道:“另外一场
空难,442人死亡。”“哦,不!”你也许会想,“不
要再有任何灾难了,多么可怕啊,我们的空运系
统怎么了?”然后想象一下——请尽可能地想象
接下来的周五你起床时看到的是:“第三起空难
悲剧:431人死亡。”不但是你,整个国家都会抓
狂的。联邦政府会被要求尽快调查此事,所有航
班禁飞,各种调查委员会如雨后春笋般成立起
来,还有海量的法律诉讼被提起。《新闻周刊》
和《时代》杂志将会对此作封面报道,它还会占
据近期的电视新闻节目的头条。电视纪录片将会
对此主题做深度挖掘。躁动和喧嚣是巨大而深远
的。
这并不是一个虚构出来的问题,它是真实
的。每周都有喷气式客机坠毁。也许不是一架巨
型喷气式客机,而是很多小型飞机;或者也不是
小飞机,而是小型交通工具,这种小型交通工具
叫做汽车。在美国,每周都会有350多人死于汽
车交通事故(每年超过19000人),人数足够坐
满一架巨大的喷气式客机的了。
每周在高速公路上死于车祸的人数,相当于
一架喷气客机的载员数,但我们对此漠然置之。
这是因为“能坐满一架喷气式客机的人死了”这一
信息没有通过媒体以一种鲜活的形式传达给我

们。因此,每周死于汽车交通事故的350人(加
上每周死于摩托车的80人),对我们来说不具有
鲜活性。我们在餐桌前不会像谈论一架喷气式飞
机坠毁并且死了很多人那样谈论这些死于车祸的
人,我们不会就汽车出行的安全性和必要性进行
争论。但是,如果大型喷气式客机每周都发生坠
毁,并且每次都导致350人死亡的话,我们就会
讨论空运交通的安全性。车祸中死亡的这350人
不会上新闻,因为他们分布在全国各地,因此对
于我们中的大多数人来说只是统计学上的抽象概
念。媒体不会为我们生动地呈现这350名死者,
因为他们并不是死在同一个地方。相反,媒体呈
现给我们的(有时候)是一个数据(例如,每周
350人)。这已经足够引起我们的思考了,但是
我们对此毫无反应。与我们生活中的其他任何行
为相比,驾驶汽车都是一种极端危险的行为
(Galovski, Malta, & Blanchard, 2006; Gardner,
2008; National Safety Counil, 2001)。然而,关于
它的风险和相对应的收益,从未有过全国性的大
讨论。这对于住在郊外、需要驾车往返的人来
说,是不是一个可以接受的代价?我们从不去问
这样的问题,因为问题还没被意识到,原因就
是:代价和风险没有像空难那样以鲜活的方式呈
现给我们。
想想下面这个例子的荒谬之处吧。一个朋友

开车20公里载你去机场,因为你要乘飞机作一次
750公里的旅行。分别的时候,你的朋友很可能
会说:“一路平安”,这个临别赠言其实是充满伤
感的讽刺意味的,因为你的朋友在回家的20公里
路上死于车祸的风险,要比你飞行750公里的风
险高出3倍。这就是鲜活性问题,它解释了A对B
的安全祝福存在着明显的不合理性,因为恰恰是
A正处在更大的风险之中(Sivak & Flannagan,
2003)。这些例子并非只是假设,在“9·11”恐怖
袭击事件之后,乘飞机出行的人数锐减,因为人
们害怕飞行。当然,人们还要继续外出旅游,而
不只是待在家里。他们只是改为其他方式出游
——大多数情况下都是自驾车。但是,自驾游比
飞行要危险得多,从统计学上讲,注定有更多人
因转成自驾游而死亡。事实上,研究者估计,在
2001年的最后一个月,有300多人由于乘坐汽车
而非飞机旅行导致死亡(Gigerenzer, 2004,
2006)。有一个研究团队能够以一种鲜活的统计
来传达出驾驶机动车有多么危险。西瓦克和福兰
纳根(Sivak & Flanagan, 2003)计算出,如果驾
车和乘坐飞机的危险系数是一样的话,那
么“9·11”这个级别的事故将会每个月都发生一
次!
这就是为什么尽管飞机上会推荐使用婴幼儿
专用座椅(具备核准的束缚紧度),联邦航空管

理局(FAA)也不对其进行强制要求(美联社,
2010)。他们不会这么要求的原因是FAA担心如
果强迫父母为婴幼儿买座位,很多父母就会选择
驾车而不是坐飞机——当驾车时孩子在父母的腿
上时,它们比在飞机上要危险得多。在我们日常
生活环境下,没有什么地方比让孩子呆在车里更
危险,许多父母只是认识不到这个事实。
我们很难在判断中避免鲜活性的影响。比如
说康奈尔大学,因其学生自杀率高而出名。我们
必须问一下为什么它有这个名声。之所以这么
问,是因为从统计上讲,它并不是自杀率高的学
校。事实上,它的自杀率在全美处于中下水平
(Frank, 2007)。它的名声和实际的统计数据没
有一点关系——与康奈尔的实际自杀频数一点关
系都没有。与之有关的事实是,康奈尔大学挨着
两道冰封的深渊峡谷——横跨峡谷的是两条令人
胆战心惊的桥梁(Frank, 2007)。无怪乎自杀案
件经常在这些桥上发生,当救援队在峡谷里找回
尸体时,往往会导致交通瘫痪,更重要的是,生
动电视画面拍摄到了自杀案的一组组镜头。而服
药过度导致的死亡则没有等量齐观的媒体报道。
可见康奈尔大学的高自杀率名声来源于生动性,
而不是统计数据。
在媒体的帮衬下,鲜活性误导个人判断的情

况也同样广泛存在于其他领域里。一项研究
(Cardner, 2008; Radford, 2005; Skenazy, 2009)调
查了父母最担心他们的孩子遭遇哪种风险。结果
显示,父母最担心的是孩子遭绑架,而这一事件
发生的概率是1/600000。相比之下,父母则不太
担心孩子在车祸中身亡的危险,然而这种可能性
比遭绑架要高出几十倍(Gardner, 2008)。同样
地,儿童在游泳池里溺死的概率要比他们被绑架
和被陌生人杀死的概率高得多(Kalb & White,
2010)显然,对绑架的担心大部分是由于媒体渲
染的结果。车祸、意外事故(包括枪支意外)、
儿童期肥胖、青少年时期自杀可能比绑架和鲨鱼
袭击对我们的孩子的幸福威胁更大,正如像科学
作家加德纳(Dan Gardner, 2008)写的那样:“我
们总是易受恐怖场景的伤害。”(p.84)举例来
说,这类“恐怖场景”导致了父母年年担心万圣夜
的有毒糖果,然而实际上从来没有一个记录在案
的事件说有任何孩子在万圣夜因为了吃毒糖果而
死亡(Skenazy, 2010)。
媒体制造的鲜活性效应,使得我们的风险认
知发生了紊乱。例如,不断增长的糖尿病发病率
导致了人们对其风险的低估,甚至低于对住院会
增加感染葡萄球菌的风险的担心,然而前者每年
影响4500万美国人,而后者仅影响1500人
(Fountain, 2006)。尽管就个人而言,我们对糖

尿病可以做很多事(改变饮食习惯和锻炼),而
对后者相对无能为力。
呈现的鲜活性甚至可以影响我们对科学证据
自身的解释。在一项研究中,被试看到一些针对
心理现象的描述和解释(Weisberg, Keil,
Goodstein, Rawson, & Gray, 2008)。其中一些是
好的解释(包括真实的心理概念),另一些是糟
糕的解释(只是用循环的语式对现象进行循环描
述,而不是解释它)。当这些解释前加了一
句“大脑扫描显示”时,对两类解释质量的评价
(尤其是糟糕的解释)显著地上升了。相似地,
麦凯布和卡斯特尔(McCabe & Castel, 2008)发
现,在认知神经科学领域,如果实验结论中包含
概括结果的脑成像图片,人们对这一结果可信程
度的评价要高于描述相同结果的图表。简而言
之,对科学结果呈现的鲜活性也会影响对研究的
评价。

单一个案的压倒性影响
一个很著名的关于人们如何对鲜活的轶事信
息作出不同反应的例子,来自于在20世纪60年代
中后期媒体对越战的报道。随着战事的拖延,美

军的死亡人数仿佛无休止地增加,媒体开始报道
当周美军死亡的人数。一周接一周地过去了,这
个数字在200至300之间徘徊,公众似乎已对这种
报道习以为常了。
然而,某杂志用几个版面的篇幅连续刊登了
前一周阵亡者的个人照片。这时,公众非常具体
地看到了在这样一个有代表性的一周内逝去的大
约250个鲜活的生命。结果,此举导致了大规模
的、针对这场代价巨大的战争的抗议声浪。250
张照片所产生的影响是每周数字报道所远不能及
的。但是作为一个社会成员,我们应该克服这种
不相信数字、必须眼见为实的倾向。绝大多数影
响我们社会的复杂因素都只有靠数字才能捕捉。
只有当公众学会像重视图像材料一样重视以数字
形式表达的抽象材料时,公众自己的立场才不会
像屏幕上闪过的最新图像那样变化无常。
2004年,一档叫做《晚间在线》的电视节目
在伊拉克战争一周年之际公布了在这场战争中死
亡的700多名战士的名字和照片。在这一时刻,
历史又重演了。这一做法与该档节目在“9·11”事
件一周年之际播放受害者的姓名和照片的套路完
全相同,当时这些照片的播放都征得了受害者家
属同意。

然而,死亡士兵的照片还是引发了战争支持
者的抗议。有些人控诉节目主持人泰德·考佩尔对
这场战事抱有敌意,但是这些指控显然瞄错了对
象,因为考佩尔并不反对这场战争(CNN.com,
2004)。实际上,战死的人数并非没有被报道,
这700多人死亡的消息日复一日地出现在这个国
家的每一份报纸上。但是争论的双方都知道,公
众尚未对那些数字进行“加工”——没有计算代
价,是因为那些数字还过于抽象。双方都知道很
多人在看过这些照片之后,都会从头对这些信息
进行加工,并开始真正在意战争的代价。
不仅公众受到鲜活性问题的困扰,在心理学
和医学领域,有经验的临床从业者一直都在努力
摆脱个别案例的压倒性影响给他们的决策带来的
阴影。作家弗兰辛·卢索(Russo, 1999)描述了弗
吉尼亚大学的肿瘤专家威利·安德森(Willie
Anderson)面临的两难境地,安德森一直提倡控
制实验,并会定期招募一些病人来做有控制的临
床测试。但是他仍旧纠缠于自己对突出个案的反
应,那些鲜活的个案对他的决策产生了影响。尽
管他相信科学,但仍承认“当真实的人眼巴巴地
看着你的时候,你将被他们的期望以及自己对他
们期望的期望所包围,这确实非常困难”(p.
36)。但是安德森知道,有时对他的病人来说,
最好的办法就是忽略“看着你的那个真实的人”,

并且遵循最佳证据的指示。最佳证据来自于有控
制的临床试验(将在第6章表述),而不是看着
你的那个人的情感反应。
总之,过于依赖见证证据的问题一直存在。
此类证据的鲜活性常常掩盖了更加可靠的信息,
并且混淆视听。心理学教师担心的是,仅仅指出
依赖见证证据的逻辑谬误,并不足以让人们从一
个更深的层次理解这类数据的缺陷。
我们还能做些什么呢?还有什么其他的方法
能让人们理解这个概念吗?幸运的是,我们还有
一个法宝——一种与学术方法略有不同的方法。
这种方法的本质是以鲜活性来对付鲜活性,是以
一种“以彼之道,还施彼身”的方法对付见证证
据,让见证用自身的荒谬来击溃自己。这个方法
的实践者,就是独一无二、毋庸置疑的“了不起
的兰迪”!

了不起的兰迪:以彼之道,还施彼身
詹姆斯·兰迪(James Randi)是一位魔术师,
并且是个多面手,他曾经被麦克阿瑟基金会授予
过“天才”奖。多年来,他一直尝试着教公众学会
一些基本的批判性思维的技巧。“了不起的兰

迪”(Amazing Randi, 他的艺名)通过揭穿“通
灵”骗术和庸医疗法来达到教育公众的目的。尽
管他拆穿了很多魔术和伪装的所谓“通灵术”,但
最为著名的还是他拆穿20世纪70年代通灵术超级
明星尤里·盖勒(Uri Geller)的把戏的那一回。
盖勒靠吹嘘通灵术红透荧屏,他对媒体的蛊惑程
度简直可以用无以复加来形容。各大洲的报纸、
电视节目和主要的新闻杂志对他争相报道(盖勒
仍健在,还在写书;Radford, 2006)。兰迪发现
并揭露了盖勒经常表演的通灵术“绝活”其实不过
是些普通和简单得令人难以置信的魔术把戏,包
括使勺子和钥匙弯曲、使钟表开始走动,等等,
这些对于一个优秀的魔术师来说简直就是家常便
饭。自从盖勒被拆穿以后,兰迪继续将他那非凡
的才智用于维护公众的知情权,他不断揭露超感
官感知、生物节律、超自然力、通灵外科手术、
天外来客、漂浮术以及其他伪科学的谬误,以帮
助公众了解真相(Randi, 1995, 2005, 2011; Sagan,
1996; Shermer, 2011)。
兰迪的另外一个兴趣就是去证明,对于任何
一个荒谬的事件或无中生有的言论而言,获得见
证是多么容易。他的手法就是,让人们掉进其见
证所编织的陷阱里。在一档广播节目中,兰迪揭
示了另外一种伪科学——生物节律能够如此流行
的原因(Hines, 1998, 2003)。一位听众同意每天

都记日记,并将日记与一份特别为她准备的两个
月的生物节律表做比较。两个月以后,她打回电
话告诉听众:生物节律绝对不是假的,因为节律
表预测实际行为的准确率超过了90%。兰迪不得
不把他的秘书所犯的一个愚蠢的错误告诉给这位
听众,秘书错误地将本该发送给另外一个人的节
律表发给了她,而不是她自己的。然而,这位妇
女还是同意看一下真正属于自己的表格是怎样
的,于是,又一份表格立即发送给了这位妇女,
并且请她再打电话过来。几天后,这位妇女带着
解脱感打进电话,说她自己的表格也同样十分准
确——事实上,更为准确。在下一期节目中,大
家发现,另一个错误发生了。这位妇女收到的是
兰迪秘书的节律表,而不是她自己的!
兰迪的生物节律和占星术小把戏,其实是一
种被命名为巴纳姆效应(Barnum, 著名的嘉年华
和马戏团的团主,提出了“每分钟都会有人上当
受骗”的说法)现象的范例。这一效应曾被心理
学家广泛地研究。研究者发现,大多数成年人都
会认为泛化的个性总结都是准确的,并且都是对
自己独特的描述。这里有一个来自谢尔默的例子
(2005, p.6):
你是一个非常体贴的人,总是及时地帮
助别人。但是也有一些时候,你会发现你有

一点点自私……有时候你太忠于自己的感受
以至于会暴露过多的自己。你善于思考,并
且对任何事情,在改变想法之前都希望看到
证据。如果你处在一个陌生的环境下,你会
非常小心,直到你看清楚发生了什么事情,
然后才会充满信心地行动……你知道怎样做
一个好朋友,你懂得训练自己,所以在别人
看来,都在你的一切掌控之中,但其实有些
时候你是缺少安全感的。你希望在人际关系
中比现在更受欢迎,更加自如。你面对世界
表现得很有智慧,这种智慧来源于艰难的体
验而非书本学习。
大多数人都发现,这个总结是对其个性非常
准确的概括,但是很少有人自发地意识到大多数
其他人也同样认为它描述了他们自己!许多众所
周知的语句和措辞(如这个例子)使很多人认为
适用于他们自己。谁都能够将其作为一个个人化
的心理“分析”提供给“顾客”,而这些顾客常常会
为个人化的“性格解读”的“准确性”而感到震惊,
却不知道其实每个人的解读都是一样的。
当然,巴纳姆效应正是手相学和占星术的基
础(Kelly, 1997, 1998)。巴纳姆效应还可以证明
产生见证有多么容易,以及为何见证毫无价值。
这就是詹姆斯·兰迪运用这些小把戏努力想要达到

的目的——给人们好好上一课,告诉人们见证证
据是没有价值的。他不断地证实,形成有利于虚
假主张的见证是多么容易。正是这个原因,用见
证来支持自己提出来的特定理论是毫无意义的。
检验一个主张时,只有来自有控制的观察中的证
据(第6章中将会描述)才是足够充分的。

见证为伪科学打开方便之门
有时候有人会说,类似刚才所讨论的种种伪
科学,只不过是人们给自己找乐子的一种方式,
无伤大雅。再者说,我们又何必较真呢?不就是
有几个人在异想天开,而另外几个人从中赚点儿
小钱吗?实际上,对此问题进行一番彻底的考察
就不难发现:伪科学的盛行对社会的危害比人们
想象的要严重得多。
首先,人们倾向于不考虑经济学家所说
的“机会成本”。如果你花时间做一件事,你已经
失去了做另一件事的时间。你也失去了花费时间
的其他机会。当你在一件事上花费了金钱,你就
失去了花钱做其他事的机会——你失去了让钱花
在其他地方的机会。伪科学存在大量的机会成
本。当在伪科学上花费了时间(和金钱),人们
不但没有收获,还浪费了本可以花在更有价值的
事情上面的时间。
对此问题进行一番彻底的考察,就不难发现

伪科学的盛行对社会的危害比人们想象得要大得
多,并且其花费超过了机会成本。在一个复杂
的、科技化的社会中,一些能够影响千万人的决
策会为伪科学的影响推波助澜。也就是说,即使
你并不认同这些伪科学的观念,你也可能受到这
些观念的影响。
例如,三分之一的美国人都喝无氟的水,尽
管大量的科学证据表明含氟的水可以显著减少蛀
牙(Beck, 2008; Griffin, Regnier, Griffin, & Huntley,
2007; Singh, Spencer, & Brennan, 2007)。疾病控
制中心估计,在氟上每花费1美元,在牙病治疗
上的花销会节省38美元(Brody, 2012)。无氟地
区数以百万的美国人正承受着不必要的蛀牙的折
磨,仅仅因为他们的邻居坚持相信伪科学的阴谋
论——氟有很多有害的影响。一小撮怀揣这类伪
科学观点的人已经让许多社区远离氟,并且对周
围的每个人渲扬氟的坏处。简而言之,少部分人
的伪科学观点会使大多数人受到消极影响。
再看这样一个例子,即使你不相信伪科学,
你也可能被它影响。大银行和一些500强企业雇
用笔迹学家来做人事选拔,即便大量的证据表
明,笔迹学在实现这一目的方面是没有作用的
(Lilienfeld et al., 2010)。伪科学的笔迹学指标
在一定程度上使雇主忽视了其他更有效的选拔标

准,导致的结果是经济上的零效益和对一些人的
不公平待遇。如果仅仅因为笔迹中有一个连写
的“小圈圈”,就让你丧失了获得一份很心仪的工
作的机会,你会作何感受?
不幸的是,这样的例子绝非凤毛麟角
(Shermer, 2005; Stanovich, 2004)。当伪科学的
观念渗透于整个社会的时候,我们都以不同的方
式受到影响——即使我们并不认同这些信念。例
如,警局雇通灵师协助办案,即便研究表明这一
举动是没有任何效果的(Radford, 2010; Shaffer &
Jadwiszczok, 2010)。没有一个记录在案的案例
表明通过通灵信息能够成功地找到失踪的人
(Radford, 2009)。
如今,类似占星术这样的伪科学是一项巨大
的产业,涉及报纸专栏、广播节目、图书出版、
网络、杂志文章以及其他各种传播渠道。星相学
杂志的发行量要比很多正规的科学杂志大得多。
据美国众议院老龄化问题委员会估算,浪费在医
疗骗术上的钱已经达到数十亿美元。简而言之,
伪科学是个油水颇丰的行当,数以千计的人靠公
众的盲信盲从而获得收益。
在抨击伪科学方面,一些协会和组织比心理
学更激进。2007年,美国联邦交易委员会

(FTC)对通过电视宣传和名人代言销售减肥药
物的四个商家处于了数百万美元的罚金。在宣布
罚款时,FTC女主席狄波拉·普拉特·梅杰拉斯
(Deborah Platt Majoras)试图教育大众道:“美
国人需要明白,个人见证不能代替科学。”(de
la Cruz, 2007, p. A10)与之相似,医学界的各类
组织都比心理学界表现得更为激进和勇猛。下面
就让我们看看由关节炎基金会出版、曾被美国众
议院老龄化问题委员会所引述的一套识别不道德
药品推销员的指南。
1. 他或许会提供一种用于治疗关节炎
的“特别的”或“秘密的”处方或设备。
2. 他会做广告,用的都是“