哈佛大学前校长 Lawrence Summers 讲过这样的话:
在开疆扩土的早些年代,很多人都参与了土地丈量工作,那时候要求几乎所有进入顶尖学府的大学生学习一些三角学知识,这很合理。而今天,学习概率学、统计学和决策分析这些基础知识才更合理。
大语言模型的到来,让我不由自主地思考 Lawrence 的话——或者说,我在思考“我如何存活于这个时代”。有一天我突然想到了一个自认为很妙的主意,何不回看大学时代学的东西(将近十几二十年前),看哪些东西至今还未过时,也许那些学科隐含着某种真理。于是我花了一段时间在我的日记里梳理,逐渐有了一些眉目。
令我意外的是,当年很多我最不喜欢的大一必修课都成了不过时的经典,反而是那些我喜欢的专业课成了最容易过时的东西。这些必修课给我提供了宝贵的思考工具,比如 Lawrence 提到的这些课。其中我认为是基础之基础的科目就是 Critical Thinking(批判性思考)。其基础之处在于,它为我提供了一种评判其他理论的科学方法。分类和品鉴其他理论使它成了一种元工具。
上面提到的这一类科目我暂且称它们为思考工具课,另一类课我称它们为人类文化课。很可惜我上的大学是一般性的大学(university),期间没怎么接触过品鉴人类产物的课程,但是从文理学院(liberal arts college)毕业的学生就对宗教、科学、文化、艺术、音乐、设计、市政建设和政治等等学科有着更全面的认知。透明盒子计划的校稿员、也就是我的太太,就曾是文理学院的学生,从旁观者的角度,我观察到了这些人类文化课带来的价值。这些庞杂的人类文明知识为我们提供了更好的理解世界的框架,也让我们跟大语言模型对话时更轻松、收益更多。至少,你可以向 Midjourney 轻松表达出你想要的画面风格。
我想写一些有关 Critical Thinking 的通讯,但是大家都学过相关课题,这对我和读者有什么用呢?我把它视为一种复习、一种提醒和一种练习。在我回忆和梳理大学科目的时候,我第一个划掉的两门课就是日语和法语,不是因为它们过时,而是因为我的工作和生活并不需要它们——因为不常用,我都忘得差不多了。思考方式也是一样,“我们知道它们”和“我们使用它们”是两回事。
“复习并使用它们”是一方面。另一方面,当下环境和不远的未来都需要我们有更清晰的思考。Stuart Russell 在他的《Human Compatible》一书中,将人工智能和不是那么智能的社交网络做了对比。同为人类的发明,前者的最新模型 Claude 3 的智商测验已经超过了人类的平均水平,而后者,虽然没那么聪明,却已经把人类文明搅和得鸡犬不宁。作者以此来言明研究“可控人工智能”课题的紧迫性和必要性。对我和大多数读者来说,我们都是这两种科技的使用者,在使用社交网络和大语言模型的时候,我越来越觉得有一套科学和高效的思考工具是极其必要的。
接下来我将继续写一些有关思考工具的通讯。
这次我想聊聊 Opinion(主张/观点)、Fact(事实)和 Science(科学)。
当我们可以用一个观察去证明一个陈述时,它就是一个事实。也就是说,事实有真假之分。事实是可被验证的。而主张却没有真假之分,它表达了一种信念、态度、价值观、评判或感觉。举个例子:
我们不应该吸烟——是一个主张
吸烟会引发多项疾病——是一个事实
大部分主张性的陈述很好辨认,它们通常有诸如“应该”、“必须”这些引导性的词,或者有非常主观的形容词,比如“漂亮”、“差劲”、“好/坏”、“糟糕”、“伟大”等等。
然而并不是所有的主张都那么容易辨认,其中最有迷惑性的类型是预测。很多时候主张会被包装在专业术语里,通过预测表达出来。比如动物学家预测某种动物将在50年内灭绝,这就是一种有根据的观点。这种观点基于证据、研究和专业知识,但因为目前无法证实,所以不是事实。很多未来学家的文章和书籍便属于这个范畴。而说到未来学家的作品,有一类主张就更难辨认、甚至更难辩驳,就是被史学家和未来学家总结归纳出来的“铁律和法则”,在英文里,它们通常被命名为“某某 law”,好像跟物理法则一样不可争议。但如果你仔细想,它们都只是观点,不是事实。
事实是可被验证的。这令我想到了影响现代科学基础的一个观点,就是哲学家 Karl Popper 在他的《All Life is Problem Solving》一书中写的这句话:“A theory is part of empirical science if and only if it conflicts with possible experiences and is therefore in principle falsifiable by experience.” 就是说当且仅当某个理论可被证伪,该理论才属于实证科学。
20世纪初,源于维也纳学派的逻辑实证主义(logical positivism)开始流行。他们的核心理念是围绕着“可被证实性”展开,只有被我们感知和观察到,或者在逻辑上推演成功,某个陈述才被认为是真的(true)或是有意义的(meaningful)。这个理念的目的是将科学牢牢固定在经验证据和逻辑推理的基础上。
然而 Popper 发现逻辑实证主义是有问题的,比较核心的三大问题是:
验证主义排斥泛化的论述,比如“所有天鹅都是白色的”,他们认为这种论述没有意义。而 Popper 认为,虽然泛化论述无法被验证,但它们可以被证伪。而且 Popper 认为,泛化在科学上是有用的。
验证主义允许一些明显错误的存在论之陈述,如“狐仙是存在的”,被归类为有科学意义的陈述,因为人们有可能在某个地方找到狐仙,只是还没有找到。
逻辑实证主义是不自洽的。根据其自身的逻辑,验证主义是没有意义的,因为它无法通过经验验证。
在这样的大背景下,Popper 提出了自己的理论,认为应该用“可被证伪性”(falsifiability),而非“可被证实性”(verifiability),来区分什么是科学、什么不是科学。用这样的句式来看会更容易:
可被证实性:如果 X 发生了,那么理论 Y 就成立。
可被证伪性:如果 X 发生了,那么理论 Y 就不成立。
(似乎跟 Essay#2 有异曲同工之妙?)
这里需要强调一下,上述 X 并不一定得是我们可以观察到的现象,也可以是思维试验。所以像爱因斯坦和波尔关于光盒试验的辩论是属于实证科学范畴的。
可被证伪性有更强的测试性。越来越多的 确定性证据 并不一定会增强一个理论的真实性,我们已经在 Essay#2 里聊过确认偏误。而越来越多 失败的证伪 却能增强一个理论的真实性。正如自然选择,存活下来的物种一定在某些方面具备超强的健壮性和适应性。(我一直觉得 fitness 这个词很妙,它既能描述健壮性,也能描述适应性。但或许,根本上来说,它描述的是同一种特质。)
顺着可被证伪性,我觉得还有一个很有意思、有一点点反直觉的推论:一个好的理论必须有风险性,这里说的风险是被证明错误的风险。否则那个理论有可能并不在科学范畴内,要么它是个事实,要么它并不属于科学。
讲到这儿,我们可以捋一捋这三者的关系了。科学是介于观点和事实之间的存在,它基于事实和推理,却用以描述未成事实的观点,但它不同于观点,它有正确与否,可被证明也可被证伪。
那么我门可以怎么使用今天提到的这些区别的呢?对我个人而言,使用得最多的地方就是在社交和新闻媒体里。利用这些区别,我订阅以 fact 和 science 为主的账号和新闻,对观点性文章有清醒的认知。在使用大语言模型时,教导模型只使用 fact 以减少幻想。在校验无论是来自媒体还是大语言模型的言论时,大部分时候运用“可被证实性”就行,但有些时候,也要使用“可被证伪性”。大家都怎么使用这些区别呢?不妨分享在评论区。
一些更新
从上一篇通讯,或者更早些时候,我开始想怎么实质性地推动社区的形成。我在看一些跟社区建设有关的书,其中有一本叫《Get Together》。开篇讲到了纽约的一个跑步俱乐部——We Run Uptown(WRU),它面向所有当地想跑步的人(who),解决的问题是如何鼓励彼此持之以恒、保持良好的运动习惯(why)。正如这本书所说,只有找到了 who 和 why,才有后续的 when what how。
于是我开始问我自己这本书里提的问题:
Who do I care about?(我在意那些人)
Who do I share an interest, identity, or place with?(我跟哪些人有共同的爱好、身份或地区)
Who do I want to help?(我想要帮助哪些人)
我得到的答案是“想要/喜爱阅读的人”。
接着是这些问题:
What do my people need more of?(我们这类人需要啥)
What’s the change we desire?(我们希望看到什么样的变化)
What’s the problem only we can solve together?(什么问题是只有我们在一起才能解决)
在这方面,我无法代表这个群体,所以我完全是站在自己的视角回答。我的答案是:
我们需要更多时间阅读和思考;
我们希望更多人加入这个群体,彼此陪伴、鼓励和解惑;
能一起解决的问题就是彼此陪伴、鼓励和解惑。
不知道是不是受WRU案例的影响,我觉得我们不需要读书会那么复杂的东西,可能我们只需要一些约好了陪读的人。不需要读一样的内容,只是约好时间和(虚拟)地点,准时出现。这样,我们就有理由在百忙之中辟出一块只属于自己的阅读时间了。去年我顺着这个思路试验性做了一阵子(未公开的)陪伴式直播,那样的形式是否有用?我不知道我的想法是否合理,所以还请大家留言告诉我。
第二则更新是,春节前我联系了透明盒子计划的 Founding Members,聊了一下社区的想法。在讨论的过程中,我们逐渐产生了一些假说。比如,根据观察,我们认为相较 substack,telegram 可能更适合社区的形成和交流。再比如,加入一些经济学元素,可能可以更好地激发出好的对话。
但是这些都还只停留在假说阶段,它们是否合理还需要我们进一步试验去验证和证伪。近期我们会开始开发试验用的社区 bot,很快就会邀请愿意参加的朋友进来。
第三则更新。从二月初,我开始尝试制作第一个给阅读者和写作者使用的工具型App。即便在人工智能技术的又一个繁荣期的当下,我依然认为阅读无法被取代。除非哪天我们能把权重/模型直接下载到大脑,否则我们的大脑跟机器学习模型一样,依然需要通过阅读和思考来“训练”。如果外脑无法在内脑产生锚点,我们还是无法高效学习和思考。但这并不代表阅读者和写作者的工具不需要创新。所以我想要给这个人群做一些工具,为此,三月初我正式注册了公司。
我想告诉你们幕后发生了什么,以及我的想法,公开透明地聊一聊这件事。因为我有限的精力分给了创造工具,就势必会减少用于写作的时间。对那些付费订阅的朋友,我感到抱歉。如果你是为了读那些文章而付费订阅,我可能并不会高频发表,但我还会继续更新。如果你是为了支持我的工作而订阅,谢谢你,不管我发表频率如何变化,我保证那些支持都会去到了它们该去的地方。无论你是哪类付费订阅者,我都会把那些App免费给你们使用。
可以考虑建一个Telegram 读者群🌊