Taleb on Econtalk

开年以来,百年一遇的瘟疫突然而至。接踵而至的是一系列从未的有过的事件。比如美国原油期货五月合约的价格跌至-30美金。在金融里面,称这种不期的极端事件为黑天鹅。而谈到黑天鹅,就必须说说Nassim Taleb。

Nassim Taleb因《Black Swan》这本书而闻名。或是冥冥之中,或是先见之明,这本书初版不久后,08年的金融海啸便席卷全球。在这本书中,作者启发式的阐释了不确定性理论。可惜的是,作者本人是位极其低调的数学家和交易者,公开接受采访的次数很少。

接触EconTalk这个节目是三年前,起初是为学习英语听力。学习听力的要点就是重复大量的训练。所以关键就是寻找训练材料。而浩如烟海,包罗万象的Podcast节目无疑是个好去处。平时,我也对经济相关颇感兴趣。兴趣是最好的老师,在收听这个节目时,也学到不少其他知识。

似乎节目的主持人和Taleb有着不错的关系,Taleb在节目上出现的频率不低。有点像3Blue1Brown经常客串NumberPhile节目。所以本文是对其中其中一次访谈的批注。


We favor the visible, the embedded, the personal, the narrated, the tangible. We scorn the abstract.

Fooled by Randomness

Confirmation bias is not taking seriously what you don’t see. Works well in primitive environment but not in less primitive environments. Real world has many observations dominated by fat-tailed distributions-dominated by a small number of observations.

我们通过对世界的观察来认知世界。在Taleb的眼中,人们之所以对黑天鹅事件存在认知缺陷,并非对它们轻视,而是因为人们的经验不足。在权力的游戏里面,狼家的老嬷嬷总是叹息的说道,凛冬将至,而生在盛夏的年轻一代 ,却总是对此莞尔一笑。其实从生物进化的角度,忽略这种极端而稀少的事件,可以简化日常决策模型,从而获得进化优势。试想,人们的祖先,总不能因为附近有狮子吃人的传闻,而饿死在山洞?

Law of large numbers–as your sample becomes very large no single instance can influence the total. Converge to some stable average. Normal or Gaussian distribution characterizes Mediocristan.

但是黑天鹅事件的特点在于,稀少但是极具破坏性。这个世界在很多时候并不符合正态分布,或者说是,并不依据大数定理,在大样本的条件下,新事件出现对原有分布的改变很小。而世界的财富分布正是一个恰当的例子!少部分人拥有不成比例的财富。比尔盖茨的财富偏离中位数收入往往不能用几个Sigma来衡量。

美国财富分布

这种现象也遍布自然界。之中最为典型的就是地震的分布。具体来说地震发生的次数和其破环能力并非线性。其能量的分布也并非高斯分布。比如里氏4级的地震即使发生上万次也远不如一次里氏8级地震的威力。虽然相对4级地震,8级地震十分稀少,但是它的破坏力是毁灭性的。人们时刻祈祷着这类事件永不降临,即便来临,唯一的应对也是恐慌。当下,Covid-19的大流行(Pandemic)是一个可观察的过程。

地震的分布

In Mediocristan, you don’t need to sample everyone. It’s cost-effective to use a small sample. The size of the sample may vary, but some small sample will do. The top 100 stocks won’t be enough of a sample to protect you; you probably need a broader index, say 500; but you still don’t need every single stock in existence. 

对于符合高斯分布的部分世界,过多的样本是不需要的。高斯分布的特征极为明显,很小的样本你就能估计出分布的特征。具体来说,高斯分布是对称的,均值和方差的估算很显而易见。在获得均值和方差之后,分布的概貌基本上浮现在你的脑海里面。身高的分布是一个较好的例子。对于普通人的身高,你并不需要详细地统计所有人的身高。透过日常生活中的观察,你基本就能得出对应分布的区间了。

高斯分布

They were fooled by small sampling. They’d had many good years in a row, and had forgotten about the small probability of a very bad thing happening. This kind of error is pervasive, way beyond financial markets. Skeptical empiricist: don’t just tell me the narrative, the ex-post story, but give me the data so I can figure out the general distribution (which will include estimating the probability of extreme events). 

The more data, the worse our statistical knowledge will be! The more you read the newspaper the dumber you get. Sometimes the profusion of information is misleading. “Once you have a theory in your head you are going to just look for confirmation.” you make errors if you only rely on stories and experience.

相反的是,对于极端事件,这种依赖于小样本的认识方法是无效的。 一来,人们的认知有着惯性,着重于不远的过去,类似于马尔可夫过程。此外,人们的认知也具有偏向性,一旦在心中形成一个认识(narrative),剩下的就是为故事(story)寻找素材(proof)。正像孩童希望的盛夏时光永不凋零,黑天鹅降临前的交易员们期盼着市场会继续高歌猛进。而因为这种偏见,这种盲目的自信,更多的数据只会让人在错误的方向上渐行渐远。更深一层,就如同“谈谈恐慌”里面所述,人们往往编织更大的谎言来弥补之前的谎言,更大的泡沫遮盖之前的泡沫,直到整个系统达到极值。


接下来,Taleb谈了下统计学(Statistics)作为伪科学(pseudoscience)的存在。

George Stigler anecdote: when he was a young economist, if you wanted to test a theory, you might run only three or four regression analyses and you spent a lot of time thinking about what variables to test because you had to do a lot of computation by hand. Today you can run hundreds of regressions, and you can easily convince yourself that the “good” ones are the ones that worked out.

Taleb举出的这个例子挺有意思的。当时这个采访发生在2007年,4G所带来的数据流量浪潮尚且遥远。Taleb的Fooled by the randomness的看法在人工智能盛行的当下尤具有启示。就像例子中的经济学家,或许人工智能并非能找到更好的模型,而仅仅是用强大计算能力和海量行为数据的指引来说服人类,这就是最好的算法。

“Is this person skilled?” with regard to financial markets, the answer is “I don’t know.” You can’t infer skills from success; but we reward it the same way. “We are more likely to mistake the random for non-random than the non-random for random,” because of behavioral bias and statistics masquerading as science.

星星的分布是杂乱无章的。

进一步来说,人的大脑从一开始,就善于寻找规律(Pattern),将散布的事物抽象,联系成理论。试想千百年前的古人,遥望星空,满天繁星,璀璨银河,星罗棋布,却能在这混沌星空中,奇迹般的绘制出星座图。这种化混沌为秩序的能力,确实是人们大脑的最神奇的地方。这种能力,在某种程度上促进了人类从漫步到迷信,自迷信向科学。具体来说,中世纪的星相学确为天文学的先祖,而天文学则是近代物理的开端。但依照这种方法,对世界的认识不但具有局限性而且会有所偏颇。世上大多东西确是无迹可寻的。最为明显的就是人生,有言道,成功的道路各不相同,失败的方向千篇一律。人生就是一个独立非同分布的随机过程,充满着未知和希冀。对因果理论甚求的我们,自然而然对成功学理论推崇备至。但这种理论本身就是对自然的误解,人的成功,就是随机的运动结果,换句话说,应归功于运气(just lucky)。另一个例子便是当今阴谋论(conspiracy)的盛行。人们对于自然降至人间,尚无定论的灾难需要替罪羊(scapegoat)(义和团时,对传教士的种种传说)。故事的确是动听的,煽动的,易于理解的。

Very little is found by controlled experiment. Trial and error is inherently hit and miss. Most successful books and movies are often not predicted.

但各位无需因“痛失”成功理论而悲伤。世界这随机的属性给人类带来的欢乐远多于痛苦。盘尼西林(penicillin)的发现恰巧是实验中所产生的“误差”。谁能想到,微波炉的发明竟是源于设计雷达的失误?对这随机的世界,多多尝试是不枉的!

世界的随机并不意味着摒弃努力,将一切付之于运气。核心问题就在于: distinguishing skill from luck 。你既不能因为交易成功的偶然因素而否定交易员的投研能力。你也不能因为某些来自偶然的科学发现,而忽略其背后的汗水。正如Taleb所说的,you need make your own luck。对于知识的追求就绝不能停滞在既定的知识框架之内。为学者应跳出框架,投身于现实之中。体会到:Knowledge as a vast, unknowable landscape。

 In typical ecological uncertainty, by contrast, you are unsure about the rules, don’t know probability structure.

在Taleb眼中伟大的经济学家或不是现在的Economists,编制一些规则,罗列一堆指标,塑造一串模型。伟大的经济学家,往往是政治经济家,是哲学家。譬如开山祖师,亚当斯密在《国富论》之前便有《道德情操论》。波普尔则对科学及非科学的批判一针见血。自由经济学派的海耶克也认为自己先是一名哲学家。


 Gaussian distribution tells you how much data you need to identify it, self-reference. Using the data you first have to discover the distribution you need. Only with the Gaussian distribution can you do this and easily find the parameters. 

 Prediction is a kind of therapy. Have to look at your error after the fact. Forecast error is central to decision-making. 

Taleb在最后给出自己对世界的看法:

 “I want to turn knowledge into action”–Marx critiquing Hegel–vs. Taleb–“I want to turn lack of knowledge into action.” We should embrace the phrase “I don’t know.” 

马克思的唯物史观批判了黑格尔的唯心论,指出应能动地改造世界。但社会理论远非科学那么明了和简单,甚至科学本身有时也是无法自我解释的。就如爱因斯坦无奈的说到:上帝或在掷骰子。我们对社会的认识远非完备。从而,有时急匆匆的对社会进行科学改造的会带来了空前的苦难。

“知之为知之,不知为不知”,正是不知指引我们的行动,而这正是与黑天鹅起舞(extremism)的第一步。

作者: user

无趣的人。