大数据与人性

最近一段时间,“大数据 ”成了创业圈里最热门的概念。人们一直在给世界留下了各种痕迹,日出而作、日落而息;血脉繁衍、生生不息,列国喧攘、高峡平湖;花前月下、爱恨情仇,如此种种。随着互联网进入宽带时代,社交网络和智能手机愈加普及,人们的很多偏好以数据的形式被记录下来。喜欢读的书、喜欢的音乐、向往的地方、愿意加为好友的人 …… 与之相伴的是人们在线时长正在不断增长,于是这些数据以惊人的速度增长,以至于人们发现对这些数据的分析可以还原人本身。更诱人的是,人们可以通过对大量数据的分析预测未知,这将孕育出惊人的商业机会。

这样的商业案例不只发生在美国。自媒体 “云科技” 说,一家中国公司正在通过从社会化媒体上抓取的各种数据提前预测票房,这些数据包括一个演员毕业的学校、毕业时间、在哪里长大、出演的角色、收视率和票房如何、出现过什么绯闻、跟谁关系好、什么样的网民如何评价等。这家公司对演员选取了 50个参数,对电影选取了 30 个参数。这些参数貌似古怪,但是每一个都和一个电影的票房相关,根据这些参数,这家公司预测电影《 1942》的票房是 3.8亿,会亏本,华谊认为这个数据是在 “黑他们” ,但最后的票房是 3.6亿。

大数据的惊人预测能力背后最有意思的事情是,人们选取的是 “貌似古怪” 的参数。因为人们只知道分析时选取的这些参数和要预测的结果相关,但是并不清楚知道彼此之间是什么关系,换言之,人们只能知道 “是什么” ,不知道 “为什么” 。《大数据时代》的作者舍恩伯格说,建立在相关关系分析法基础上的预测是“大数据分析的核心”。作者宣称,通过去探求“是什么”而不是“为什么”,相关关系能帮助人们更好地认识世界。

为了佐证这一结论,作者在书中列举了不少成功的商业案例:两个看不出有因果关系的事情,彼此之间却是关连的,对两者的研究和运算足够发掘出巨大的商业机会。这就仿佛前述案例,一个演员是东北还是河南人,和一部电影的票房有关,但是谁知道是什么关系呢?可是它对运算和预测有用,以此为模板来指导电影投资,就仿佛手中握有了预测票房的水晶球。

作者承认这一观念有悖“常理”,毕竟人们都希望通过因果关系来了解这个世界。相关关系重于因果关系,这一观念真的有道理吗?而那些言必称大数据的投资人、创业者乃至政府官员真的知道,这背后的意味又是什么吗?

有意思的是,《大数据时代》这本书首先将该概念引入中国,但是中文版的三位序言作者却表现出三种完全不同的态度。田溯宁先生延续了多年以前他倡导中国“宽带革命”时的宏大表述,再次把大数据和国家命运兴盛相关连,完全忽略了“大数据分析的核心”这一问题;中国互联网的实践者和思想者谢文先生则意识到这一点,但将这一问题“留待学者们慢慢研究”,鼓吹这一思想可以“创造巨大的经济或社会效益”;惟有本书的译者,青年学者周涛教授不同意舍恩伯格的看法,并担忧说放弃对因果性的追求,就是放弃了人类凌驾于计算机之上的智力优势,是人类自身的放纵和堕落。 周教授的担忧至少是值得赞赏的。作为大数据概念的引入和鼓吹者之一,他没有像其他人那样,对来自西方的最新概念生吞活剥,或者以完全功利主义的心态对待之,相信大家对过去几年满座皆高谈“蓝海”、“长尾”的景象记忆犹新吧。

如果中国的从业者们一方面对“大数据”趋之若鹜,另外又对这一概念背后的核心不关心,不感兴趣,他们会拿出什么样的商业创新是让人担心的。正如投资了分析电影《 1942》票房的数据公司的那位投资人说:“程序员不懂社会规则,他要去学一学社会学”。
舍恩伯格的《大数据时代》一书,附题是“生活、工作与思维的大变革”。其实对于一个哲学家或者关心人类思想流变的学者来说,他的观念充其量只是一种回归或者反思,完全称不上“大变革”。

事物本就存在着多种相关关系,人类把其中的一种命名为因果关系。人类拥有有灵性自由,所以他虽然处在有限的时空中,却可以仿佛在永恒中一样,对在时间和空间中发生的一系列事件重新排序。比如把发生在前面的事件认为是原因,其后的事情认为是结果,又可以按照自己的理解,把同时发生的一系列事件中的一件认定为原因。这是人类的理性之光。

人本主义思潮兴起以后,人们拥有了一种乐观主义精神,相信人的理性是准确可靠的,而单透过理性就可以建立一套认识真实( reality)的真确和统一的知识。如果这是可能的话,人在宇宙所遭遇的一切,以及人所有的事情和思想都可以得到满意的解释。

上述观念原本只是一种假设,或者说是哲学观念,但是人们不加思考地接受了它,于是 世界万物间似乎只剩下了因果关系,世界成了一个封闭的机械系统,就像自然神论者所认为的那样,上帝创造了一个精密体系,然后不管了,世界就按照因果律运转着。原本因果关系只运用于物理、天文、化学范畴,到后来,这种机械式的因果关系也统治了心理学、社会学,统治了人类自己。

舍恩伯格说,“如果说我们做的每一个决定或者想法只是其他事情的结果,而这个结果又由其他原因导致的,以此循环往复,那么就不存在人的意志一说了,所有的生命轨迹都只是受因果关系的控制了。”这样,人生就是在一个个因果循环中走向必然的终结,人与人之间的爱,人生的意义无法影响这个封闭体系,因而毫无意义。

每一个人的内心都表明,人和禽兽不一样,总是需要爱、温暖、意义。当人面对苦难的时候,因果报应的解释,只能让他们恐惧、愤怒,无法承受。只有理性之光,没有情感之热,这不是一个整全的人,而是具有毁灭力量的高级机械。

周涛教授无需过分担心,如果大数据时代,计算机对数据的分析,可以让过分沉迷于因果关系的人们对世界,其实也是对人类自己有一个更开放性的解释,这无疑是有意义的。人类对因果性的追求如果到了过分的地步,人类所独享的爱、意义、超越时间的思考能力等等被完全抹杀,其实恰恰贬低了人类自己,把人类也变成了机械性的一部分,这才是人类的“堕落”。

这并不只是哲学家关心的事情。中国的投资人、创业者们都垂涎于大数据时代的社交媒体所展现的商业前景。他们发现,扎克伯格的成功也许在于他在哈佛学的是心理学;他们意识到,社交媒体能“体现、放大和改变”人性,而要让用户心甘情愿地跟着自己走,他们需要了解人性。

由于基督教信仰的洗礼,西方思想中有比较完整的“人论”:人有灵性的自由和尊贵,但人又是有限的,远非宇宙的中心,需要谦卑;人与人之间是关联的,彼此需要,这些观念已经是文化中隐含的前提。比如舍恩伯格虽然鼓吹大数据分析是一个利器,但在书的最后仍不免提醒说,大数据并不是一个“充斥着运算法则和机器的冰冷世界”,人类的直觉、冒险精神、意外和错误仍然重要,使用大数据这一工具的时候“应当怀有谦恭之心,铭记人性之本”。

在社交媒体的大时代,用户体验前所未有地重要。这种体验远非是UI设计那么简单,每一个社交媒体用户首先是人,人究竟是什么,和物相比,人的特别之处是什么?同时,满足用户的需求也不会只是激发人的肉体情欲,还将包括尊重、关注、同情、怜悯等很多看不见但存在着的需要。

在我们这个把人仍然只视为生产要素、资源消耗者的国家,这是一个巨大的挑战。对于热气腾腾,野蛮生长的中国互联网界来说,对“人性”这一似乎很不商业的概念的把握,应该会决定很多公司的命运吧。