公佈欄:2017九月,每個人的難都不太一樣|站長的話:寫下我看見的東西可以悄悄提醒我是誰,如果還能幫你找到你自己,那就更好了。
2014-04-22

【觀察:大數據】

數字,將會再一次地席捲我們的未來?


網路上觀看一場座談會,與會者提到寫故事來說東方人相對於西方人,似乎較多描述過去,較少編織未來。這番論調讓我的腦子很受刺激,的確,我從未這樣想過,他說得一點也沒錯。


未來,使我聯想到虛擬、科幻以及高科技等等字眼。這跟看老美的電影長大有關,當然,也與我自己發育不良的想像力有關。受了刺激之後,我嘗試跳開這幾個字眼來幻想未來,卻是困難,腦子還是一些飛來飛去的裝置或是黑漆抹烏的外太空,或許,我想錯方向了。

「未來是什麼模樣?」這個問題太大了。「未來可能有什麼?」這個問題或許腦子還應付得來。我想到了統計學,怎麼說呢?這門學問已經在這個世界上兩三百年了,沒有新花樣,可是這一兩年來,連我這樣的終端資訊接收者都看見了一些不同於以往的變化,也就是統計學專業人士依然唱著我還是原來的我,但是,能讓他們開演唱會的人會有一番氣候。

這思路得從電視連續劇開始說起,BBC有一部出名的政治題材電視劇叫做紙牌屋(House of Cards),前兩年給老美的一家叫作Netflix的公司拿去做了一個美國版。我追了兩季的進度,查了中文版小說的資料,延伸找到小說簡體中文版的譯者在網路上淺談了一些翻譯上的甘苦:「原著作者 Michael Dobbs 這個人的文字很有意思,用字很單純,幾個字分開來看都是簡易的英文單字,放在一個句子裡,卻變得很困難把意思翻成中文。
「譯了原版之後,觀察美國版,故事結構沒變,卻增加許多與美國政壇實際發生過的影射,以及美國本土化的角色背景。相形之下,後者說得比較含糊。」

藉由譯者看法的啟發,我產生一種「量身訂作的人情世故」的想法,訂作的對象不是人物,而是觀眾。

Netflix線上租片起家,網路付費隨選視訊,在NASDAQ掛牌。前兩年股價翻了三倍什麼原因沒人知道,股票飆漲的原因是很難說穿的。

在製作紙牌屋的時候,使用了大數據(Big Data),或說巨量資料分析,透過他們以往所記錄客戶選租的影片類型,有好感的演員,導演,什麼情節會快轉、暫停或是回放。反覆抽樣得到的分配結果,作為編寫新故事的重要依據,或許說,重要商業趨勢分析。所以我會形容,它的角色與情節是給觀眾的私人訂制,會看政治題材的觀眾,在觀賞的時候自然能感受到一股說不出來的魔力。

統計分析數據,有何稀奇?棒球界也有,其他領域更是,不以為然的聲音還不在少數。的確,如果只看數據,抽樣與分配,許多經驗人士不需要大數據,也能看出所謂的多數人在想什麼,要什麼。我也這麼認為,所以沒有再繼續想下去,直到我看了乏善可陳的美國隊長續集,刺激又回來了。

大數據,雨木散文故事

世界很有意思,正邪對立時,往往是反派擁有較多的資源與較高的科技。正派能擁有的,普遍不如反派,唯有一顆善良的正義之心,是反派所沒有的。美國隊長續集裡的九頭蛇軍團,有位德國科學家傾心研究大數據,他認為透過研究特定人得過去行為,吃喝拉撒,可以對於他們未來會有的行為,做的選擇,大大提高預測的準確度。的確,統計學裡的常態分配,也就是中央極限法則下的鐘型圖,主要是指呈現極端者少,呈現中間者眾。人的行為也是如此,說白了就是習慣,人未來的行為肯定含有過去的習慣,現今科技逐漸可以支撐大數據分析上所需要的資源,統計學本身的意義也就是一種準確性的估計,只是本來想的是用小樣本估計大母體,現在玩的是大數據化,用過去估計未來,商業趨勢,疾病管制,甚至……想想任何可能性,我不寒而慄,不是預測未來,而是提高預測的準確性,這就像是有的人聽聞100%不如99.99%更加可信

大數據或許有一天會破壞人與人之間的動態不平衡,但是,我認為只是或許,因為大數據確實是本葵花寶典,會不會落入狂人之手,誰也不知道。寫作這一篇備忘,乾坤的三個部分:系列之一動態不平衡(反射),系列之二大數據,系列之三善良之心。也許這三部曲,會讓我忙上好幾年吧。(0422.2014)

喜歡這篇觀察的讀者,也會感興趣

創用 CC 授權條款
本著作由雨木散文故事製作,以創用CC 姓名標示-非商業性-相同方式分享 4.0 國際 授權條款釋出。
關於作者
我的相片

聯絡方式:h.peichieh@gmail.com
-散文、小說,計畫出版
-精選電影,原創翻譯
以上是我持續在做的事情,希望可以帶給你一些藝文的東西。