Contents ...
udn網路城邦
走了的是很多還是不夠多?
2022/06/03 08:39
瀏覽2,544
迴響3
推薦34
引用0

我過去研究大數據分析的時候,很重要的一項研究內容就是言語分析,而且我研究的方向就是模糊語言分析。通俗來講,某人講一件事,說的內容都是非量化的詞彙,那我的工作就是從中分析再通過算法得出量化的數據。

」與「」就是非量化的詞彙,每個人對不同事物的多少的看待會各不相同,甚至對同一事物也會隨著條件的改變而改變,這就是一種主觀看法。而主觀看法,是沒有辦法用來定罪的。比如對販賣毒品定罪,就要精確到具體種類、重量。僅僅靠多少這種主觀詞彙,是沒有辦法定罪的。

我的工作,有一部分就是去量化這些主觀的詞彙,這就要依靠大數據分析,去判斷的具體數量。

比如對於孩子因為疫情走了。有的人會認為即使一個都是太多了,這個原因有很多。或許因為現在少子化嚴重,每一個孩子都很寶貴;或許是同情心,認為誰都不應該因為疫情走了。也有的人認為即使死十几上百成千上萬個也不夠多,因為他們不在乎這些。

如果在日常生活中,遇到你非常了解的人,他說的非量化的詞彙,你肯定能得出量化的數據,量化的準確度就在於你對他的了解度。如果換成大數據分析,那就是通過電腦來代替人去分析這些數據,通過算法得到量化的數據。

假如你有一位好朋友,很富有同情心,那麼對於孩子因為疫情走了這件事,如果他對此評價是「太多」,那麼你對此量化的數據一定不會太高,可能個位數的數字就是太多了。反之如果是個冷血的人,他對此評價是「不夠多」,那麼可能量化的數據就是成百上千。相處越長,了解也多,那麼得到量化的數據也會越準確。

想像一下如果隱蔽條件,「很多」的量化數據不到10,而「不夠多」的量化數據是成百上千。如此的數字和描述讓人覺得顛倒得不可思議,這就是主觀。而有些人又恰恰喜歡以自身的主觀去看待別人,這些遠沒有用電腦分析來得公正。

過去有個笑話,一個人在大街上罵某個政黨,執政黨的官員發現後就說我要把你法辦。此人說,你怎麼知道我罵的是執政黨。官員說,是不是我還不知道嗎?

其實這就是一種由於主觀而導致的現象。有的人認為孩子走了成百上千都不算多,現在才走了10個,遠遠不到成百上千的地步,你就說已經走了「很多」,這不是造謠還能是什麼?

不僅僅是量化,還有定性,同樣是研究的課題。比如「走私」和「超買」、「施壓」和「強烈建議」、「抄襲」和「抄錄不當」、「核食」和「福食」諸如此類的詞彙如何定性,這些詞彙明明背後指向的都是同一件事情,但是不同的人使用的詞彙卻有所不同。

有誰推薦more

限會員,要發表迴響,請先登入
迴響(3) :
3樓. 【無★言】家喻戶曉的中國人
2022/06/04 08:12
真的應該逼問蘇貞昌究竟死了幾個才算多?
2樓. blackjack
2022/06/03 12:25

講到多跟少,去年諾富特事件時,當時確診人數大家覺得就很多。結果到了現在,隨便哪一天確診就要輾壓去年統計了。

對蘇貞昌與政府來說,顯然他們沒感覺

另一方面,講點題外話,立場不同,看一個詞彙也有不同感覺

如果從中美關係來看,美國說未來要與中國"競爭與合作",但在中國智庫眼中就是「大圍剿」,包括「加緊構建對華圍堵的『印太經貿小圈子』」、「多空並舉、金融施壓中國企業」、「在意識形態領域對華攻擊汙蔑」、「以『切香腸』方式挑動台灣問題」、「在軍事科技領域不斷壓制中國發展」

而美國講的IPEF說不是挑起新冷戰,東南亞各國卻認為就是圍堵

套到蘇貞昌的看法,他心中所謂的"多",講出來數字可能會讓大家嚇一跳吧

美國長期以來言而無信,不看說了什麼,只看做了什麼,最後就會導致這種結果。 冽風2022/06/03 21:32回覆
1樓. 草山
2022/06/03 09:37

「一個人的死亡是悲劇,一百萬人的死亡只是個統計數字。」

原文網址:https://kknews.cc/history/p2ly4yj.html