二、近年常可見新聞媒體引用所謂網路聲量來作為民眾對某新聞議題之反映。請你分析網路聲量所呈現資料與民意呈現之關係,概述網路聲量資料之技術原理,並說明網路聲量與傳統民意調查方式的優點與缺點。 (25 分)

網路聲量與民意之關係

民眾能藉由網路社群發表對於公共政策之態度,其態度會被其他網路使用者接收,再藉由討論使議題發酵傳播,形成網路民意(network public opinion),網路民意會影響民眾在線上的政治參與, 因此,政府應該將網路民意當作治理的參考資料。

網路聲量資料之技術原理

網路聲量資料的技術有人工的內容分析法(content analysis),半自動的字探勘(text mining)與民意探勘技術。

內容分析法為量化的研究方法,以編碼的方式對網路資料進行分類,並做統計分析。而字探勘則可以做主觀分析(subjectivity analysis)及情感分析,由電腦自動分類與辨識意見的語意偏向(semantic orientation)來處理網路聲量資料,以下是常見的幾個技術原理:

一、找出網友討論的主題:運用詞袋模型(bag of word model)概念,計算網路文本中的詞彙組合、計算字詞在文章內的分佈,並與鄰近字進行比較,最後輸出詞彙所代表的主題。

二、關鍵字提取及聲量計算:用庫柏中文語料庫工具進行分析,找出字詞出現的頻率,然後將相同字詞重新編篡為「同類詞」,進行後續的語料分析,「同類詞」包括正向與負向的,舉例來說,對政策有正向態度的詞可能是「踴躍參與」、「支持」之類的字,而對政策負向的詞是「反對」、「抗議」、「失能」,用這些「同類詞」去找出網路新聞的框架(Frame)是支持或反對政策。

三、情感分析:Russell提出情感詞分析法,將每個分類主題後的回文進行情感分類與計算(sentiment classification and computing),藉此瞭解民眾在評論個主題性時的情感比例及強度。

 

網路聲量調查與傳統民意調查的優點與缺點

傳統民意調查的優勢:

一、成本低

二、較易上手

三、在有經驗的研究者的引導下,得到的資料品質較佳

傳統民意調查的限制:

一、樣本少

二、抽樣誤差大

三、拒訪率高

 

網路聲量調查的優勢:

一、樣本多

二、在不打擾受訪者的情況下進行

三、機器處理字詞的速度比人為處理字詞的速度快

網路聲量調查的限制:

一、假帳號、假消息、假留言氾濫,抓取資料後,難已從資料中剔除

二、較難上手

三、較難調查到年長者的意見

四、侵犯隱私:紀錄他人數位足跡,如果數量夠多,可以拼湊出當事人的人物誌(persona)。