輿情資訊視覺化分析

大肚台地調查研究計畫總計畫,宏華環境保護與數位未來基金會執行長李士傑

計畫摘要

「輿情資訊視覺化分析計畫」首先處理過往兩年的資料處理經驗,探討輿論資料收集的目的與目標,進而討論輿論蒐集方法與各自的限制;然後深入討論今日資訊社會,過量訊息的普遍情境,線上溝通工具的普及與進化,讓人重新檢視資料視覺化的定義,同時再進一步討論這些蒐集資料如何透過視覺化呈現與設計連動,發揮最重要的價值。

在討論當中同時展開對社交媒體訊息影響力倍增現象的檢討,作者認為市政府應該要建立跟線上獨立意見社群的「對話計畫」作為上層的政策基礎;科學資料與視覺化的工具可以輔助這樣的政策,對正確的受眾傳遞有效的、不被覆蓋的完整訊息。

計畫範圍

宏華環境保護與數位未來基金會從 2016 年起推動大肚台地調查研究計畫,曾經分別從臉書帳號訊息、電視與平面媒體線上新聞網站訊息等方式建立輿論資訊搜查的方法,提供給市政府研考會與市政府內部的大數據媒體資訊比較參考。作為一個研究取向的非營利單位,納入輿情的研究分析目的是希望透過範例的呈現,討論市府內部的真實需求,建立起不同於傳統的網路情報運用構想與策略。

本計畫將研究拓展到如何運用相關的輿論模式與所蒐集的資料,以視覺化的邏輯,建構一套「輿情資訊視覺化分析」的運作機制並且鑲嵌到市府各單位日常業務中。

輿論意見搜尋模式:媒體官網新聞資料與社交媒體言論

在 2016 年度的臉書帳號資料蒐集範例中,我們列出了不同於傳統「關鍵詞」搜尋作法的「社交媒體輿論引領者 / 意見領袖」言論追蹤合併「關鍵詞」搜尋的混合方式,累積了以 excel 資料格式紀錄的臉書粉專、個人頁面言論資料紀錄。2017 年我們提出了另外一個測試方向,運用 Python 所撰寫的開放源碼程式,存放在開源的 Github 平台上,固定擷取平面與電子媒體官方網站上新聞資料。

這些與傳統輿情蒐集資料服務不同的分析方式,目的在於提供給市政府不一樣的輿情觀測資訊收集「架構」(framework)。它因為出自於研究團隊的手中,不是商業的固定服務,不等同新聞與公關單位所固定想像的輿情資訊系統;同樣地它也沒有提供「正負評」或「網路聲量」這樣的估計公式,原因是這些公式在快速變化發展的網路世界中,往往帶給觀眾的反而是「靜態的、錯誤的想像」。

這些「架構」因為有完整的內容資訊(excel 表格中的參考欄位,或者程式的全部源碼),可以給任何一個認為重要、需要發展新的系統的單位與團隊做參考,重新設計規格來規劃納入未來的輿情蒐集計畫裡。

新架構與舊典範的差異

「….系統搜尋結果:59 筆資料。」

一般通用資料庫搜尋結果顯示畫面。

在討論不一樣的輿情資訊蒐集「架構」之前,讓我們先來討論一下舊典範的內容。傳統的「關鍵詞」搜尋中心的輿情分析,幾乎都是 Google 搜尋引擎的印象深入腦海中;面對一個空白的輸入框,彷彿臨床心理分析看診般地填入字詞,神諭般看到神奇的資料庫回傳成千上萬資料,而且顯示前十多筆給你看。網路搜尋引擎就是一個蓋著神秘面紗的回饋系統。大部分的搜尋服務仿造 Google 的類似做法,企圖把魔力同樣地灑在自己的產品上,說服消費者買單。

這種以搜尋/查詢(Query)為中心的設計,核心的操作著重在掛進越多的資料來源(source),創造大量的搜尋結果筆數。資料來源就像是戲台的後台道具櫃服裝間,它才是真正構成「牛肉」的關鍵所在。只要能夠回饋夠多的搜尋結果,觀眾就會心理上感到滿足。但是這些資料來源,真的是圍繞著市政相關議題所調配的食譜嗎?這些搜到的筆數,無論是來自 PTT 或者來自 mobile01 論壇,真的對市政的發展傾聽民眾的聲音,有幫助到嗎?

通常這些搜尋,是透過市政府相關承辦同仁設定的有限數量搜尋關鍵詞,來固定跑報表一段時間固定呈現,以此來檢視最終結果。因為是以「關鍵詞」搜尋作為規劃與設計的核心,沒有在資料議題上做檢討與檢視,通常會面臨到索引收錄的資料來源,「關鍵詞」搜尋找不到資訊、或者傳回過多資訊的狀況。最後最正常的狀況就是列進最高層主管、副主管的姓名,單位的名稱,來在一個連結到好多資料來源的大水庫裡,適切地找到幾十筆可以整理到報表裡的資料:不能太多(多到無法處理),也不能太少(這樣表示系統有問題),一定要剛剛好才行。

一但他們變成例行公事,很快地這些系統就會變成老生常談的資訊系統:提供了大家都知道的資訊,但是沒有創造任何差別、也因此沒有創造意義(make no difference)。

新的架構跟這種舊典範不同的地方在於,社交媒體帶來了新的、多重角度樣本群體:在群體的整體規模上,其論述的多樣性與複雜度,是接近台灣社會的原貌的。因此人們可以設計不同的探索取徑,掌握特定問題意識 — 特定族群,或者他們所留下來的論述留言或行為模式 — 一一展開與呈現的風貌。

一方面人們因為社交媒體而更尋求「同溫層」的認同,另一方面取得民眾的信任也變成一件更為困難的事情:人們很容易被情感的議題驅動認同,而在同溫層中間的認同運作讓人們更堅持己見,必須要更為細緻的對話才能夠獲得共識。新架構中對媒體官網的新聞及其熱度掌握,以及針對社交媒體的互動言論收集,可以更為細緻地處理不同意見領袖的想法,進而掌握同溫層範圍區間人們的意見狀況。

重新界定問題與定位

將資料來源與蒐集作法區隔開來,可以讓我們對「輿情問題的資料議題」能夠單獨思考清楚,幫助我們釐清該用什麼方法來提升資料品質。從資料科學的角度來思考資料品質(data quality)問題,所謂的更好的資料意味著獲得較少的無關雜訊、較多命中調查目的的資料。如果我們對於所尋找的輿情目的及目標有清楚的界定,伴隨可驗證的方法論、與透明化可檢討的操作過程,我們將可以逐步接近問題的核心。

通常輿情的蒐集,其核心的精神與目的在於想要主動探知民眾對特定議題的看法與最極端的狀況 — 民怨,並且希望能夠在意見爆出的初期便即時回應。由於各單位在政策研擬過程原本就應已經納入專家與利害關係人(stakeholder)參與,理論上在研擬過程第一關若有妥善處理,可以被輿論發揮與見縫插針的機率就相對降低。所以輿論意見的搜尋,應當是作為政策研擬階段之後,驗證民眾反應與疏漏補遺等輔助性功能。

但如果該議題輿論爭議已經戰線擴大、戰況膠著,同時有中央與民間、海峽對岸境外等多重因素介入,例如空氣污染,輿情蒐集的目標就可能得相對做調整與應變:收集整理對立意見的論證重點,生產回應的內容並且在就近的支線點做出反擊,以避免不同關切重點的意見及群眾匯流,生產出更難對治的「不信任」態度與擴散影響力。

社交媒體是民眾自身最優先的訊息來源,也是人際社交網絡的展現。以人際關係網路為核心收集資訊,是一套相較「關鍵詞中心」方法論不同的作法,更重視「誰說了什麼」與關鍵詞出現的脈絡,而不再只注意「關鍵詞」被提及的次數與時間。

再脈絡化這些資料的目的在於,我們能夠更即時敏銳地掌握到一個個的社群,如何地在動態變化中

市政府的輿情資訊使用情境

輿情系統最主要的應用情境,是 PowerPoint 的週期性會議報告產出。這種情境有點像是許多人一起共用一個電視螢幕來看世界盃足球賽(例如電影《高山上的世界盃》的故事情境)。這個情境關鍵鎖住了「生產力」:多少人瞪著紙本的內容在緩慢對話、做出決策或採取行動。

但是輿論資訊在各自科室/單位的客製化特殊需求,可能想要查詢不同的內容、在不同的時間內,在自己想要的載具上用自己想要的格式取得。相較於在《高山上的世界盃》裡面的搶著看電視機的小喇嘛,今日處處在所有家庭中,兩三個家人一個客廳手機、平板、電視、筆電總共七八個螢幕,所有的工作都甚至可以派送到不同的螢幕分別進行。輿情資訊已經變成一個開放的共同勞動、作業平台,個別同仁在業務上的數位操作,可以被另外一個科室的人們學習與分享,並且創造在另外他處的複合效應(synergy)。

我們這次在大肚台地調查研究計畫中,各個子計劃的同仁提出具有說服力的科學調查研究成果,提供給市政府的科室同仁作為業務與政策規劃運用。在這些互動過程中,農業局的同仁詢問我們不同原生植物在網路上在哪裡被討論、有著什麼樣的民眾意見;環保局對於最新的空污與能源技術討論、各種污染源比重的大氣模擬成果,有機會從科學與環保團體討論話題中獲得最新的資訊。每個同仁對於所想要知悉的,幾乎都可以從跟網路資料的互動探索中,進而探索到學習到新的知識。

輿論資訊系統有可能變成那樣的協作與學習平台嗎?倘若政府的資訊中心仍然只有靜態的管制資料可供參考,而不是提供計算力(computing power)與提供資料的拼圖與整體分析,那麼我們就仍然只能夠讓行政機器在承辦同仁欠缺關鍵知識的情況下,陳舊地遭逢問題、陳舊地生產過時的政策與有限的執行成果,繼續站在與民眾對立的角度苦苦追趕。

網際網路帶給社會文化巨大的衝擊與改變,除了每個人都在手機上暢遊世界之外,對於政治如何在生活中運作的想像,更是高速地變化、喜新厭舊,被各種便利的服務改變了自我與社會的文化認同。這三年來臉書更為普及、甚至 LINE 與臉書群組中的動員訊息,改變了政治地景地貌。

視覺化的定義與應用範例

視覺化的定義

根據維基百科的資訊視覺化(information visualization)條目,所謂的資訊視覺化指的是:

資訊視覺化研究抽象資料(互動式)的視覺再現,以便能夠增強人類的認知。這裡所謂的抽象資料包括數值與非數值資料,例如文字與地理資訊。然而資訊視覺化與科學視覺化被認為是有所不同:「如果空間再現是所選擇的一個向度,那麼就被視為是資訊的視覺化;如果空間再現是給定的基本向度,那麼就被理解為科學視覺化。」

資訊視覺化的領域是從人機互動(HCI, Human-Computer Interaction)、資訊科學、圖學、視覺設計、心理學,與商業方法中浮現出來。它逐漸地以一個科學研究、數位博物館、資料挖掘、金融資料分析、市場研究、製造生產控制與新藥發現的批判元件應用。

資訊視覺化預設視覺再現與互動技術,運用人類眼睛通達心智思維的寬頻路徑因此讓使用者得以看見、探索與理解短時間內的大規模資訊散佈。資訊視覺化聚焦在創造進路讓人們得以運用直覺的方式、傳遞抽象的訊息。

資料分析是在產業中對所有的應用研究與問題解決來說,其中一塊無法分割的部分。最基本的資料分析取徑是視覺化(長條圖、scatter plots, surface plots, tree maps, parallel coordinate plots, etc.)統計(假說測試、回歸、PCA 等等)、資料挖掘(關聯挖掘等),與機器學習方法(叢聚法、分類、決策樹等)。在這些取徑中,資訊視覺化或視覺資料分析,是最依賴於人類分析師的認知技術,並且允許非結構性的可行動洞察的發現,唯一的侷限只有人們想像力與創造力。分析師不需要學任何複雜方法,就可以解釋資料的視覺化。資訊分析也是一個假說生產的架構,將能夠接著更為分析性的與形式分析,例如統計假說測試。

視覺化是一個新興的強力工具。尤其是近年在網際網路上結合平台服務模式,讓雲端環境能夠對大規模的網路使用者,提供計算力,描繪與編修、分享遞送高品質的圖像,更降低了進入門檻,變成容易取得、平價的線上服務,取代了傳統的作業流程,同時更普及了高效能的視覺溝通設計,讓價格上同時也變得親民。

由於這些創新服務提供者可能大多位居國外,公務機關可能仍須諮詢主計單位來判斷是否能夠給付線上網路服務費用。

視覺化將可以有效地將複雜的抽象概念,轉化成具體能夠溝通的圖像資訊,直接與快速地跟使用者交流;既可以用來分析特定議題的社群與跨社群的言論情形,也可以雙向地呈現可以修改與介入的問題點,幫助議題的演化與推進。

但是也因為大規模的普及,資訊圖表也的確讓社交媒體網站上流通的訊息呈現不同的流動速度:透過顏色鮮明的整理過的「包裝」資訊,相較傳統的市政資訊,的確流通效果有所差異。民眾也因為接收到更多的「優化訊息」而對傳統資訊不耐煩,也升高了對公部門服務的期待與要求。

市府業務如何銜接輿情視覺化

公關溝通與市民對話是一項專業工作,必須要納入網際網路、社交媒體巨量資訊衝擊所造成的影響(包含假新聞/不實訊息等現象),才能夠正確地把溝通訊息傳遞給所需要對話的民眾。

近年來傳統類型的地方政府便民服務架構,越來越面對多樣性、新興資通訊技術發展的衝擊。臉書的市政信箱,臉書上特定意見領袖對市政的意見處理,與市民接受到 LINE 通訊群組的朋友圈訊息引導(誤導)就是三個很具體的例子。如果因為這不是傳統的訊息溝通管道而放著自生自滅,這些網路惡評就會不斷地在搜尋引擎中循環流動,永遠不會消失,再次出現時就擴大變成新接觸者的先入為主的「印痕」(imprint)。

對這些線上流通訊息,主責單位得要有對應社群意見領袖與人際關係網絡的「對話計畫」(conversational plan)的設定。倘若 2018 年透過聊天機器人、線上資訊的樣式呈現就可以引導大量的網路民眾在電商特賣時完成巨量消費,也就是所謂「對話商務,談話商務」(conversational commerce)現象的崛起,那麼政治治理資訊被有心人士系統性的誤導與詮釋,最終導致使用者「轉化」完成某種給定任務工作,這樣的資訊引導設計完全是輕而易舉。以一種素樸的方式放任網路謠言訊息在網路中流竄、增殖結果就是所有的訊息被誤解與扭曲,所推行的政務通通窒礙難行。

對話計畫不是想方設法打壓異己意見的「維穩措施」。相反的,他正巧是民主政治當中全民參與的數位環境版的設計。如何訂定一套通訊協定(protocol),讓意見領袖所主張的疑慮、批判意見能夠被認真看待,檢查盤點與問題確認、排除的處理過程如何視覺化地呈現,進而建構一個更為取信社會大眾,具有責信度(accountability)的公共事務共同治理平台,其實是近年來中央政府到學術界都熱切關注、尋找解決方案的重點。目前中央政府數位政務委員唐鳳所推動的 join 平台,就是一個轉化「客訴」變成延伸佈建信任基礎建設的「對話計畫」實作範例。

基金會在 2016 年關注這些臉書環境中發聲的民間行動者帳號時,還沒有把這些分散的問題點串連起來,提出這樣的一個「對話計畫」的倡議計畫。經過這兩年的想法醞釀與實際網路社會發展結果,讓我們對這個想法 engage 「接壤」社會中的獨立意見社群變得更為清晰。

市政府可以考慮在新的使用情境中,輿情觀測系統可以動態地捕捉特定族群社交媒體的言論摘要:動植物保護與生態保育團體對環境的關注焦點(關鍵詞與意見領袖同時並行)、在地文史團體、文化資產保護社團的晚近話題。這些資料既加速相互的理解,也可以幫助社團提早與市府在特定議題上有所掌握與交流。

視覺化應用範例:資訊圖表(infographics)

在上層的接軌政策有所討論後,底下我將參考國外網站的訊息,介紹一系列可以試用、入門級使用者免費的資訊圖表線上工具網路服務。未來可以幫助市府在與特定社群溝通時,導入這些資訊圖表工具,做更清楚避免誤解的溝通。

圖像式說故事

有三個網路服務針對入門者提供免費的資源,可以幫助人們製作意義清晰、視覺上清楚與舒服的資訊圖表,讓傳遞訊息的負擔不會過重。

第一個網路服務是 Venngage.com 提供主題模板(如下圖,以小企業主身份登入時,會推薦包含資訊圖表、簡報、海報、報告、履歷、社交、摺頁、新聞通訊、邀請卡九種模板)讓使用者挑選適切的故事類型。

選擇資訊圖表類的模板之後,你可以從更細的分類 34 種樣式中,選出 3 種你所想要的溝通方式,然後系統會根據你的選擇進行推薦,並且在平台上把所有的分類知識與推薦模板陳列出來。透過平台的靈活運用,這些色彩鮮明、由前面的使用者所設計過的資訊圖表,同時也變成你的可以參考的可運用資產。

第二個服務是 Mind the Graph,針對科學領域的工作者提供插畫、說明性的資訊圖表的工作平台。

第三個網路服務是 Snappa 線上圖像設計工具,針對非設計師的使用者,提供一個訂製的工作流程環境,在「無人自動協助」的情境中,一步步幫助你輸出接近委外執行品質的資訊圖表成果。透過簡單拖拉的介面、數千高解析度免授權費的圖庫圖片,它號稱十分鐘內就可以生產一幅資訊圖表。下圖是他的工作起始畫面:選擇要在哪一個社交分享平台上輸出你的作品。

資訊轉換圖表工具

有很多免費的資訊轉換圖表工具,例如已經廣為流傳的 Google Charts,可以直接連動你的 Google Spreadsheet 線上試算表資料,做出圖表的內容。

另外如下圖的 Piktochart,它是一個資訊圖表與簡報工具,幫助你僅需要幾個點擊,就可以將無趣的資料轉換成讓人注意的資訊圖表。客製化編輯器讓你修改色彩計畫、字體、插入預先繪製的圖片,上傳基本形狀與影像。

地理空間資訊

地圖資訊視覺化,可以運用 Kartograph 這個工具。根據官方網頁上的介紹,Kartograh 是一個簡單與輕量級的框架,用來打造互動式的地圖應用(無須介接 Google Maps 或其他的地圖服務)。主要服務對象是設計者與資料新聞工作者。

目前他有兩個函數庫,ㄧ個可以用來生產美麗的 SVG 的地圖,另外一個能夠建立在一般瀏覽器都能夠運作的互動地圖。

視覺化應用範例:Nod Red

資訊視覺化除了對人的認知介面發揮溝通作用之外,另外一個面向其實是跟市政府業務的自動化緊緊相扣。我們希望被發現、被挖掘的資訊出現時能夠發出預警訊息(alarm message)。如果僅僅是依賴公務同仁主動操作系統,發現有疑慮的資訊,那麼在公務業務分配的狀況下,就會變成冷凍與分工的邊緣化工作。

如果要有效,其實必須要把這件事的資訊化做到細緻與自動化:使用者體驗必須要夠簡單,必須要能夠隨時替換關鍵詞、以及馬上獲得最新的結果。

對於市府裡面各個單位、各種領域的專業工作者來說,工作流程自動化不應該是在輿情系統之外的功能,而應該是內建的工作環節的一部分。除了輿情資訊的多重整合問題之外,更應該讓工作同仁能夠直接整合進他們的工作中。

現存的資訊系統的使用狀況分析應該可以發現基層同仁並不在這樣的使用情境中 — 過時的資訊系統設計,僅僅服務想像中的公關媒體業務承辦同仁,卻對市政府的各個單位第一線同仁沒有幫助。

基於前面的問題認識,輿情資訊的視覺化,除了輿情資訊的範疇與內容本身之外,還應該銜接的是控制介面與複雜的算則設定。這些被歸類為 if-then-else 的控制元件,可以幫助讓新聞情報訊息可以不以二元對立的方式,出現或不出現,進入決策視野;新聞情報可以以更細緻的尺度,藉由連動與複合的關係,被工作承辦人運用自己定義的過濾標準篩選出來。

控制元件應用範例

這種控制元件範例,我們可以以 IBM 曾經投入發展的 Node-RED 來舉例說明: 

Node-RED 是一個流程為基礎的視覺編程發展工具,由 IBM 最初發展,其目的是用來把硬體裝置、API 介面、線上服務串接起來,並且作為物聯網藍圖的一部分。

Node-RED 提供了一個基於瀏覽器的工作流程編輯工具,可以被用來創造 JavaScript 的函數。應用程式的元素可以被儲存、或者被分享來重複運用。runtime 建構在 Node.js 上,Node-RED 所創造的流程運用 JSON 儲存。從第 0.14 版本起 MQTT 節點可以建立適切設定的 TLS 連結。 

2016 年 IBM 將 Node-RED 以開放源碼貢獻成為 JS 基金會的計畫。

底下的 Node-RED 瀏覽器畫面擷取示意圖中,左邊是可供拖曳銜接的運算元件,中間是工作流程編輯區,可以看到所有的元件的輸入輸出埠(IO, Input Output)都相互銜接。右側是系統資訊顯示區,包含了偵錯(debug)的訊息顯示畫面。

Node-RED 介面瀏覽器畫面擷取示意圖

以 Node-RED 所提供的預設範例來做說明,就是可以設定一個每隔 5 分鐘就自動送出 http-request 的迴路,取得美國地震情報中心的資訊;並且根據他的地震震幅的欄位,判讀之後如果超過 7,就會送出警告的訊息。工作流程控制的元件配置請參考下圖。

這個自動控制工具可以跟前面介紹的視覺化服務銜接起來,變成固定例行性提供能夠對一般民眾說明、並且有溝通意義的情報資訊。

結論

在總計畫結案的輿情資訊視覺化分析計畫中,我們回顧了前兩年的輿情資料的特色與特徵,闡述了輿情資訊架構的特色,以及他與傳統輿情舊典範的差異。

其次討論資訊視覺化的基本定義,視覺化將可以有效地將複雜的抽象概念,轉化成具體能夠溝通的圖像資訊,直接與快速地跟使用者交流;既可以用來分析特定議題的社群與跨社群的言論情形,也可以雙向地呈現可以修改與介入的問題點,幫助議題的演化與推進。

針對這個項目我們介紹一系列的資訊圖表線上工具,不只是讓政府對民眾傳遞資訊,更是以符合今日大量與過量訊息流通的時代氛圍,傳遞容易被使用者消化的清晰圖像化資訊。也可以將市府想要處理的複雜事務有機會可以運用有特色地方式溝通,最終容易進到市民的大腦與心中。

第三,我們闡述了視覺化的延伸用途,作為工作流程自動化的控制工具,幫助第一線的工作同仁可以介入輿情資訊服務,客製自己所需要的資料服務。這樣可以讓輿情資訊從原本被降速的溝通限制中釋放出來,鑲嵌進一般同仁的日常業務中,並且在第一時間取得平面與電子媒體的官方網站新聞情報,以及了解所承辦業務(關鍵詞或意見領袖發言)在社交媒體平台上的一般討論情形。

由於基金會不是商業服務團體,沒有辦法提供持續性的商業資料與諮詢服務,我們遂致力於在這三年調查研究進行時,根據市府同仁與計畫團隊同仁所展示出來的需求示範與建議成功案例。我們目的在於提出國際標準的作為,讓政府的施政有可能連結到堅實基礎的科學研究,在網際網路時代跟民眾的溝通更有效率與讓市民有感。在有限的角色下,我們希望拋出具有前瞻意義的「雛型」(prototyping)來幫助市府運用這些調查研究成果,並且與市民大眾溝通。

如果市府有需要引介與連結商業服務團隊,將上述的雛形建議落實建置到日常服務中,基金會可以協助市府進行這樣的設計轉型規劃。

廣告

發表迴響

在下方填入你的資料或按右方圖示以社群網站登入:

WordPress.com 標誌

您的留言將使用 WordPress.com 帳號。 登出 /  變更 )

Google photo

您的留言將使用 Google 帳號。 登出 /  變更 )

Twitter picture

您的留言將使用 Twitter 帳號。 登出 /  變更 )

Facebook照片

您的留言將使用 Facebook 帳號。 登出 /  變更 )

連結到 %s

This site uses Akismet to reduce spam. Learn how your comment data is processed.