來源:中國報業 2018-06-14 10:19:43
2015年5月到12月間,我參加了哥倫比亞大學新聞學院下設的Lede項目。這是一個專門培訓數據記者的項目,課程涵蓋了統計、高等數學、計算機算法、數據庫應用以及可視化制作等方面的內容。在這半年多的時間里,我接觸到超過20種軟件及編程語言(見下圖),以供處理不同類型的數據。
一、背景環境及課程開設初衷
作為美國歷史最悠久的新聞學院之一,哥倫比亞大學始終走在新聞教育的前沿,不僅為全球新聞行業培養了諸多優秀的記者和編輯,同時也在不斷探索媒體行業的走向和發展。數據新聞起源于上世紀六十年代末,一個叫菲利普·梅耶(Philip Meyer)的記者他所供職的《底特律自由報》使用當時的大型計算機(mainframecomputer)整理和收集政府的公開數據,并嘗試在報道中加入數據調查結果。后來,做了教授的梅耶寫了本叫《精準新聞》(Precision Journalism)的書,詳細記述了自己對數據的理解和經驗,這本書已成為數據與調查新聞領域的經典著作。到了八十年代末,隨著辦公電腦的普及,數據新聞扮演的角色也越來越重要,而通過電腦協助完成的報道也開始斬獲像普利策這樣重量級的獎項。越來越多的從業者開始意識到數據新聞的價值,而全國計算機輔助報道協會(NICAR)也于1994年在密蘇里新聞學院正式建立,給業內人士和新聞學院學生提供了更多交流和學習的機會。到了本世紀初,隨著社交媒體和手機應用的迅速發展,傳統新聞行業受到嚴重打擊。老牌紙媒虧損停刊的不在少數,一大批記者不得不離開紙媒,去互聯網公司尋找機會,網絡媒體的地位不斷得到提升。這些公司依賴于網站訂閱和社交網絡的傳播,大量的讀者是手機與平板用戶。此外,它們的另一特點是對于數據與交互可視化的重視。
正是在這樣的大環境下,哥倫比亞大學新聞學院的兩位教授艾米麗·貝爾(Emily Bell)和馬克·漢森(MarkHansen) 在聊到目前數據新聞的發展和數據記者的短缺時,不謀而合地提出開設數據培訓課程的想法,于是便有了Lede項目。
二、緊貼行業發展的課程設置
1. 交互可視化
雖然學習的內容大多與計算機和編程相關,但Lede的宗旨并不是培養程序員,而是希望學員能夠更加準確地分析和運用數據。它的課程分為四個方向:統計學,交互可視化,數據分析和計算機語言。Python,SQL, D3.JS,這些目前在數據新聞界最流行的幾種工具對于文科出身的記者來說,可能十分陌生。但實際上,只要掌握一些基本數據結構和編程語法,就可以開始編寫簡單的程序去整理和分析數據,接下來便是抓取網頁信息和制作可視化新聞。
Lede課程總長度為兩學期。第一個學期從5月到8月,學習使用編程語言Python進行處理數據,抓取網頁,建立模型, 以及簡單的機器學習。第二個學期從9月到12月,有了一定編程基礎的學員可以根據自己的興趣在高等數學、數據結構、統計分析、交互可視化制作、大數據挖掘等不同領域選擇進修方向。
進修之前,我有一年的數據處理和可視化制作經驗,卻從未涉及過電腦編程。我大部分情況下都是使用軟件,比如Excel和Access,以及可視化工具Tableau,還有各種制作時間軸(Timeline)或是信息圖(Infographic)的網站。使用這些資源的好處是上手容易,完成的快。但缺陷是形式比較單一,缺少個性化。上課期間, JavaScript 的一個函式庫D3建立動態數據圖,令我眼界大開:它設計出的圖像簡潔、美觀,功能豐富,交互性強,很符合媒體的需求。
隨著線上讀者的不斷增加,新聞網站越來越重視在新聞中加入交互與可視化元素。目前被媒體網站廣泛使用的開源語言D3.js的開發者Mike Bostock曾是紐約時報的一名圖片編輯,他開發的這款工具大大提高了數據圖的專業度和靈活性,并且兼容手機瀏覽器:
以下是幾個D3動態圖案例:
《紐約時報》——通往白宮的512條路
《紐約客》——美國高校籃球隊的預算之爭
《那些孤單的人們》—— Lede項目往屆學員作品
2.數據分析能力
去年獲得普利策調查新聞獎的作品《揭秘聯邦醫療保險:數字背后的故事》(Medicare Unmasked: Behind the Numbers)(《華爾街日報》)通過分析超過一百萬份醫療賬單,公開了聯邦醫療保險系統中6000億美元的走向, 以及這個保險給醫院和醫生帶來的收入變化情況。
專門報道體育和政治新聞的網站538(FiveThirtyEight)以預測比賽和大選結果見長。主編Nate Silver在12年大選期間,利用數據模型近乎完美地預測每一輪的投票結果,并寫成文字報道,廣受業界好評。自由撰稿人,博客網站“I Quant NYC”的作者Ben Wellington 通過分析紐約市交警一年的罰單記錄,發現了紐約最“掙錢”的消防栓一年的“收入”竟多達55000美元,合計33萬元人民幣。
這些獨家新聞的背后,是深度的數據分析和統計知識。現在無論是政府還是企業,數據越來越多地被當做資源利用。作為記者,能夠拿到獨家數據無疑是如獲至寶。但能否用好這些寶貝,還要看記者本身的分析能力。 Excel是一個簡單又好用的軟件,可以錄入數據,整理歸類,進行計算(總和、平均數、方差等等),還可以制作簡單的數據圖表。
相關推薦:
小升初試題、期中期末題、小學奧數題
盡在奧數網公眾號
歡迎使用手機、平板等移動設備訪問幼教網,幼兒教育我們一路陪伴同行!>>點擊查看