亚洲全黄无码一级在线看_国产剧情久久久性色_无码av一区二区三区无码_亚洲成a×人片在线观看

當(dāng)前位置: 首頁 > 社會(huì)新聞 >

全球疫情數(shù)據(jù),為何由一所高校更新?

時(shí)間:2020-04-09 17:46來源:網(wǎng)絡(luò)整理 瀏覽:
(本系列均為南方周末、南方人物周刊原創(chuàng),限時(shí)免費(fèi)閱讀中)1月21日,導(dǎo)師建議我做一個(gè)新冠的數(shù)據(jù)展示圖(dashboard),類似船員航行時(shí)需

(本系列均為南方周末、南方人物周刊原創(chuàng),限時(shí)免費(fèi)閱讀中)

1月21日,導(dǎo)師建議我做一個(gè)新冠的數(shù)據(jù)展示圖(dashboard),類似船員航行時(shí)需要關(guān)注的儀表盤。我們所有的數(shù)據(jù)庫(kù)都是開源的,大家可以在Github查到所有的歷史數(shù)據(jù),相當(dāng)于我們的數(shù)據(jù)在接受全世界的審核。

世衛(wèi)的數(shù)據(jù)是一天更新一次,不像我們實(shí)時(shí)更新,因此我們的總數(shù)會(huì)比它那天那個(gè)時(shí)刻公布的要大。我們做過一個(gè)世衛(wèi)和我們數(shù)字的對(duì)比,發(fā)現(xiàn)世衛(wèi)的數(shù)字總是在第二天才追上我們前一天發(fā)布的數(shù)字。

通過這次疫情,我感受到及時(shí)公布數(shù)據(jù)的重要性,盡管不斷攀升的數(shù)字看起來很恐怖,但是可能會(huì)起到讓你待在家里不要出門的作用,這對(duì)阻斷傳染病傳播是最有效的辦法。

全球疫情數(shù)據(jù),為何由一所高校更新?

這是4月4日在美國(guó)紐約中央公園拍攝的臨時(shí)醫(yī)院。 (新華社/路透/圖)

每一日,你的手機(jī)都會(huì)彈出全球新冠疫情的最新統(tǒng)計(jì)數(shù)據(jù),這其中一個(gè)信源是美國(guó)約翰·霍普金斯大學(xué)(Johns Hopkins University,簡(jiǎn)稱JHU)。

JHU疫情數(shù)據(jù)已被多家媒體引用和報(bào)道,包括紐約時(shí)報(bào)、CNN、法新社、BBC以及新華社等。

疫情可視化數(shù)據(jù)圖由JHU土木與系統(tǒng)工程學(xué)院(CaSE)的Lauren Gardner教授和她的學(xué)生開發(fā),目前研究團(tuán)隊(duì)核心成員有三人,24小時(shí)不間斷實(shí)時(shí)更新。

JHU是一座百年名校,主校區(qū)坐落于美國(guó)大西洋沿岸馬里蘭州巴爾的摩市,距離美國(guó)首都華盛頓六十多公里。JHU醫(yī)學(xué)院和公共衛(wèi)生學(xué)院均在全美名列前茅,而醫(yī)學(xué)院的教學(xué)研究單位約翰·霍普金斯醫(yī)院連續(xù)21年被評(píng)為全美最佳醫(yī)院。

JHU“新冠病毒研究中心”官網(wǎng)顯示,該疫情數(shù)據(jù)在1月22日上線,每日平均使用量(feature requests)從1月底的2億次,在3月初上升到每日12億次,高峰時(shí)每日近20億次。

全球疫情數(shù)據(jù),為何由一所高校更新?

約翰·霍普金斯大學(xué)疫情數(shù)據(jù)4月4日截圖

為何一個(gè)高校開發(fā)的數(shù)據(jù)圖受到全球關(guān)注和信賴?

北京時(shí)間2020年4月3日,JHU數(shù)據(jù)圖顯示,全球新冠肺炎感染人數(shù)突破100萬,南方周末記者當(dāng)天專訪了JHU土木與系統(tǒng)工程學(xué)院的董恩盛和杜鴻儒,解讀上億閱讀量背后的故事。他們是Lauren Gardner教授指導(dǎo)的博士一年級(jí)學(xué)生,從早期開始就深度參與了JHU疫情地圖的數(shù)據(jù)收集與分析工作。

全球疫情數(shù)據(jù),為何由一所高校更新?

杜鴻儒(左)和董恩盛(右) (受訪者供圖/圖)

1月22日上線,手動(dòng)錄入到自動(dòng)更新

南方周末:世界衛(wèi)生組織和美國(guó)疾控中心每天也在更新全球和美國(guó)的新冠確診數(shù)據(jù),大家為什么會(huì)信賴并使用你們的數(shù)據(jù)?你們的數(shù)據(jù)來源是哪些?

董恩盛:我們是從各個(gè)國(guó)家的官方網(wǎng)站收集數(shù)據(jù),比如中國(guó)的數(shù)據(jù)主要來源于國(guó)家衛(wèi)健委和“丁香園”?!岸∠銏@”將每個(gè)省份的疫情情況都制成了表格,這樣便于科研工作者錄入和處理。

美國(guó)的數(shù)據(jù)不像中國(guó)是自下而上、層層上報(bào)和發(fā)布,我們會(huì)結(jié)合州郡縣市的官方網(wǎng)站、政府新聞發(fā)布會(huì)、權(quán)威部門或媒體發(fā)表在Twitter等渠道的疫情內(nèi)容進(jìn)行數(shù)據(jù)挖掘。

世界衛(wèi)生組織和美國(guó)疾控中心的數(shù)據(jù),雖然也被我們列作數(shù)據(jù)來源,但它們對(duì)于我們來說主要是核查(validation)作用,因?yàn)樗鼈兊臄?shù)據(jù)更新相對(duì)滯后,也沒有像我們一樣達(dá)到郡縣級(jí)的數(shù)據(jù)精度。

所以,我們通常是今天收集好數(shù)據(jù)并發(fā)布,等第二天世衛(wèi)和疾控的數(shù)據(jù)出來再比對(duì),目前來看,我們發(fā)現(xiàn)我們報(bào)得很及時(shí),也很準(zhǔn)確。

另外,我們所有的數(shù)據(jù)庫(kù)都是開源的,大家可以在Github查到所有的歷史數(shù)據(jù),相當(dāng)于我們的數(shù)據(jù)在接受全世界的審核。除此之外,我們還有公開的郵箱接受大家的建議和意見。

南方周末:我們發(fā)現(xiàn)你們公布的全球確診人數(shù)總是比世界衛(wèi)生組織多,這是為什么?比如說到4月3日,世衛(wèi)組織的全球確診人數(shù)還沒有超過百萬,但你們的數(shù)據(jù)顯示已經(jīng)超過百萬了。

杜鴻儒:世衛(wèi)的數(shù)據(jù)是一天更新一次,不像我們實(shí)時(shí)更新,因此我們的總數(shù)會(huì)比它那天那個(gè)時(shí)刻公布的要大。我們做過一個(gè)世衛(wèi)和我們數(shù)字的對(duì)比,發(fā)現(xiàn)世衛(wèi)的數(shù)字總是在第二天才追上我們前一天發(fā)布的數(shù)字。這也說明了我們數(shù)據(jù)很準(zhǔn)確,而且比他們更新得更快。

董恩盛:此外,在我們的定義中,確診人數(shù)(confirmed cases)其實(shí)還包括了推定陽性病例(presumptive positive cases),原因是各地對(duì)推定陽性病例和疑似病例(suspected cases)等群體定義不同,很難統(tǒng)一。以美國(guó)為例,推定陽性病例意味著他們已被地方實(shí)驗(yàn)室確認(rèn)感染新冠病毒,但還未經(jīng)疾控中心核實(shí)納入統(tǒng)計(jì),所以我們還是把推定陽性病例納入到確診數(shù)字中。

全球疫情數(shù)據(jù),為何由一所高校更新?

4月4日世界衛(wèi)生組織發(fā)布的疫情數(shù)據(jù),確診人數(shù)也超過百萬。 (世界衛(wèi)生組織官網(wǎng)截圖/圖)

南方周末:北京時(shí)間1月23日,武漢交通“封城”,當(dāng)天你們的數(shù)據(jù)圖就上線了,當(dāng)時(shí)為什么有這個(gè)想法?

董恩盛:1月20日是美國(guó)的馬丁·路德·金紀(jì)念日,放了三天的小長(zhǎng)假。到了1月21日我們課題組開會(huì)的時(shí)候,導(dǎo)師Lauren Gardner教授問我知不知道現(xiàn)在中國(guó)新冠疫情已經(jīng)非常嚴(yán)重了,我說“是的,我非常擔(dān)心,也想做些相關(guān)的研究”。

當(dāng)時(shí)導(dǎo)師建議我做一個(gè)新冠的數(shù)據(jù)展示圖(dashboard),類似船員航行時(shí)需要關(guān)注的儀表盤。這方面的技術(shù)我比較熟悉,因?yàn)?019年五六月份,我跟著導(dǎo)師已經(jīng)做過一個(gè)關(guān)于美國(guó)麻疹的數(shù)據(jù)展示圖。

1月21日開始準(zhǔn)備,教授主外我主內(nèi)。教授負(fù)責(zé)聯(lián)絡(luò)和協(xié)調(diào)資源,并對(duì)我的工作進(jìn)行宏觀性的指導(dǎo),我花了六七個(gè)小時(shí)把初代的數(shù)據(jù)圖做了出來,第二天1月22日(美東時(shí)間)上線,正好在武漢交通“封城”后發(fā)布,那個(gè)時(shí)候國(guó)家衛(wèi)健委也已經(jīng)通報(bào)了全國(guó)的新冠疫情情況。

南方周末:當(dāng)時(shí)只有你一個(gè)人在做數(shù)據(jù)更新?忙得過來嗎?

董恩盛:到1月底基本上就是我一個(gè)人純手動(dòng)更新數(shù)據(jù),很花時(shí)間。我那個(gè)時(shí)候基本是不睡覺的狀態(tài),每天要更新四五次,我還退了一門課來確保數(shù)據(jù)及時(shí)更新。

后來被感染國(guó)家數(shù)量越來越多,數(shù)據(jù)精細(xì)度要求越來越高,我一個(gè)人就漸漸吃不消了。一開始只是想做一個(gè)研究的輔助性的工具,沒想到現(xiàn)在會(huì)得到這么高的曝光量。

南方周末:地圖現(xiàn)在包括了181個(gè)國(guó)家和地區(qū)的數(shù)據(jù),涉及不同的語言,搜集數(shù)據(jù)的過程中遇到了什么困難?

杜鴻儒:我是在1月30日左右加入,和董恩盛一起做數(shù)據(jù)更新。我們?nèi)ジ鱾€(gè)國(guó)家的衛(wèi)生部門和權(quán)威媒體網(wǎng)站一個(gè)個(gè)找,小語種國(guó)家的網(wǎng)頁直接用Google Translate整個(gè)翻譯成英文,然后將確診病例的數(shù)據(jù)轉(zhuǎn)到Excel/csv里,最后再導(dǎo)在軟件里進(jìn)行數(shù)據(jù)可視化。

對(duì)于我們來說,比較麻煩的是有的地區(qū)比如某個(gè)島隸屬于英國(guó)、法國(guó)或荷蘭等,個(gè)別數(shù)據(jù)源容易錯(cuò)把它們當(dāng)作單獨(dú)的國(guó)家來看待。

南方周末:數(shù)據(jù)庫(kù)已經(jīng)上線兩個(gè)多月了,這期間出過錯(cuò)誤嗎?

杜鴻儒:早期手動(dòng)錄入的時(shí)候,免不了會(huì)出現(xiàn)一點(diǎn)小錯(cuò)誤,但我們的郵箱會(huì)立馬收到讀者的郵件,質(zhì)問我們“你為什么錯(cuò)了”。

后來我們覺得手動(dòng)錄入實(shí)在不是長(zhǎng)久之計(jì),組里的成員熬了一周,每天至少工作15個(gè)小時(shí),完成自動(dòng)化信息收集、數(shù)據(jù)清理、更新圖表的編程工作。所以,到了3月中旬,我們的更新頻率基本可以做到每15分鐘自動(dòng)爬取一遍所有的數(shù)據(jù),每一個(gè)小時(shí)自動(dòng)更新一次數(shù)據(jù)圖。

學(xué)校放假,數(shù)據(jù)不能“斷更”

南方周末:目前在做類似工作的還有哪些機(jī)構(gòu),為什么你們的關(guān)注度最廣?

杜鴻儒:其實(shí)我感覺我們做的數(shù)據(jù)圖也不能說很厲害,只是我們占了兩個(gè)優(yōu)勢(shì):第一是我們做得比別人早;第二是借助JHU在公共衛(wèi)生和醫(yī)學(xué)領(lǐng)域排名靠前的優(yōu)勢(shì)。所以JHU發(fā)布的數(shù)據(jù),大家都會(huì)覺得很權(quán)威的,容易取得更多的關(guān)注。

世界上第三方獨(dú)立做疫情數(shù)據(jù)收集和分析的研究機(jī)構(gòu)不多,我關(guān)注到的有哈佛大學(xué)。

全球疫情數(shù)據(jù),為何由一所高校更新?

哈佛大學(xué)的新冠疫情動(dòng)態(tài)數(shù)據(jù) 4月4日截圖

每個(gè)研究機(jī)構(gòu)都各有所長(zhǎng),比如說哈佛大學(xué)的數(shù)據(jù)圖是和清華大學(xué)等機(jī)構(gòu)合作,我覺得他們的優(yōu)點(diǎn)在于,將確診數(shù)量做成不同深淺的顏色來表示嚴(yán)重程度,而且他們掌握了許多細(xì)節(jié)的數(shù)據(jù)去分析患者的年齡、入境時(shí)間等。不足是他們上線較晚、更新速度較慢。

南方周末:上線兩個(gè)多月來,你們的數(shù)據(jù)展示圖和最開始相比,有哪些變化?

董恩盛:有很大差別。以最直觀的疫情地圖為例,大家一開始最關(guān)心中國(guó)疫情,所以初代數(shù)據(jù)展示圖是以中國(guó)為中心。你想看世界其他地方,需要手動(dòng)點(diǎn)擊?,F(xiàn)在打開頁面,可以直接看到整個(gè)世界的情況,不需要放大或者縮小地圖。

從整個(gè)頁面布局來說,初代數(shù)據(jù)圖只是列出了確診病例的累計(jì)總數(shù),然后把每個(gè)國(guó)家或省份的數(shù)據(jù)單列出來。我們現(xiàn)在又增加了很多圖表,比如說你點(diǎn)擊一個(gè)國(guó)家,可以看到這個(gè)國(guó)家確診數(shù)字的每日變化。

從數(shù)據(jù)精細(xì)度來說,初代只對(duì)中美加澳四國(guó)是到?。ㄖ荩┘?jí)的,其他都是以國(guó)家或地區(qū)為單位。后來,對(duì)美國(guó)的確診、檢測(cè)數(shù)據(jù)我們做到了郡縣級(jí)(county level),當(dāng)時(shí)很多人給我們寫郵件,感謝我們讓他們看到了自己生活區(qū)域的疫情。當(dāng)然,這里面也有專家給我們提了一些寶貴的建議,使我們的數(shù)據(jù)展示更加便捷準(zhǔn)確。

南方周末:除了感謝信,你們還收到了什么樣的反饋?

杜鴻儒:我們的公共郵箱大概每天能收到一兩千封關(guān)于數(shù)據(jù)圖的郵件,我的個(gè)人郵箱也會(huì)收到二三十封相關(guān)郵件。我們沒有精力逐一回復(fù),現(xiàn)在中心已經(jīng)請(qǐng)了專門的人來回復(fù)這些郵件。

據(jù)我所知,美國(guó)很多州的疾控中心直接采用了我們的數(shù)據(jù),包括馬里蘭州、佛羅里達(dá)州、俄勒岡州等,各級(jí)政要包括美國(guó)副總統(tǒng)邁克·彭斯談到新冠疫情的時(shí)候也引用了我們的數(shù)據(jù)圖。

南方周末:你們學(xué)校是不是也放假了,數(shù)據(jù)會(huì)停更嗎?會(huì)不會(huì)覺得壓力很大?

董恩盛:現(xiàn)在美國(guó)的學(xué)校基本都網(wǎng)上授課,我們的校園里面也只見花不見人了。但是我們這個(gè)項(xiàng)目很特殊,數(shù)據(jù)不能“斷更”,一旦更新出現(xiàn)問題,會(huì)影響到全世界。

所以學(xué)校也很重視,同時(shí)也有第三方獨(dú)立的GIS地圖軟件公司給予我們數(shù)據(jù)可視化的技術(shù)指導(dǎo)。

同時(shí),學(xué)校還專門建立了新冠研究中心(Coronavirus Resource Center)網(wǎng)站,把學(xué)校所有和新冠相關(guān)的內(nèi)容,包括我們的數(shù)據(jù)圖、疫苗、預(yù)防等內(nèi)容都集結(jié)在里面,供公眾瀏覽。

“感受到及時(shí)公布數(shù)據(jù)的重要性”

南方周末:除了數(shù)據(jù)收集、更新、可視化展示,你們是否會(huì)對(duì)這些數(shù)據(jù)加以分析,并對(duì)全球疫情的趨勢(shì)作出判斷?

董恩盛:其實(shí)這項(xiàng)工作之初,我們就是打算在收集數(shù)據(jù)的基礎(chǔ)上,建立流行病學(xué)模型去分析新冠疫情的未來發(fā)展趨勢(shì)。

比如說,我們一開始采用SEIR模型(記者注:構(gòu)建帶有潛伏期的傳染病模型)去分析,但是我們遇到了兩個(gè)現(xiàn)實(shí)問題:一是這個(gè)數(shù)據(jù)采集量太大了,以至于我們的工作重心不得不從建模分析轉(zhuǎn)向了數(shù)據(jù)收集;二是,對(duì)于模型來講,人口流動(dòng)(mobility)的數(shù)據(jù)非常重要,因?yàn)榧膊〉膫鞑ズ腿丝诘牧鲃?dòng)密不可分,然而許多國(guó)家出于保護(hù)隱私等原因,這方面的數(shù)據(jù)是難以獲取的。

舉例來說,如果我們想要證明中國(guó)采用“封城”的辦法有效延緩了新冠病毒傳播,我們起碼需要高鐵、航空等方面的一些人員流動(dòng)數(shù)據(jù)。

因此,我們當(dāng)時(shí)的工作更加側(cè)重于分析,如果中國(guó)是個(gè)疫情中心,將對(duì)世界上其他國(guó)家造成什么樣的影響。比如說,預(yù)估哪些國(guó)家有可能更加早出現(xiàn)輸入型的病例,美國(guó)某些州或者機(jī)場(chǎng)需要采用一些檢測(cè)和隔離的手段。

但是,當(dāng)時(shí)初步形成的一些研究結(jié)果發(fā)表在我們的網(wǎng)站上,并沒有一對(duì)一地對(duì)受影響的地區(qū)提出建議。后期很多地方衛(wèi)生部門主動(dòng)聯(lián)系我們,才慢慢建立起直接的溝通合作。

南方周末:你們的數(shù)據(jù)對(duì)流行病學(xué)家的研究有什么幫助?

董恩盛:我們提供的這些原始數(shù)據(jù)非常寶貴,許多政府和媒體機(jī)構(gòu)都在關(guān)注。這些數(shù)據(jù)也是開放的,科學(xué)家在這些數(shù)據(jù)的基礎(chǔ)上做相應(yīng)的分析,我們后續(xù)也會(huì)跟進(jìn)的。

杜鴻儒:流行病學(xué)分成很多個(gè)板塊,有的科學(xué)家關(guān)心病毒基因構(gòu)成,追溯其來源,這些我不太了解,我們現(xiàn)在做的建模工作偏向統(tǒng)計(jì)分析,關(guān)心確診數(shù)量、檢測(cè)數(shù)量、死亡率、擴(kuò)散速度等等。

我也看到中國(guó)國(guó)內(nèi)很多科學(xué)家在做類似的分析工作,發(fā)了很多期刊文章,我覺得這些分析越早發(fā)出來越好,它可以幫助決策者更清晰地看到疫情的嚴(yán)重程度,提供一些可行的方案建議。

通過這次疫情,我感受到及時(shí)公布數(shù)據(jù)的重要性,盡管不斷攀升的數(shù)字看起來很恐怖,但是可能會(huì)起到讓你待在家里不要出門的作用,這對(duì)阻斷傳染病傳播是最有效的辦法。

除此之外,確保這些數(shù)據(jù)的準(zhǔn)確、盡快對(duì)疫情走勢(shì)作出判斷也非常重要?,F(xiàn)在美國(guó)的疫情已經(jīng)很嚴(yán)重了(記者注:截至發(fā)稿時(shí)間,JHU數(shù)據(jù)圖顯示美國(guó)確診數(shù)量已是全球第一,超過27萬),我們會(huì)根據(jù)我們的數(shù)據(jù)和模型來判斷,美國(guó)政府實(shí)行的這些social distancing等隔離政策是否有效,疫情拐點(diǎn)會(huì)在哪個(gè)時(shí)刻到來。

訂閱南方周末會(huì)員,支持原創(chuàng)優(yōu)質(zhì)內(nèi)容。成為南周會(huì)員,尊享七大權(quán)益,在一起,讀懂中國(guó)。

南方周末記者 黃思卓

推薦內(nèi)容