日本黄色一级经典视频|伊人久久精品视频|亚洲黄色色周成人视频九九九|av免费网址黄色小短片|黄色Av无码亚洲成年人|亚洲1区2区3区无码|真人黄片免费观看|无码一级小说欧美日免费三级|日韩中文字幕91在线看|精品久久久无码中文字幕边打电话

當前位置:首頁 > 芯聞號 > 充電吧
[導讀]近來,一個關(guān)于美國和歐洲疫情數(shù)據(jù)的"神預測"的日更博客,在網(wǎng)上火了。 到底有多神呢?略舉二三,如下: - 3月27日起的連續(xù)10天里,該博客對美國感染人數(shù)的預測準確率都在90%以上,其中在4月4日準

近來,一個關(guān)于美國和歐洲疫情數(shù)據(jù)的"神預測"的日更博客,在網(wǎng)上火了。

到底有多神呢?略舉二三,如下:

- 3月27日起的連續(xù)10天里,該博客對美國感染人數(shù)的預測準確率都在90%以上,其中在4月4日準確率接近100%(預測為276727,實際為276931)。

- 3月31日,該博客預測美國疫情將在8-10天內(nèi)當檢測人數(shù)超過200萬的時候出現(xiàn)斷崖式下跌;7天之后,也就是4月6日,美國疫情數(shù)據(jù)出現(xiàn)斷崖式下跌,增幅從12.43%降為8.13%—;—;這篇文章引起了巨大反響,閱讀量超過134萬。

3月27日以來,該博客對歐洲感染人數(shù)的每日預測平均準確率達到97%,其中在4月份的前五天,預測準確率接近100%。


李志斌對美國感染人數(shù)的預測(樂觀),準確率高達90%

對此,有網(wǎng)友評論稱:大神,病毒都聽你的,絕了。

要知道,新冠肺炎疫情的爆發(fā)是一個涉及到政治、經(jīng)濟、地理等諸多復雜因素的全球性重大公共事件,對具體人數(shù)的預測聽起來就像是天方夜譚,準確率更是一門玄學—;—;所以,能夠?qū)崿F(xiàn)上述的預測成績,這個博客背后的博主堪稱是當代"神算子"了。

那么,這位"神算子"是怎么煉成的?

清華大學畢業(yè)+8年市場預測經(jīng)驗

這個博客背后的博主,也就是"神算子"本人,名為李志斌。

李志斌,1980到1985年就讀于清華大學計算機系,1985到1994年,他就讀并就職于中科院,三十歲擔任副研究員、產(chǎn)品部主任、所長助理,1994年移居新西蘭,后定居香港至今,現(xiàn)任香港致佳物流軟件有限公司、香港易經(jīng)科技有限公司總經(jīng)理。


李志斌博客截圖

在李志斌所在的這兩家公司中,前者的主營業(yè)務是物流系統(tǒng)開發(fā)(Logistics Systems);后者有香港中文大學背景,主要業(yè)務是市場需求預測(Market Demand Forecast),也就是為企業(yè)提供在未來3到6個月內(nèi)特定區(qū)域的產(chǎn)品需求、價格波動等方面的數(shù)據(jù)分析和預測。

李志斌表示,他從2012年開始進入數(shù)據(jù)分析和預測領域,由于易經(jīng)公司的香港中文大學背景,李志斌也從教授們那里耳濡目染學了不少東西。

另外,從技術(shù)層面來說,李志斌在清華大學計算機系的學習經(jīng)歷,也讓他在軟件建模、大數(shù)據(jù)分析等方面已經(jīng)形成一個完備的知識體系;同時,清華大學的理工科學風和背景,也讓他更加重數(shù)據(jù)、重證據(jù)、重例舉,而不是重結(jié)論。

所有這些加起來,讓李志斌對"數(shù)據(jù)"非常敏感。

去年底今年初,武漢開始報告病例,香港也出現(xiàn)疑似新冠病毒患者,這讓長期身在香港的李志斌頗為警惕;到了2020年1月7日,香港特別行政區(qū)政府宣布新冠肺炎為法定傳染病,并開始向公眾通報疫情數(shù)據(jù),由此,李志斌開始了對新冠肺炎相關(guān)數(shù)據(jù)的追蹤。

從那時開始,李志斌每天早上起來進行集中數(shù)據(jù)采集,一開始只是武漢、湖北、香港的數(shù)據(jù),后來是內(nèi)地其他地區(qū)數(shù)據(jù),到了1月下旬,開始收集海外數(shù)據(jù),并整理成Excel表,同時開始利用自己的專業(yè)知識進行數(shù)據(jù)建模,并結(jié)合新聞中的數(shù)據(jù)對官方通報數(shù)據(jù)進行分析和判斷。

最初,李志斌只是在清華的同學群里分享數(shù)據(jù)和觀點,后來也每天花出30分鐘的時間來博文,并發(fā)表在新浪博客上。如今,這已經(jīng)形成了每天的習慣。

當然,對于李志斌而言,除了對常規(guī)的數(shù)據(jù)進行收集、整理和分析之外,他也在不斷結(jié)合自己的專業(yè)知識來構(gòu)建一個數(shù)據(jù)模型,并且不斷對這個模型進行參數(shù)補充和驗證,使之達到預期中的效果。

到了3月27日,李志斌在數(shù)據(jù)模型已經(jīng)趨于穩(wěn)定的基礎上,第一次給出了針對美國感染情況的預測數(shù)據(jù);3月28日,他又給出了針對歐洲感染情況的預測數(shù)據(jù)。


李志斌對歐洲感染人數(shù)的預測,平均準確率高達97%

在他的預測中,不僅僅包含感染病例數(shù)量,還包括感染增速、峰值時間、總感染人數(shù)、總死亡人數(shù)、死亡率等數(shù)據(jù)—;—;當然,感染人數(shù)是他用來衡量預測準確率的最為重要的指標。

就連李志斌自己都沒有想到,自己的預測數(shù)據(jù)會那么準。

但是李志斌強調(diào),沒有人可以100%準確預測未來,一定要滾動預測。

他表示: “預測是一個動態(tài)過程,因為好多即時措施、事件等突發(fā)因素,是無法預測的,這個時候需要把這些突發(fā)事件和決定等因素變成對參數(shù)的調(diào)整,反饋到預測模型中,使之運行更加準確。我的預測模型、預測參數(shù)也在不斷完善過程中?!?/strong>

再好的軟件也不能100%預測準確

李志斌的預測,離不開兩個核心要素:數(shù)據(jù),和預測模型。

首先是數(shù)據(jù)的可信度問題。在采訪中,李志斌表示,自己從1月份開始每天收集數(shù)據(jù),一開始只有武漢和香港有數(shù)據(jù),一直到現(xiàn)在,每天收集上百個國家和地區(qū)的數(shù)據(jù)。

李志斌強調(diào),在數(shù)據(jù)收集和分析的過程中,一定需要甄別數(shù)據(jù)沖突(Data Conflicting)的出現(xiàn);尤其是在官方通報的數(shù)據(jù)量比較大的情況下,會用好多方法包括新聞數(shù)據(jù)去檢查不同地區(qū)的數(shù)據(jù)之間可能存在的數(shù)據(jù)沖突,數(shù)據(jù)沖突點越多,數(shù)據(jù)的可信度越低。

同時,在判斷數(shù)據(jù)真實性的過程中,要看數(shù)據(jù)發(fā)布的速度;數(shù)據(jù)發(fā)布頻率越高,那么可信度就會更高一些—;—;而南亞、東南亞地區(qū)發(fā)布的數(shù)據(jù)比較少、比較慢,可信度就會打折扣。


來自美國CDC官網(wǎng)的疫情情況

另外,在對數(shù)據(jù)的可信度進行判斷時,還可以借用新聞數(shù)據(jù)來做對比。李志斌告訴雷鋒網(wǎng)(公眾號:雷鋒網(wǎng)),比如說,醫(yī)生和病人之間的比例是比較穩(wěn)定的,那就可以用新聞中報道的醫(yī)療人員數(shù)量,來反推病人數(shù)量。

他表示,其實,所有的數(shù)據(jù)都可能存在一些人為的誤差或者統(tǒng)計誤差,沒有任何地區(qū)的可信度是百分之百;但是相對來說,美國的數(shù)據(jù)沖突比較少,在可信度上高一些,歐洲的數(shù)據(jù)可信度次于美國,因為西歐與東歐之間的不平衡,所以會取平均值。但印度、東南亞、日本等地區(qū)的數(shù)據(jù)就似乎存在一些問題,數(shù)據(jù)發(fā)布慢、數(shù)據(jù)沖突點較多,影響了數(shù)據(jù)可信度的設置。

到二月底,在之前以國內(nèi)數(shù)據(jù)為基礎建模、驗證的基礎上,李志斌開始對美國、歐洲兩個地區(qū)進行疫情數(shù)據(jù)預測。于是,在數(shù)據(jù)的基礎之上,李志斌打造了一個預測模型—;—;實際上,這是一個極為復雜的模型,加起來有上百個參數(shù),其中重要的參數(shù)有二三十個,分為以下三類:

第一類是疫情參數(shù)—;—;不同地區(qū)/國家/城市確診人數(shù)、人口、每日新增確診人數(shù)、疑似人數(shù)、每日檢測人數(shù)、死亡人數(shù)、治愈人數(shù)(含自愈人數(shù))、在診人數(shù)、入院人數(shù)(重癥人數(shù))。

第二類參數(shù)與地區(qū)/城市/國家特征相關(guān)—;—;城市類型(古城、現(xiàn)代城市、鄉(xiāng)村)、人口密度、氣溫、天氣(大雨、陰雨、有霧、天晴等)、城市60歲以上老年人口比例、城市平均年齡、城市建設情況(主要是下水道的狀況)。

第三類參數(shù)是關(guān)于資源和管治能力—;—;醫(yī)療資源、病床數(shù)量、社會組織能力、信息透明度、管理方式等等。

李志斌表示,在實際的操作過程中,一般是先用Excel收集數(shù)據(jù),然后導入到后臺數(shù)據(jù)庫中,在用自己開發(fā)的軟件模型(里面包含了算法)來得出三個結(jié)論,最后自己會再人為地就結(jié)果進行判斷—;—;他強調(diào),有很多參數(shù)是不能量化的,比如說社會情緒;所以需要人為參與。

他還表示:再好的軟件也不能百分之百預測準確。

當大船和小船同時遇見冰山

畢業(yè)于清華大學的李志斌,有著超越數(shù)據(jù)分析之外的超前洞見和思維。

比如說,在建模過程中,李志斌是從國內(nèi)的數(shù)據(jù)開始的,這些數(shù)據(jù)不僅對李志斌的建模過程產(chǎn)生了重要影響,也讓他得出了一些觀察。于是,武漢封城前一天,他就在自己所在的"清華80同學群"里和同學們分享了兩個想法:

一是武漢應當立即封城,因為數(shù)據(jù)上升太嚇人;

二是在湖北尤其是武漢地區(qū)快速建立二三十個網(wǎng)格式野戰(zhàn)醫(yī)院,作為隔離救治中心,所謂野戰(zhàn)醫(yī)院,也就是后來的方艙醫(yī)院,因為疫情發(fā)展太猛,隔離病人是比治療更為關(guān)鍵的防控措施。

這些想法在同學群里引起了很多討論,當然也有質(zhì)疑和反對,但更多的是同學們的積極參與,并提出了好多更好的想法和建議,獲益良多。后來的事實證明,這些想法都是中肯的,并且也被官方后續(xù)采取的措施所印證—;—;其中關(guān)于野戰(zhàn)醫(yī)院等想法更是超前了兩周。

除了上述建議,李志斌還在數(shù)據(jù)分析和模型構(gòu)建的過程中發(fā)現(xiàn),成為疫情爆發(fā)點的城市往往具備幾個特征:

老城區(qū);

氣候潮濕;

氣溫5-15度;

下水系統(tǒng)老化;

老年人比例高。

值得一提的是,在不同國家的疫情爆發(fā)城市,如中國武漢、韓國大邱、意大利米蘭、伊朗德黑蘭、美國紐約等,都大致符合這些特征。

對于這些特征的歸因,李志斌強調(diào),其中夾雜了個人的主觀合理猜測,但也經(jīng)過一系列的結(jié)果驗證,最終才體現(xiàn)在預測結(jié)果中。

他還表示,實際上,在參數(shù)中,還涉及到社會組織方式、管理模式、社會信息透明度等問題,所以他在預測中也會把結(jié)果設定為悲觀或樂觀。

如果按照李志斌在在4月4日給出的悲觀預測結(jié)果,他對美國感染人數(shù)的總體預測準確率高達96%。


李志斌對美國感染人數(shù)的預測(悲觀),準確率高達96%

不過,在專訪中,盡管有人為參與,但李志斌還是強調(diào)了數(shù)據(jù)在決策中的絕對地位。他表示,即使是拋開疫情不談,在一個日常的決策過程中,數(shù)據(jù)的重要性可以說是百分之百的;這些數(shù)據(jù)不僅僅要真實,而且要全面,還要透明,即使在后續(xù)過程中有人的參與,也是要基于這些數(shù)據(jù)判斷而來的—;—;數(shù)據(jù),正是決策的基礎。

那么,基于數(shù)據(jù)的決策,有多大的覆蓋面呢?

李志斌認為,即使是新冠肺炎疫情這樣的頗具偶然性、又包含政治、經(jīng)濟等復雜社會因素的群體性公共事件,也是可以預測的。

他表示,類似于傳染病的情況,它的發(fā)展存在著一種特定的模式(Pattern),偶然之中有規(guī)律在,我們也許無法掌握100%準確的規(guī)律,但是在一定的規(guī)律占比下,我們依然可以做出一些判斷和決策—;—;當然前提是巨大的有效數(shù)據(jù)量。

由此,李志斌還談到了一個有趣的比喻:

一只大船和一只小船,在突然遇到冰山時,它們勢必要拐彎;但相對來說,大船的結(jié)局顯然更具有可預測性。小船一下子就改過來了,但大船的體量太大,有一個慣性,因此它有更大的可能性撞上冰山—;—;這個慣性就是規(guī)律,而船的體量本身,就是數(shù)據(jù)量。

數(shù)據(jù)量越大、數(shù)據(jù)越準確、相關(guān)信息越透明,這種群體性事件發(fā)生的時候就越容易預測、且預測越準確—;—;李志斌最后如是說。

本站聲明: 本文章由作者或相關(guān)機構(gòu)授權(quán)發(fā)布,目的在于傳遞更多信息,并不代表本站贊同其觀點,本站亦不保證或承諾內(nèi)容真實性等。需要轉(zhuǎn)載請聯(lián)系該專欄作者,如若文章內(nèi)容侵犯您的權(quán)益,請及時聯(lián)系本站刪除。
換一批
延伸閱讀

LED驅(qū)動電源的輸入包括高壓工頻交流(即市電)、低壓直流、高壓直流、低壓高頻交流(如電子變壓器的輸出)等。

關(guān)鍵字: 驅(qū)動電源

在工業(yè)自動化蓬勃發(fā)展的當下,工業(yè)電機作為核心動力設備,其驅(qū)動電源的性能直接關(guān)系到整個系統(tǒng)的穩(wěn)定性和可靠性。其中,反電動勢抑制與過流保護是驅(qū)動電源設計中至關(guān)重要的兩個環(huán)節(jié),集成化方案的設計成為提升電機驅(qū)動性能的關(guān)鍵。

關(guān)鍵字: 工業(yè)電機 驅(qū)動電源

LED 驅(qū)動電源作為 LED 照明系統(tǒng)的 “心臟”,其穩(wěn)定性直接決定了整個照明設備的使用壽命。然而,在實際應用中,LED 驅(qū)動電源易損壞的問題卻十分常見,不僅增加了維護成本,還影響了用戶體驗。要解決這一問題,需從設計、生...

關(guān)鍵字: 驅(qū)動電源 照明系統(tǒng) 散熱

根據(jù)LED驅(qū)動電源的公式,電感內(nèi)電流波動大小和電感值成反比,輸出紋波和輸出電容值成反比。所以加大電感值和輸出電容值可以減小紋波。

關(guān)鍵字: LED 設計 驅(qū)動電源

電動汽車(EV)作為新能源汽車的重要代表,正逐漸成為全球汽車產(chǎn)業(yè)的重要發(fā)展方向。電動汽車的核心技術(shù)之一是電機驅(qū)動控制系統(tǒng),而絕緣柵雙極型晶體管(IGBT)作為電機驅(qū)動系統(tǒng)中的關(guān)鍵元件,其性能直接影響到電動汽車的動力性能和...

關(guān)鍵字: 電動汽車 新能源 驅(qū)動電源

在現(xiàn)代城市建設中,街道及停車場照明作為基礎設施的重要組成部分,其質(zhì)量和效率直接關(guān)系到城市的公共安全、居民生活質(zhì)量和能源利用效率。隨著科技的進步,高亮度白光發(fā)光二極管(LED)因其獨特的優(yōu)勢逐漸取代傳統(tǒng)光源,成為大功率區(qū)域...

關(guān)鍵字: 發(fā)光二極管 驅(qū)動電源 LED

LED通用照明設計工程師會遇到許多挑戰(zhàn),如功率密度、功率因數(shù)校正(PFC)、空間受限和可靠性等。

關(guān)鍵字: LED 驅(qū)動電源 功率因數(shù)校正

在LED照明技術(shù)日益普及的今天,LED驅(qū)動電源的電磁干擾(EMI)問題成為了一個不可忽視的挑戰(zhàn)。電磁干擾不僅會影響LED燈具的正常工作,還可能對周圍電子設備造成不利影響,甚至引發(fā)系統(tǒng)故障。因此,采取有效的硬件措施來解決L...

關(guān)鍵字: LED照明技術(shù) 電磁干擾 驅(qū)動電源

開關(guān)電源具有效率高的特性,而且開關(guān)電源的變壓器體積比串聯(lián)穩(wěn)壓型電源的要小得多,電源電路比較整潔,整機重量也有所下降,所以,現(xiàn)在的LED驅(qū)動電源

關(guān)鍵字: LED 驅(qū)動電源 開關(guān)電源

LED驅(qū)動電源是把電源供應轉(zhuǎn)換為特定的電壓電流以驅(qū)動LED發(fā)光的電壓轉(zhuǎn)換器,通常情況下:LED驅(qū)動電源的輸入包括高壓工頻交流(即市電)、低壓直流、高壓直流、低壓高頻交流(如電子變壓器的輸出)等。

關(guān)鍵字: LED 隧道燈 驅(qū)動電源
關(guān)閉