這不是成為物理學家的好時機。
上面這句話是 Oscar Boykin 說的。他曾在喬治亞理工學院學習物理學,2002年在加州大學洛杉磯分校完成物理學博士學位。四年前,瑞士大型強子對撞機(LHC)的物理學家們探測到希格斯玻色子(Higgs boson),這是20世紀60年代首次提出的亞原子粒子。正如 Boykin 所指出的,每個物理學家都渴望發(fā)現(xiàn)它。但是,希格斯玻色子的發(fā)現(xiàn)并沒有擾亂宇宙的理論模型。它沒有改變?nèi)魏螙|西,也沒有給物理學家?guī)砣魏涡碌呐Ψ较颉?ldquo;當物理學中出現(xiàn)了什么問題時,物理學家們會很興奮;但現(xiàn)在的情況是,物理學中沒有太多問題了。”Boykin 說,“對物理學家來說,這是個令人泄氣的領域。”再加上,物理學家的薪資也不高。
Boykin 不再當物理學家了。他現(xiàn)在是硅谷的一名軟件工程師。這是成為軟件工程師的好時機。
Boykin 在 Stripe 公司工作,這是一家估值超過90億美元的創(chuàng)業(yè)公司,主要業(yè)務是幫助企業(yè)接受在線支付。Boykin 幫助構建了公司的軟件系統(tǒng),該系統(tǒng)從公司提供的服務中收集數(shù)據(jù)。Boykin 的工作任務是對這些服務未來可能發(fā)生的狀況進行預測,包括預測何時、何地、以何種方式將可能發(fā)生欺詐性交易。作為一名物理學家,Boykin 非常適合這項工作,它需要非常多的數(shù)學知識和很好的抽象思維能力。不像物理學家,Boykin 現(xiàn)在工作的領域是一個能提供無限挑戰(zhàn)和可能性的領域。而且,薪資也非??捎^。
如果物理學和軟件工程是亞原子粒子,那么硅谷就是它們發(fā)生碰撞的地方。除了 Boykin 之外,Stripe 的其他三位工程師也是物理學家出身。去年12月,通用電氣收購機器學習創(chuàng)業(yè)公司 Wise.io 時,首席執(zhí)行官 Jeff Immelt 自豪地說他得到了一家全是物理學家的公司,其中最著名的是加州大學天體物理學家 Joshua Bloom。開源機器學習平臺 H20,其用戶有來自世界各地的70000名數(shù)據(jù)科學家,是在曾在 SLAC 國家加速器實驗室工作的瑞士物理學家 Arno Candel 的幫助下建立的。微軟的數(shù)據(jù)科學主管 Vijay Narayanan 是一名天體物理學家,他手下的幾名研究員也都是物理學家。
這不是偶發(fā)事件。Stripe 總裁兼聯(lián)合創(chuàng)始人 John Collison 說:“我們并不是特意跑到大學,然后找來一群物理學家。事情只是自然而然地變成這樣了。”而且,這是發(fā)生在硅谷的變化。因為不管在結構上還是技術上,互聯(lián)網(wǎng)公司所做的事情越來越適合物理學家所擁有的技能。
物理學家進入計算機領域是非常自然的
當然了,物理學家從很早以來就在計算機技術方面發(fā)揮了重要的作用,就像他們在其他許多領域也有著重要作用一樣。幫助設計了最早的計算機之一的 ENIAC 的 John Mauchly 是物理學家。發(fā)明 C 語言的 Dennis Ritchie 也是物理學家。
但是對打算進入計算機科學領域的物理學家來說,現(xiàn)在是一個特別成熟的時機。這是由于機器學習的興起,機器需要通過分析大量數(shù)據(jù)來學習任務,這種新興的數(shù)據(jù)科學和 AI 正是最適合物理學家的方向。
此外,業(yè)界已經(jīng)開始廣泛采納神經(jīng)網(wǎng)絡技術,這是模仿人類大腦結構的數(shù)學模型或計算模型。但這些神經(jīng)網(wǎng)絡其實是大規(guī)模的數(shù)學,主要是線性代數(shù)和概率論。計算機科學家不一定擅長這些數(shù)學領域,但物理學家相反。“對物理學家來說唯一需要從頭開始的是學習如何優(yōu)化這些神經(jīng)網(wǎng)絡,以及訓練它們,但這是相對簡單的。”Boykin 說。方法之一是“牛頓法”(Newton’s method),此牛頓是指物理學家的牛頓。
微軟劍橋研究實驗室主管 Chris Bishop 早在30年前就感受到了同樣的風氣,當時神經(jīng)網(wǎng)絡剛剛開始在學術界顯示出效果。這也是他從物理學轉到機器學習的原因,他說:“物理學家進入機器學習領域是非常自然的,比計算機科學家更加自然。”
挑戰(zhàn)的空間
Boykin 說,十年前,他的許多物理學家朋友紛紛投身金融界。同樣,物理學家的數(shù)學才能在華爾街也非常吃香,數(shù)學是預測市場價值的方式之一。一種關鍵的方法是 Black-Scholes 模型,這是一種判斷金融衍生物價值的方法。但 Black-Scholes 模型也是助長了2008年的金融危機的因素之一。Boykin 以及其他物理學家說,現(xiàn)在,他們的物理學家同事們更多地進入了數(shù)據(jù)科學以及其他類型的計算機技術領域。
大約十年前,許多物理學家進入頂尖的科技公司,協(xié)助建立所謂的大數(shù)據(jù)軟件,這些系統(tǒng)在數(shù)百甚至數(shù)千臺機器上處理數(shù)據(jù)。在 Twitter 公司,Boykin 主導設計了一個名為 Summingbird 的這樣的系統(tǒng);在另一家名為 Cloudant 的創(chuàng)業(yè)公司,三名認識于 MIT 物理系的研究者也創(chuàng)建了類似的軟件。物理學家們知道如何處理數(shù)據(jù)。在 MIT,Cloudant 的創(chuàng)始人就在處理來自大型強子對撞機的大量數(shù)據(jù)集,而構建這些非常復雜的系統(tǒng)需要有很強的抽象思維。然后,一旦這些系統(tǒng)建立起來,許多物理學家就能直接利用這些數(shù)據(jù)。
在 Google 的早期,在機房中為公司構建大規(guī)模分布式系統(tǒng)的關鍵人物之一是 Yonatan Zunger,他擁有斯坦福大學弦理論(string theory)博士學位。Kevin Scott 加入 Google 的廣告團隊時,他的職責是從 Google 的各業(yè)務中獲取數(shù)據(jù),并利用這些數(shù)據(jù)預測投放哪些廣告能獲得最多的點擊量。為此,他聘請了無數(shù)的物理學家。不像許多計算機科學家,物理學家們非常適合機器學習的實驗性質。現(xiàn)任 LinkedIn 首席技術官的 Scott 說,“這(機器學習)簡直就像一門實驗科學。”
現(xiàn)在大數(shù)據(jù)軟件已經(jīng)很常見了——Stripe 使用的是 Boykin 在 Twitter 時設計的 Summingbird 的開源版本,該框架也幫助機器學習模型驅動了許多其他公司的預測。這為物理學家們提供了進入硅谷的更廣闊的道路。在 Stripe,Boykin 的團隊還包括 Roban Kramer(物理學博士,哥倫比亞大學),Christian Anderson(物理學碩士,哈佛大學)和 Kelley Rivoire(物理學學士,麻省理工學院)。他們來科技公司,因為他們適合這樣的工作。當然,也因為錢。正如 Boykin 說的:“科技公司的工資高得荒謬!”但他們來,還因為有很多困難的問題亟待他們解決。
Anderson 在獲得博士學位之前就離開了哈佛,因為他對物理學這個領域的看法和 Boykin 如出一轍——是一種回報率遞減的知識追求。但互聯(lián)網(wǎng)不是這樣?;ヂ?lián)網(wǎng)的機會更多,有待解決的問題更多,挑戰(zhàn)的空間也更大。
未來
今天,物理學家正在侵入硅谷的公司。但在往后幾年,類似的現(xiàn)象會進一步蔓延。機器學習不僅將在世界范圍里改變分析數(shù)據(jù)的方式,而且將改變構建軟件的方式。神經(jīng)網(wǎng)絡已經(jīng)重塑了圖像識別、語音識別、機器翻譯以及軟件接口的本質。正如微軟的 Chris Bishop 所說,軟件工程正在從基于邏輯的人工編碼轉向基于概率和不確定性的機器學習模型。Google、Facebook 這樣的公司紛紛開始用這種新的思維方式培訓他們的工程師。最終,計算行業(yè)的其他公司也將跟上。
換句話說,物理學家們涌入硅谷當工程師是一個更大的變化的跡象。不久,硅谷的工程師們又將涌回當物理學家。





