日本黄色一级经典视频|伊人久久精品视频|亚洲黄色色周成人视频九九九|av免费网址黄色小短片|黄色Av无码亚洲成年人|亚洲1区2区3区无码|真人黄片免费观看|无码一级小说欧美日免费三级|日韩中文字幕91在线看|精品久久久无码中文字幕边打电话

當前位置:首頁 > 智能硬件 > 人工智能AI
[導(dǎo)讀] 從數(shù)據(jù)稀缺到現(xiàn)在有大量的數(shù)據(jù),近年來,可用的數(shù)據(jù)量呈指數(shù)級增長,大數(shù)據(jù)變得無處不在。這是由于數(shù)據(jù)記錄設(shè)備數(shù)量的巨大增長,以及這些設(shè)備之間通過物聯(lián)網(wǎng)連接。似乎每個人都有收集、分析大數(shù)據(jù)的力量。

從數(shù)據(jù)稀缺到現(xiàn)在有大量的數(shù)據(jù),近年來,可用的數(shù)據(jù)量呈指數(shù)級增長,大數(shù)據(jù)變得無處不在。這是由于數(shù)據(jù)記錄設(shè)備數(shù)量的巨大增長,以及這些設(shè)備之間通過物聯(lián)網(wǎng)連接。似乎每個人都有收集、分析大數(shù)據(jù)的力量。

但是,大數(shù)據(jù)真的是萬能的嗎?毫無疑問,大數(shù)據(jù)已經(jīng)在某些領(lǐng)域產(chǎn)生了至關(guān)重要的影響。例如,幾乎每一個成功的人工智能解決方案都涉及大數(shù)據(jù)處理問題。

首先要注意的是,盡管AI目前非常擅長在大型數(shù)據(jù)集中查找模式和關(guān)系,但它仍然不是很智能。計算數(shù)字可以有效地識別并發(fā)現(xiàn)數(shù)據(jù)中的細微模式,但不能直接告訴我們這些相關(guān)關(guān)系中哪些實際上有意義。

相關(guān)性和因果關(guān)系

我們都知道“相關(guān)性并不意味著因果關(guān)系?!叭欢祟惖拇竽X天生就會尋找規(guī)律,當我們看到曲線傾斜在一起,數(shù)據(jù)中出現(xiàn)明顯的規(guī)律時,我們的大腦就會自動給出規(guī)律。”

然而,從統(tǒng)計數(shù)據(jù)來看,我們?nèi)匀粺o法實現(xiàn)這一飛躍?!短摷傧嚓P(guān)性》(false)一書的作者Tyler Vigen在自己的網(wǎng)站上對此進行了調(diào)侃,還有很多例子比如展示冰淇淋是如何明顯地導(dǎo)致許多壞事的,從森林大火到鯊魚襲擊和脊髓灰質(zhì)炎爆發(fā)。

看看這些情節(jié),人們可能會爭辯說,我們很可能早就應(yīng)該禁止冰淇淋了。 而且,實際上,在1940年代的小兒麻痹癥例子中,公共衛(wèi)生專家建議人們停止吃冰淇淋作為“反政治飲食”的一部分。幸運的是,他們最終意識到小兒麻痹癥暴發(fā)與冰淇淋消費之間的相關(guān)性是“完全是由于小兒麻痹癥的爆發(fā)在夏季最為普遍”。

在統(tǒng)計中,虛假關(guān)系或虛假相關(guān)性是一種數(shù)學(xué)關(guān)系,其中兩個或多個事件或變量相關(guān)聯(lián),但由于某種偶然的或某些第三個未見因素的存在而因果相關(guān)(稱為“常見響應(yīng)”變量”、“混雜因素”或“潛伏變量”)。這樣的“潛伏變量”的例子可以是冰淇淋銷量與鯊魚襲擊之間的相關(guān)性(雖然冰淇淋銷量的增長不會導(dǎo)致鯊魚襲擊人們)。但是,這兩個數(shù)字之間有一個共同的環(huán)節(jié),即溫度。較高的溫度導(dǎo)致更多的人購買冰淇淋以及更多的人去游泳。因此,這個“潛變量”確實是表觀相關(guān)性的原因。幸運的是,我們已經(jīng)學(xué)會將因果關(guān)系與因果關(guān)系分開。而且,在炎熱的夏日,我們?nèi)匀豢梢韵硎鼙苛埽槐負男郝楸园Y爆發(fā)和鯊魚襲擊!

相關(guān)性的力量和局限性

有了足夠的數(shù)據(jù),將會發(fā)現(xiàn)計算能力和統(tǒng)計算法的模式。但并不是所有的模式都有意義,因為虛假模式的數(shù)量很容易超過有意義的模式。將大數(shù)據(jù)與算法結(jié)合起來,如果能正確地應(yīng)用于解決問題,將是一個非常有用的工具。然而,沒有科學(xué)家會認為你可以通過單獨處理數(shù)據(jù)來解決這個問題,無論統(tǒng)計分析是多么強大,您應(yīng)該始終基于對要解決的問題的基本理解來進行分析。

數(shù)據(jù)科學(xué)是科學(xué)的終結(jié)嗎?

2008年6月,《連線》(Wired)雜志前主編C. Anderson寫了一篇頗具煽動性的文章,題為《理論的終結(jié):數(shù)據(jù)洪流使科學(xué)方法過時》(The End of Theory: The Data Makes The Scientific Method Obsolete)?!跋嚓P(guān)性取代因果關(guān)系,即使沒有連貫的模型和統(tǒng)一的理論,科學(xué)也能進步。”

這種方法的強度和通用性依賴于數(shù)據(jù)量:數(shù)據(jù)越多,基于計算發(fā)現(xiàn)的相關(guān)性的方法就越強大和有效。我們可以簡單地把數(shù)字輸入計算機,讓統(tǒng)計算法自動發(fā)現(xiàn)有趣的模式和見解。

但是,這種簡化的分析方法也存在一些潛在的陷阱,可以通過John Poppelaars在博客上找到的示例很好地說明 :

假設(shè)我們要為某些變量Y創(chuàng)建一個預(yù)測模型。例如公司的股價、在線廣告的點擊率或下周的天氣。接下來,我們收集所有可以使用的數(shù)據(jù),并將其放入統(tǒng)計過程中,以找到Y(jié)的最佳預(yù)測模型。常見的過程是首先使用所有變量對模型進行估計,篩選出不重要的變量,然后使用所選的變量子集重新估算模型,然后重復(fù)此過程,直到找到重要的模型為止。

但是,Anderson提出的分析方法存在一些嚴重的缺陷。我選擇了一個實例,從0到1的均勻分布中抽取100個樣本,為Y創(chuàng)建了一組數(shù)據(jù)點,所以它是隨機噪聲。接下來,我通過從0到1之間的均勻分布中抽取100個樣本,創(chuàng)建了一組50個解釋變量X(I)。因此,所有50個解釋變量也是隨機噪聲。我使用所有的X(I)變量來預(yù)測y,估計一個線性回歸模型。因為沒有任何相關(guān)的東西(所有的均布和自變量),所以期望R2(0),但實際上不是。結(jié)果是0。5。對于基于隨機噪聲的回歸來說還不錯!幸運的是,這個模型并不重要。逐步剔除不顯著的變量,重新估計模型。重復(fù)這個過程,直到找到一個重要的模型。經(jīng)過幾個步驟后,發(fā)現(xiàn)一個顯著性模型,調(diào)整后的R平方為0.4,7個變量的顯著性水平至少為99%。再次,我們是在回歸隨機噪聲,它絕對沒有關(guān)系,但我們?nèi)匀徽业揭粋€有7個重要參數(shù)的顯著模型。如果我們只是將數(shù)據(jù)輸入統(tǒng)計算法來尋找模式,就會出現(xiàn)這種情況。

數(shù)據(jù)集越大,噪聲越強

最近的研究證明,隨著數(shù)據(jù)集的增長,它們必定包含任意相關(guān)性。這些相關(guān)性只是由于數(shù)據(jù)的大小而出現(xiàn),這表明,許多相關(guān)性都是虛假的。不幸的是,很多信息往往表面表現(xiàn)得很少。

這是處理多維數(shù)據(jù)的應(yīng)用程序中的主要問題。舉例來說,假設(shè)您從一家工廠的數(shù)千個傳感器中收集傳感器數(shù)據(jù),然后挖掘這些數(shù)據(jù)以獲取模式以優(yōu)化性能。在這種情況下,您很容易被數(shù)據(jù)表現(xiàn)的表象所迷惑,而不是真正的運營績效指標。無論從財務(wù)上還是在工廠的安全運行方面,這都可能是一個壞消息。

添加數(shù)據(jù)和添加信息

作為數(shù)據(jù)科學(xué)家,我們可能經(jīng)常會說,改善人工智能模型的最佳解決方案是“添加更多數(shù)據(jù)”。然而,僅僅“添加更多數(shù)據(jù)”就能提高模型性能嗎?不是這樣的。我們應(yīng)該關(guān)注的是“添加更多的信息”。“添加數(shù)據(jù)”和“添加信息”之間的區(qū)別是至關(guān)重要的:添加更多的數(shù)據(jù)并不等于添加更多的信息(至少是有用和正確的信息)。相反,由于盲目地添加越來越多的數(shù)據(jù),我們有可能添加包含錯誤信息的數(shù)據(jù),這些錯誤信息會相應(yīng)地降低模型的性能。隨著數(shù)據(jù)的大量訪問以及處理數(shù)據(jù)的計算能力,考慮這一點變得越來越重要。

結(jié)論

那么,上述挑戰(zhàn)是否應(yīng)該阻止您采用以數(shù)據(jù)為依據(jù)的決策? 不,數(shù)據(jù)驅(qū)動的決策將繼續(xù)存在。隨著我們獲得更多有關(guān)如何最佳利用數(shù)據(jù)和信息以提高績效的知識,這些將變得越來越有價值。

但是要意識到,要使方案成功,不僅需要硬件和大量數(shù)據(jù),大數(shù)據(jù)和計算能力也是重要的組成部分。而且,您應(yīng)該了解連接數(shù)據(jù)的基本機制。數(shù)據(jù)不能說明一切,是人類給數(shù)字賦予了含義。數(shù)據(jù)的數(shù)量、種類是無法更改的。

本站聲明: 本文章由作者或相關(guān)機構(gòu)授權(quán)發(fā)布,目的在于傳遞更多信息,并不代表本站贊同其觀點,本站亦不保證或承諾內(nèi)容真實性等。需要轉(zhuǎn)載請聯(lián)系該專欄作者,如若文章內(nèi)容侵犯您的權(quán)益,請及時聯(lián)系本站刪除。
換一批
延伸閱讀

LED驅(qū)動電源的輸入包括高壓工頻交流(即市電)、低壓直流、高壓直流、低壓高頻交流(如電子變壓器的輸出)等。

關(guān)鍵字: 驅(qū)動電源

在工業(yè)自動化蓬勃發(fā)展的當下,工業(yè)電機作為核心動力設(shè)備,其驅(qū)動電源的性能直接關(guān)系到整個系統(tǒng)的穩(wěn)定性和可靠性。其中,反電動勢抑制與過流保護是驅(qū)動電源設(shè)計中至關(guān)重要的兩個環(huán)節(jié),集成化方案的設(shè)計成為提升電機驅(qū)動性能的關(guān)鍵。

關(guān)鍵字: 工業(yè)電機 驅(qū)動電源

LED 驅(qū)動電源作為 LED 照明系統(tǒng)的 “心臟”,其穩(wěn)定性直接決定了整個照明設(shè)備的使用壽命。然而,在實際應(yīng)用中,LED 驅(qū)動電源易損壞的問題卻十分常見,不僅增加了維護成本,還影響了用戶體驗。要解決這一問題,需從設(shè)計、生...

關(guān)鍵字: 驅(qū)動電源 照明系統(tǒng) 散熱

根據(jù)LED驅(qū)動電源的公式,電感內(nèi)電流波動大小和電感值成反比,輸出紋波和輸出電容值成反比。所以加大電感值和輸出電容值可以減小紋波。

關(guān)鍵字: LED 設(shè)計 驅(qū)動電源

電動汽車(EV)作為新能源汽車的重要代表,正逐漸成為全球汽車產(chǎn)業(yè)的重要發(fā)展方向。電動汽車的核心技術(shù)之一是電機驅(qū)動控制系統(tǒng),而絕緣柵雙極型晶體管(IGBT)作為電機驅(qū)動系統(tǒng)中的關(guān)鍵元件,其性能直接影響到電動汽車的動力性能和...

關(guān)鍵字: 電動汽車 新能源 驅(qū)動電源

在現(xiàn)代城市建設(shè)中,街道及停車場照明作為基礎(chǔ)設(shè)施的重要組成部分,其質(zhì)量和效率直接關(guān)系到城市的公共安全、居民生活質(zhì)量和能源利用效率。隨著科技的進步,高亮度白光發(fā)光二極管(LED)因其獨特的優(yōu)勢逐漸取代傳統(tǒng)光源,成為大功率區(qū)域...

關(guān)鍵字: 發(fā)光二極管 驅(qū)動電源 LED

LED通用照明設(shè)計工程師會遇到許多挑戰(zhàn),如功率密度、功率因數(shù)校正(PFC)、空間受限和可靠性等。

關(guān)鍵字: LED 驅(qū)動電源 功率因數(shù)校正

在LED照明技術(shù)日益普及的今天,LED驅(qū)動電源的電磁干擾(EMI)問題成為了一個不可忽視的挑戰(zhàn)。電磁干擾不僅會影響LED燈具的正常工作,還可能對周圍電子設(shè)備造成不利影響,甚至引發(fā)系統(tǒng)故障。因此,采取有效的硬件措施來解決L...

關(guān)鍵字: LED照明技術(shù) 電磁干擾 驅(qū)動電源

開關(guān)電源具有效率高的特性,而且開關(guān)電源的變壓器體積比串聯(lián)穩(wěn)壓型電源的要小得多,電源電路比較整潔,整機重量也有所下降,所以,現(xiàn)在的LED驅(qū)動電源

關(guān)鍵字: LED 驅(qū)動電源 開關(guān)電源

LED驅(qū)動電源是把電源供應(yīng)轉(zhuǎn)換為特定的電壓電流以驅(qū)動LED發(fā)光的電壓轉(zhuǎn)換器,通常情況下:LED驅(qū)動電源的輸入包括高壓工頻交流(即市電)、低壓直流、高壓直流、低壓高頻交流(如電子變壓器的輸出)等。

關(guān)鍵字: LED 隧道燈 驅(qū)動電源
關(guān)閉