日本黄色一级经典视频|伊人久久精品视频|亚洲黄色色周成人视频九九九|av免费网址黄色小短片|黄色Av无码亚洲成年人|亚洲1区2区3区无码|真人黄片免费观看|无码一级小说欧美日免费三级|日韩中文字幕91在线看|精品久久久无码中文字幕边打电话

當前位置:首頁 > 智能硬件 > 人工智能AI
[導讀] 人工智能之機器學習主要有三大類:1)分類;2)回歸;3)聚類。今天我們重點探討一下CART算法。 我們知道十大機器學習中決策樹算法占有兩席位置,即C4.5算法和CART算法,可見CART

人工智能之機器學習主要有三大類:1)分類;2)回歸;3)聚類。今天我們重點探討一下CART算法。

我們知道十大機器學習中決策樹算法占有兩席位置,即C4.5算法和CART算法,可見CART算法的重要性。下面重點介紹CART算法。

不同于ID3與C4.5,CART為一種二分決策樹,是滿二叉樹。CART算法由Breiman等人在 1984 年提出,它采用與傳統(tǒng)統(tǒng)計學完全不同的方式構建預測準則,它是以二叉樹的形式給出,易于理解、使用和解釋。由CART 模型構建的預測樹在很多情況下比常用的統(tǒng)計方法構建的代數學預測準則更加準確,且數據越復雜、變量越多,算法的優(yōu)越性就越顯著。

CART算法既可用于分類也可用于回歸。CART算法被稱為數據挖掘領域內里程碑式的算法。

CART算法概念:

CART(Classification andRegression Tree) 分類回歸樹是一種決策樹構建算法。CART是在給定輸入隨機變量X條件下輸出隨機變量Y的條件概率分布的學習方法。CART假設決策樹是二叉樹,內部結點特征的取值為“是”和“否”,左分支是取值為“是”的分支,右分支是取值為“否”的分支。這樣的決策樹等價于遞歸地二分每個特征,將輸入空間即特征空間劃分為有限個單元,并在這些單元上確定預測的概率分布,也就是在輸入給定的條件下輸出的條件概率分布。

CART算法既可以處理離散型問題,也可以處理連續(xù)型問題。這種算法在處理連續(xù)型問題時,主要通過使用二元切分來處理連續(xù)型變量,即特征值大于某個給定的值就走左子樹,或者就走右子樹。

CART算法組成:

CART算法組成如下:

1)決策樹生成:基于訓練數據集生成決策樹,生成的決策樹要盡量大;自上而下從根開始建立節(jié)點,在每個節(jié)點處要選擇一個最好(不同算法使用不同指標來定義"最好")的屬性來分裂,使得子節(jié)點中的訓練數據集盡量的純。

2)決策樹剪枝:用驗證數據集對已生成的樹進行剪枝并選擇最優(yōu)子樹,這時損失函數最小作為剪枝的標準。這里用代價復雜度剪枝CCP(Cost-Complexity Pruning)。

決策樹的生成就是通過遞歸地構建二叉決策樹的過程,對回歸樹用平方誤差最小化準則,對分類樹用基尼指數最小化準則,進行特征選擇,生成二叉樹。

CART決策樹生成:

1)回歸樹生成

回歸樹采用均方誤差作為損失函數,樹生成時會遞歸的按最優(yōu)特征與最優(yōu)特征下的最優(yōu)取值對空間進行劃分,直到滿足停止條件為止,停止條件可以人為設定,比如當切分后的損失減小值小于給定的閾值 ε,則停止切分,生成葉節(jié)點。對于生成的回歸樹,每個葉節(jié)點的類別為落到該葉節(jié)點數據的標簽的均值。

回歸樹為一棵二叉樹,每次都是按特征下的某個取值進行劃分,每一個內部節(jié)點都是做一個對應特征的判斷,直至走到葉節(jié)點得到其類別,構建這棵樹的難點在于如何選取最優(yōu)的切分特征與切分特征對應的切分變量。

回歸樹與模型樹既可以處理連續(xù)特征也可以處理離散特征。

回歸樹生成算法如下:

輸入:訓練數據集 D={(x1,y1),(x2,y2),…,(xN,yN)}

輸出:回歸樹 T

1)求解選擇切分特征 j 與切分特征取值 s ,j 將訓練集 D 劃分為兩部分,R1 與R2 ,依照(j,s)切分后如下:

R1(j,s)={xi|xji≤s} R2(j,s)={xi|xji>s}

c1=1N1∑xi∈R1yi c2=1N2∑xi∈R2yi

2)遍歷所有可能的解(j,s),找到最優(yōu)的 (j*,s*) ,最優(yōu)的解使得對應損失最小,按照最優(yōu)特征(j*,s*)來切分即可。

Min { ∑ (yi–c1)^2 +∑ (yi–c2)^2 }

j,s xi∈R1 xi∈R2

3)遞歸調用 1)和2),直到滿足停止條件。

4)返回決策樹 T。

回歸樹主要采用了分治策略,對于無法用唯一的全局線性回歸來優(yōu)化的目標進行分而治之,進而取得比較準確的結果,但分段取均值并不是一個明智的選擇,可以考慮將葉節(jié)點設置為一個線性函數,這便是所謂的分段線性模型樹。實驗表明:模型樹效果比回歸樹的效果要好一些。模型樹只需在回歸樹的基礎上稍加修改即可,對于分到葉節(jié)點的數據,采用線性回歸的最小均方損失來計算該節(jié)點的損失。

2)分類樹生成

分類樹是CART中用來分類的,不同于 ID3 與 C4.5,CART分類樹采用基尼指數來選擇最優(yōu)的切分特征,而且每次都是二分。

基尼指數是一個類似與熵的概念,對于一個有 K 種狀態(tài)對應的概率為 p1,p2,…,pK的隨機變量 X ,其基尼指數Gini定義如下:

Gini(X)=∑pk(1?pk)=1?∑kp2k

k k

在已知特征 A條件下集合 D 的基尼指數:

Gini(D,A)=(|D1|/|D|)*Gini(D1)+(|D2|/|D|)*Gini(D2)

Gini(D,A)取值越大,樣本的不確定性也越大,這一點與熵類似,所以選擇特征 A 的標準是 Gini(D,A) 的取值越小越好。

本站聲明: 本文章由作者或相關機構授權發(fā)布,目的在于傳遞更多信息,并不代表本站贊同其觀點,本站亦不保證或承諾內容真實性等。需要轉載請聯(lián)系該專欄作者,如若文章內容侵犯您的權益,請及時聯(lián)系本站刪除。
換一批
延伸閱讀

LED驅動電源的輸入包括高壓工頻交流(即市電)、低壓直流、高壓直流、低壓高頻交流(如電子變壓器的輸出)等。

關鍵字: 驅動電源

在工業(yè)自動化蓬勃發(fā)展的當下,工業(yè)電機作為核心動力設備,其驅動電源的性能直接關系到整個系統(tǒng)的穩(wěn)定性和可靠性。其中,反電動勢抑制與過流保護是驅動電源設計中至關重要的兩個環(huán)節(jié),集成化方案的設計成為提升電機驅動性能的關鍵。

關鍵字: 工業(yè)電機 驅動電源

LED 驅動電源作為 LED 照明系統(tǒng)的 “心臟”,其穩(wěn)定性直接決定了整個照明設備的使用壽命。然而,在實際應用中,LED 驅動電源易損壞的問題卻十分常見,不僅增加了維護成本,還影響了用戶體驗。要解決這一問題,需從設計、生...

關鍵字: 驅動電源 照明系統(tǒng) 散熱

根據LED驅動電源的公式,電感內電流波動大小和電感值成反比,輸出紋波和輸出電容值成反比。所以加大電感值和輸出電容值可以減小紋波。

關鍵字: LED 設計 驅動電源

電動汽車(EV)作為新能源汽車的重要代表,正逐漸成為全球汽車產業(yè)的重要發(fā)展方向。電動汽車的核心技術之一是電機驅動控制系統(tǒng),而絕緣柵雙極型晶體管(IGBT)作為電機驅動系統(tǒng)中的關鍵元件,其性能直接影響到電動汽車的動力性能和...

關鍵字: 電動汽車 新能源 驅動電源

在現(xiàn)代城市建設中,街道及停車場照明作為基礎設施的重要組成部分,其質量和效率直接關系到城市的公共安全、居民生活質量和能源利用效率。隨著科技的進步,高亮度白光發(fā)光二極管(LED)因其獨特的優(yōu)勢逐漸取代傳統(tǒng)光源,成為大功率區(qū)域...

關鍵字: 發(fā)光二極管 驅動電源 LED

LED通用照明設計工程師會遇到許多挑戰(zhàn),如功率密度、功率因數校正(PFC)、空間受限和可靠性等。

關鍵字: LED 驅動電源 功率因數校正

在LED照明技術日益普及的今天,LED驅動電源的電磁干擾(EMI)問題成為了一個不可忽視的挑戰(zhàn)。電磁干擾不僅會影響LED燈具的正常工作,還可能對周圍電子設備造成不利影響,甚至引發(fā)系統(tǒng)故障。因此,采取有效的硬件措施來解決L...

關鍵字: LED照明技術 電磁干擾 驅動電源

開關電源具有效率高的特性,而且開關電源的變壓器體積比串聯(lián)穩(wěn)壓型電源的要小得多,電源電路比較整潔,整機重量也有所下降,所以,現(xiàn)在的LED驅動電源

關鍵字: LED 驅動電源 開關電源

LED驅動電源是把電源供應轉換為特定的電壓電流以驅動LED發(fā)光的電壓轉換器,通常情況下:LED驅動電源的輸入包括高壓工頻交流(即市電)、低壓直流、高壓直流、低壓高頻交流(如電子變壓器的輸出)等。

關鍵字: LED 隧道燈 驅動電源
關閉