日本黄色一级经典视频|伊人久久精品视频|亚洲黄色色周成人视频九九九|av免费网址黄色小短片|黄色Av无码亚洲成年人|亚洲1区2区3区无码|真人黄片免费观看|无码一级小说欧美日免费三级|日韩中文字幕91在线看|精品久久久无码中文字幕边打电话

當前位置:首頁 > 智能硬件 > 人工智能AI
[導讀] 機器學習 概述 機器學習 是使用計算機來彰顯數(shù)據(jù)背后的真實含義,它為了把無序的數(shù)據(jù)轉(zhuǎn)換成有用的信息。 海量的數(shù)據(jù) 獲取有用的信息 機器學習 場景 例如:識

機器學習 概述

機器學習 是使用計算機來彰顯數(shù)據(jù)背后的真實含義,它為了把無序的數(shù)據(jù)轉(zhuǎn)換成有用的信息。

海量的數(shù)據(jù)

獲取有用的信息

機器學習 場景

例如:識別動物貓模式識別(官方標準):人們通過大量的經(jīng)驗,得到結(jié)論,從而判斷它就是貓。機器學習(數(shù)據(jù)學習):人們通過閱讀進行學習,觀察它會叫、小眼睛、兩只耳朵、四條腿、一條尾巴,得到結(jié)論,從而判斷它就是貓。深度學習(深入數(shù)據(jù)):人們通過深入了解它,發(fā)現(xiàn)它會‘喵喵’的叫、與同類的貓科動物很類似,得到結(jié)論,從而判斷它就是貓。(深度學習常用領(lǐng)域:語音識別、圖像識別)模式識別(pattern recognition): 模式識別是最古老的(作為一個術(shù)語而言,可以說是很過時的)。 我們把環(huán)境與客體統(tǒng)稱為“模式”,識別是對模式的一種認知,是如何讓一個計算機程序去做一些看起來很“智能”的事情。 通過融于智慧和直覺后,通過構(gòu)建程序,識別一些事物,而不是人,例如: 識別數(shù)字。機器學習(machine learning): 機器學習是最基礎(chǔ)的(當下初創(chuàng)公司和研究實驗室的熱點領(lǐng)域之一)。 在90年代初,人們開始意識到一種可以更有效地構(gòu)建模式識別算法的方法,那就是用數(shù)據(jù)(可以通過廉價勞動力采集獲得)去替換專家(具有很多圖像方面知識的人)。 “機器學習”強調(diào)的是,在給計算機程序(或者機器)輸入一些數(shù)據(jù)后,它必須做一些事情,那就是學習這些數(shù)據(jù),而這個學習的步驟是明確的。 機器學習(Machine Learning)是一門專門研究計算機怎樣模擬或?qū)崿F(xiàn)人類的學習行為,以獲取新的知識或技能,重新組織已有的知識結(jié)構(gòu)使之不斷改善自身性能的學科。深度學習(deep learning): 深度學習是非常嶄新和有影響力的前沿領(lǐng)域,我們甚至不會去思考-后深度學習時代。 深度學習是機器學習研究中的一個新的領(lǐng)域,其動機在于建立、模擬人腦進行分析學習的神經(jīng)網(wǎng)絡(luò),它模仿人腦的機制來解釋數(shù)據(jù),例如圖像,聲音和文本。參考地址: http://www.csdn.net/arTIcle/2015-03-24/2824301http://baike.baidu.com/link?url=76P-uA4EBrC3G-I__P1tqeO7eoDS709Kp4wYuHxc7GNkz_xn0NxuAtEohbpey7LUa2zUQLJxvIKUx4bnrEfOmsWLKbDmvG1PCoRkJisMTQka6-QReTrIxdYY3v93f55q

機器學習已應用于多個領(lǐng)域,遠遠超出大多數(shù)人的想象,橫跨:計算機科學、工程技術(shù)和統(tǒng)計學等多個學科。

搜索引擎: 根據(jù)你的搜索點擊,優(yōu)化你下次的搜索結(jié)果。

垃圾郵件: 會自動的過濾垃圾廣告郵件到垃圾箱內(nèi)。

超市優(yōu)惠券: 你會發(fā)現(xiàn),你在購買小孩子尿布的時候,售貨員會贈送你一張優(yōu)惠券可以兌換6罐啤酒。

郵局郵寄: 手寫軟件自動識別寄送賀卡的地址。

申請貸款: 通過你最近的金融活動信息進行綜合評定,決定你是否合格。

機器學習 組成

主要任務

分類:將實例數(shù)據(jù)劃分到合適的類別中。

回歸:主要用于預測數(shù)值型數(shù)據(jù)。(示例:股票價格波動的預測)

監(jiān)督學習

必須確定目標變量的值,以便機器學習算法可以發(fā)現(xiàn)特征和目標變量之間的關(guān)系。 (包括:分類和回歸)

樣本集:訓練數(shù)據(jù) + 測試數(shù)據(jù)

訓練樣本 = 特征(feature) + 目標變量(label: 分類-離散值/回歸-連續(xù)值)

特征通常是訓練樣本集的列,它們是獨立測量得到的。

目標變量: 目標變量是機器學習預測算法的測試結(jié)果。

在分類算法中目標變量的類型通常是標稱型(如:真與假),而在回歸算法中通常是連續(xù)型(如:1~100)。

知識表示:

可以采用規(guī)則集的形式【例如:數(shù)學成績大于90分為優(yōu)秀】

可以采用概率分布的形式【例如:通過統(tǒng)計分布發(fā)現(xiàn),90%的同學數(shù)學成績,在70分以下,那么大于70分定為優(yōu)秀】

可以使用訓練樣本集中的一個實例【例如:通過樣本集合,我們訓練出一個模型實例,得出 年輕,數(shù)學成績中高等,談吐優(yōu)雅,我們認為是優(yōu)秀】

非監(jiān)督學習

數(shù)據(jù)沒有類別信息,也不會給定目標值。

聚類:在無監(jiān)督學習中,將數(shù)據(jù)集分成由類似的對象組成多個類的過程稱為聚類。

密度估計:通過樣本分布的緊密程度,來估計與分組的相似性。

此外,無監(jiān)督學習還可以減少數(shù)據(jù)特征的維度,以便我們可以使用二維或三維圖形更加直觀地展示數(shù)據(jù)信息。

訓練過程

算法匯總

機器學習 使用

選擇算法需要考慮的兩個問題

1、算法場景

預測明天是否下雨,因為可以用歷史的天氣情況做預測,所以選擇監(jiān)督學習算法

給一群陌生的人進行分組,但是我們并沒有這些人的類別信息,所以選擇無監(jiān)督學習算法、通過他們身高、體重等特征進行處理。

2、需要收集或分析的數(shù)據(jù)是什么

舉例

機器學習 開發(fā)流程

* 收集數(shù)據(jù): 收集樣本數(shù)據(jù)* 準備數(shù)據(jù): 注意數(shù)據(jù)的格式* 分析數(shù)據(jù): 為了確保數(shù)據(jù)集中沒有垃圾數(shù)據(jù); 如果是算法可以處理的數(shù)據(jù)格式或可信任的數(shù)據(jù)源,則可以跳過該步驟; 另外該步驟需要人工干預,會降低自動化系統(tǒng)的價值。* 訓練算法: [機器學習算法核心]如果使用無監(jiān)督學習算法,由于不存在目標變量值,則可以跳過該步驟* 測試算法: [機器學習算法核心]評估算法效果* 使用算法: 將機器學習算法轉(zhuǎn)為應用程序

Python語言 優(yōu)勢

可執(zhí)行偽代碼

Python比較流行:使用廣泛、代碼范例多、豐富模塊庫,開發(fā)周期短

Python語言的特色:清晰簡練、易于理解

Python語言的缺點:唯一不足的是性能問題

Python相關(guān)的庫

科學函數(shù)庫:SciPy、NumPy(底層語言:C和Fortran)

繪圖工具庫:Matplotlib

本站聲明: 本文章由作者或相關(guān)機構(gòu)授權(quán)發(fā)布,目的在于傳遞更多信息,并不代表本站贊同其觀點,本站亦不保證或承諾內(nèi)容真實性等。需要轉(zhuǎn)載請聯(lián)系該專欄作者,如若文章內(nèi)容侵犯您的權(quán)益,請及時聯(lián)系本站刪除( 郵箱:macysun@21ic.com )。
換一批
延伸閱讀
關(guān)閉