當前位置：首頁 > 智能硬件 > 人工智能AI

淺析如何在人工智能中機器學習

時間：2020-06-08 18:36:01

關(guān)鍵字：人工智能機器

手機看文章

掃描二維碼
隨時隨地手機看文章

[導讀] 機器學習概述機器學習是使用計算機來彰顯數(shù)據(jù)背后的真實含義，它為了把無序的數(shù)據(jù)轉(zhuǎn)換成有用的信息。海量的數(shù)據(jù) 獲取有用的信息機器學習場景例如：識

機器學習概述

機器學習是使用計算機來彰顯數(shù)據(jù)背后的真實含義，它為了把無序的數(shù)據(jù)轉(zhuǎn)換成有用的信息。

海量的數(shù)據(jù)

獲取有用的信息

機器學習場景

例如：識別動物貓模式識別（官方標準）：人們通過大量的經(jīng)驗，得到結(jié)論，從而判斷它就是貓。機器學習（數(shù)據(jù)學習）：人們通過閱讀進行學習，觀察它會叫、小眼睛、兩只耳朵、四條腿、一條尾巴，得到結(jié)論，從而判斷它就是貓。深度學習（深入數(shù)據(jù)）：人們通過深入了解它，發(fā)現(xiàn)它會‘喵喵’的叫、與同類的貓科動物很類似，得到結(jié)論，從而判斷它就是貓。（深度學習常用領(lǐng)域：語音識別、圖像識別）模式識別（pattern recognition）：模式識別是最古老的（作為一個術(shù)語而言，可以說是很過時的）。我們把環(huán)境與客體統(tǒng)稱為“模式”，識別是對模式的一種認知，是如何讓一個計算機程序去做一些看起來很“智能”的事情。通過融于智慧和直覺后，通過構(gòu)建程序，識別一些事物，而不是人，例如：識別數(shù)字。機器學習（machine learning）：機器學習是最基礎(chǔ)的（當下初創(chuàng)公司和研究實驗室的熱點領(lǐng)域之一）。在90年代初，人們開始意識到一種可以更有效地構(gòu)建模式識別算法的方法，那就是用數(shù)據(jù)（可以通過廉價勞動力采集獲得）去替換專家（具有很多圖像方面知識的人）。 “機器學習”強調(diào)的是，在給計算機程序（或者機器）輸入一些數(shù)據(jù)后，它必須做一些事情，那就是學習這些數(shù)據(jù)，而這個學習的步驟是明確的。機器學習（Machine Learning）是一門專門研究計算機怎樣模擬或?qū)崿F(xiàn)人類的學習行為，以獲取新的知識或技能，重新組織已有的知識結(jié)構(gòu)使之不斷改善自身性能的學科。深度學習（deep learning）：深度學習是非常嶄新和有影響力的前沿領(lǐng)域，我們甚至不會去思考-后深度學習時代。深度學習是機器學習研究中的一個新的領(lǐng)域，其動機在于建立、模擬人腦進行分析學習的神經(jīng)網(wǎng)絡(luò)，它模仿人腦的機制來解釋數(shù)據(jù)，例如圖像，聲音和文本。參考地址： http://www.csdn.net/arTIcle/2015-03-24/2824301http://baike.baidu.com/link？url=76P-uA4EBrC3G-I__P1tqeO7eoDS709Kp4wYuHxc7GNkz_xn0NxuAtEohbpey7LUa2zUQLJxvIKUx4bnrEfOmsWLKbDmvG1PCoRkJisMTQka6-QReTrIxdYY3v93f55q

機器學習已應用于多個領(lǐng)域，遠遠超出大多數(shù)人的想象，橫跨：計算機科學、工程技術(shù)和統(tǒng)計學等多個學科。

搜索引擎：根據(jù)你的搜索點擊，優(yōu)化你下次的搜索結(jié)果。

垃圾郵件：會自動的過濾垃圾廣告郵件到垃圾箱內(nèi)。

超市優(yōu)惠券：你會發(fā)現(xiàn)，你在購買小孩子尿布的時候，售貨員會贈送你一張優(yōu)惠券可以兌換6罐啤酒。

郵局郵寄：手寫軟件自動識別寄送賀卡的地址。

申請貸款：通過你最近的金融活動信息進行綜合評定，決定你是否合格。

機器學習組成

主要任務

分類：將實例數(shù)據(jù)劃分到合適的類別中。

回歸：主要用于預測數(shù)值型數(shù)據(jù)。（示例：股票價格波動的預測）

監(jiān)督學習

必須確定目標變量的值，以便機器學習算法可以發(fā)現(xiàn)特征和目標變量之間的關(guān)系。（包括：分類和回歸）

樣本集：訓練數(shù)據(jù) + 測試數(shù)據(jù)

訓練樣本 = 特征（feature） + 目標變量（label：分類-離散值/回歸-連續(xù)值）

特征通常是訓練樣本集的列，它們是獨立測量得到的。

目標變量：目標變量是機器學習預測算法的測試結(jié)果。

在分類算法中目標變量的類型通常是標稱型（如：真與假），而在回歸算法中通常是連續(xù)型（如：1~100）。

知識表示：

可以采用規(guī)則集的形式【例如：數(shù)學成績大于90分為優(yōu)秀】

可以采用概率分布的形式【例如：通過統(tǒng)計分布發(fā)現(xiàn)，90%的同學數(shù)學成績，在70分以下，那么大于70分定為優(yōu)秀】

可以使用訓練樣本集中的一個實例【例如：通過樣本集合，我們訓練出一個模型實例，得出年輕，數(shù)學成績中高等，談吐優(yōu)雅，我們認為是優(yōu)秀】

非監(jiān)督學習

數(shù)據(jù)沒有類別信息，也不會給定目標值。

聚類：在無監(jiān)督學習中，將數(shù)據(jù)集分成由類似的對象組成多個類的過程稱為聚類。

密度估計：通過樣本分布的緊密程度，來估計與分組的相似性。

此外，無監(jiān)督學習還可以減少數(shù)據(jù)特征的維度，以便我們可以使用二維或三維圖形更加直觀地展示數(shù)據(jù)信息。

訓練過程

算法匯總

機器學習使用

選擇算法需要考慮的兩個問題

1、算法場景

預測明天是否下雨，因為可以用歷史的天氣情況做預測，所以選擇監(jiān)督學習算法

給一群陌生的人進行分組，但是我們并沒有這些人的類別信息，所以選擇無監(jiān)督學習算法、通過他們身高、體重等特征進行處理。

2、需要收集或分析的數(shù)據(jù)是什么

舉例

機器學習開發(fā)流程

* 收集數(shù)據(jù)：收集樣本數(shù)據(jù)* 準備數(shù)據(jù)：注意數(shù)據(jù)的格式* 分析數(shù)據(jù)：為了確保數(shù)據(jù)集中沒有垃圾數(shù)據(jù)；如果是算法可以處理的數(shù)據(jù)格式或可信任的數(shù)據(jù)源，則可以跳過該步驟；另外該步驟需要人工干預，會降低自動化系統(tǒng)的價值。* 訓練算法：［機器學習算法核心］如果使用無監(jiān)督學習算法，由于不存在目標變量值，則可以跳過該步驟* 測試算法：［機器學習算法核心］評估算法效果* 使用算法：將機器學習算法轉(zhuǎn)為應用程序

Python語言優(yōu)勢

可執(zhí)行偽代碼

Python比較流行：使用廣泛、代碼范例多、豐富模塊庫，開發(fā)周期短

Python語言的特色：清晰簡練、易于理解

Python語言的缺點：唯一不足的是性能問題

Python相關(guān)的庫

科學函數(shù)庫：SciPy、NumPy（底層語言：C和Fortran）

繪圖工具庫：Matplotlib

本站聲明：本文章由作者或相關(guān)機構(gòu)授權(quán)發(fā)布，目的在于傳遞更多信息，并不代表本站贊同其觀點，本站亦不保證或承諾內(nèi)容真實性等。需要轉(zhuǎn)載請聯(lián)系該專欄作者，如若文章內(nèi)容侵犯您的權(quán)益，請及時聯(lián)系本站刪除（郵箱：macysun@21ic.com ）。

換一批