2022-01-10 11:18:12|已瀏覽:3678次
今天帶您一起來了解下關于人工智能的基礎知識。
01、機器學習是什么
機器學習的核心是,“用算法解析數據,從中學習,然后對某些事物做出決定或預測!边@意味著,你無需明確地編程計算機來執行任務,而是教計算機如何開發算法來完成任務。機器學習主要有三種類型,它們各有優缺點,分別是:監督學習,無監督學習和強化學習。
1. 監督學習
監督學習的兩種主要類型是分類和回歸。在分類中,訓練的機器將把一組數據分成特定的類。比如郵箱的垃圾郵件過濾器,過濾器分析之前標記為垃圾郵件的郵件,并將其與新郵件進行比較。如果達到某個百分比,則這些新郵件會被標記為垃圾郵件,并發送到相應的文件夾;不像垃圾郵件的將被歸類為正常并發送到收件箱。
第二種是回歸。在回歸中,機器使用先前標注的數據來預測未來。比如天氣應用。利用天氣的相關歷史數據(即平均溫度,濕度和降水量),手機的天氣應用可以查看當前天氣,并對一定時間范圍內的天氣進行預測。
2. 無監督學習
在無監督學習中,數據是未標注的。由于現實中,大多數的數據都是未標注的,因此這些算法特別有用。
無監督學習分為聚類和降維。聚類用于根據屬性和行為對象進行分組。這與分類不同,因為這些組不會提供給你。聚類將一個組劃分為不同的子組(例如,根據年齡和婚姻狀況),然后進行有針對性的營銷。另一方面,降維涉及通過查找共性來減少數據集的變量。大多數數據可視化使用降維來識別趨勢和規則。
3. 強化學習
強化學習使用機器的歷史和經驗來做出決策。強化學習的經典應用是游戲。與監督和無監督學習相反,強化學習不注重提供“正確”的答案或輸出。相反,它專注于性能,這類似人類根據積極和消極后果進行學習。如果孩子碰到了熱爐,他很快就會學會不再重復這個動作。同樣在國際象棋中,計算機可以學習不將王移動到對手的棋子可以到達的地方。根據這個原理,在游戲中機器能夠最終擊敗頂級的人類玩家。
02、機器學習的發展歷程
機器學習的最早由貝葉斯在1783年發表的同名定理中提出。貝葉斯定理根據類似事件的歷史數據得出事件的可能性。換句話說,貝葉斯定理是一種從經驗中學習的數學方法,這也是機器學習的基本思想。
幾個世紀后的1950年,計算機科學家艾倫·圖靈發明了圖靈測試,計算機通過文本對話,從而讓人類認為與其交談的是人而不是計算機。圖靈認為,只有當機器通過這項測試才能被認為是“智能的”。
在此之后不久,1952年,亞瑟·塞繆爾開發了第一個真正的機器學習程序,在簡單的跳棋游戲中,計算機能夠根據之前的游戲學習策略,并提高之后的表現。接下來是1963年,唐納德·米基開發了基于強化學習的tic-tac-toe項目。
機器學習的最大突破是2006年深度學習的發展。深度學習是機器學習的一個類別,旨在模仿人類大腦的思維過程,通常用于圖像和語音識別。
如今我們使用的許多技術都不離開深度學習。你是否曾將照片上傳到Facebook帳戶,并標記圖中的人物?Facebook正在使用神經網絡識別照片中的人臉。還有Siri,當你向iPhone詢問今天棒球比賽的比分時,你的語音將通過復雜的語音解析算法進行分析。沒有深度學習,這一切都將難以實現。
03、機器學習的原理
初學者們要注意了,如果想完全理解大多數機器學習算法,那么必須對一些關鍵數學概念有基本了解。但不要害怕,這些概念很簡單,有些可能你已經掌握了。機器學習涉及到線性代數、微積分、概率和統計。
線性代數概念Top 3:
1. 矩陣運算
2. 特征值/特征向量
3. 向量空間和范數
微積分概念Top 3:
1. 偏導數
2. 向量值函數
3. 方向梯度
統計概念Top 3:
1. 貝葉斯定理
2. 組合學
3. 抽樣方法
讓我們看到一些常見的算法:
1. 回歸算法
這可能是最流行的機器學習算法,線性回歸算法是基于連續變量預測特定結果的監督學習算法。另一方面,邏輯回歸專門用于預測離散值。這些算法都以其速度而聞名,它們被認為是最快的機器學習算法之一。
2. 基于實例的算法
基于實例的分析根據提供數據的特定實例來預測結果。最著名的基于實例算法是k-Nearest Neighbor,也稱為kNN。用于分類中,kNN比較數據點的距離并將每個點分配給它最接近的組。
3. 決策樹算法
決策樹算法聚集“弱”學習元素,讓它們一起形成強大的算法,這些元素以樹狀結構組成。其中比較流行的決策樹算法是隨機森林算法。在該算法中,弱學習元素是隨機選擇的。在下面的例子中,我們可以發現許多共同的特征(比如眼睛為藍色或非藍色),這都無法對動物種類進行辨別。然而,當我們將所有這些觀察結果結合在一起時,我們能夠形成更完整的理解并進行更準確的預測。
4. 貝葉斯算法
這些算法基于貝葉斯定理的,最受歡迎的是樸素貝葉斯算法,它經常用于文本分析。例如,大多數垃圾郵件過濾器都使用貝葉斯算法。它們使用按類別標記的用戶輸入數據來比較新數據,并對其進行適當分類。
5. 聚類算法
聚類算法專注找到元素間的共性,并相應地對它們進行分組。常見的聚類算法是K-Means聚類。根據K-Means,分析人員選擇聚類的數量(由變量K表示),算法將元素按物理距離分組到適當的聚類中。
6. 深度學習和神經網絡算法
人工神經網絡算法基于生物神經網絡的結構。深度學習采用神經網絡模型并對其進行更新。它們是大型且極其復雜的神經網絡,使用少量標注數據和大量未標注數據。神經網絡和深度學習具有許多輸入,這些輸入在產生一個或多個輸出之前要通過若干隱藏層。這些連接形成一個特定的循環,模仿人腦處理信息和建立邏輯聯系的方式。此外,隨著算法的運行,隱藏層通常會變得更小、更細微。
本文由培訓無憂網長沙牛耳教育專屬課程顧問整理發布,希望能夠對想參加長沙大數據分析培訓的學生有所幫助。更多大數據分析培訓課程資訊歡迎關注培訓無憂網大數據人工智能培訓頻道或添加老師微信:1503333605010
注:尊重原創文章,轉載請注明出處和鏈接 http://www.dedgn.cn/news-id-14188.html 違者必究!部分文章來源于網絡由培訓無憂網編輯部人員整理發布,內容真實性請自行核實或聯系我們,了解更多相關資訊請關注人工智能頻道查看更多,了解相關專業課程信息您可在線咨詢也可免費申請試課。關注官方微信了解更多:150 3333 6050