機器學習

出自集智百科
跳轉到: 導覽搜尋

該詞條由【zhangYUNMOOO】翻譯編輯,由【Iceblaze9527】審校,【總審校者】總審校,翻譯自Wikipedia詞條Machine Learning

機器學習計算機科學的分支——人工智能的一個子集,它通常使用統計學方法,藉助數據,賦予計算機“學習”的能力(例如,逐漸提高在特定任務上的表現)而不需要明確編寫學習過程[1]


機器學習的名字是Arthur Samuel [2] 在1959年創建的。它由人工智能 [3] 中的模式識別計算學習理論研究發展而來,探究從數據 [4] 中學習、做出預測的算法的研究與結構——這些算法通過從樣本輸入中建立模型,做出數據驅動的預測或決定 [5], 避免了一系列嚴格的靜態程序指令。機器學習被應用於那些設計運轉良好、 清晰明確的算法十分困難或根本不可行的計算任務中 ;其應用範圍包括電子郵件過濾、網絡入侵者與針對數據泄露的惡意內部人員的探查、光學字符識別學習排序計算機視覺


機器學習與計算統計學密切相關(而且常常與之重疊),計算統計學也專註於通過使用計算機進行預測。它與數學優化有着很強的聯繫,後者為之提供了方法、理論和應用領域。機器學習有時與數據挖掘 [6] 混為一談,後者更側重於探索性數據分析,被稱為無監督學習 [5] [7]。機器學習也可以是無監督的,並可用於為各種實體,學習和建立基線行為輪廓,然後用於尋找有意義的異常。


數據分析領域,機器學習是設計複雜模型和算法的一種方法。這有助於預測;在商業用途中,這被稱為預測分析。這些分析模型使研究人員、數據科學家、工程師和分析人員能夠“產生可靠的、可重複的決策和結果”,並通過從數據中的歷史關係和趨勢中學習,來發現“隱藏的洞見”。 [8]

目錄

概述

Tom M.Mitchell對機器學習領域中研究的算法提供了一個被廣泛引用的、更正式的定義:“計算機程序被描述為從經驗E中學習某些類型的任務T和性能度量P,如果它在T中的性能(用P來衡量)隨着經驗E而提高。” [9] 這一將機器學習與任務進行關聯的定義提供了一個基本的可執行定義,而不是認知術語形式的定義。這與艾倫·圖靈在他的論文“計算機器和智能”中的提議一脈相承,其中“機器能思考嗎?”被替換為“機器能做我們(作為思維實體)能做的事情嗎?” [10] 。圖靈的建議揭露了思維機器可能具有的各種特性以及構建機器時的諸多暗含之意 。

機器學習的任務

機器學習任務通常分為兩大類,取決於學習系統是否存在學習“信號”或“反饋”:

  • 監督學習:向計算機展示由“教師”提供的示例輸入及其期望的輸出,目標是學習將輸入映射到輸出的一般規則。作為特例,輸入信號只能被部分提供,或僅限於特定反饋:
    • 半監督學習:只提供給計算機一個不完整的訓練信號:一個訓練集,其中有一些(通常很多)的目標輸出丟失。
    • 主動學習:計算機只能獲得有限的實例集(基於預算)的訓練標籤,還必須優化對象的選擇以獲取標籤。當交互使用時,可以向用戶展示這些對象以供標籤。
    • 強化學習:訓練數據(以獎勵和懲罰的形式)只作為對程序在動態環境中的行為的反饋,例如自動駕駛或與對手玩遊戲[5]
  • 無監督學習:沒有標籤給學習算法,留下它自己在其輸入中找到結構。無監督學習本身可以是一個目標(發現數據中隱藏的模式),或者是一種達到目的的手段(特徵學習)。

機器學習的應用

當考慮機器學習系統的期望輸出時,機器學習任務的另一種分類出現了。 [5]

  • 分類中,輸入被分成兩個或多個類,學習者必須生成一個模型,將未被分類的輸入分配給這些類的一個或多個(多標籤分類)。這通常是以監督的方式處理的。垃圾郵件過濾是分類的一個例子,其中輸入是電子郵件(或其他)消息,類是“垃圾郵件”和“非垃圾郵件”。
  • 回歸中,也是一個有監督學習問題,輸出是連續的而不是離散的。
  • 聚類中,一組輸入被分為不同組。與分類不同的是,這些組事先是未知的,因此這通常是無監督學習的任務。
  • 密度估計挖掘輸入在某一空間的分布
  • 維數約簡通過將輸入映射到低維空間來簡化輸入。主題建模是一個相關的問題,在這個問題中,程序會得到一個人類語言文檔的列表,並負責找出哪些文檔涵蓋了類似的主題。

在其他類型的機器學習問題中, 元學習在以往經驗的基礎上學會了自己的歸納偏好發育學習是為機器人學習而發展起來的,它通過自主的自我探索和與人類教師的社會互動,利用主動學習、成熟、運動協同和模仿等引導機制,產生自己的學習情境序列(也稱為課程),累積獲得一系列新技能。

歷史、和其它領域的關係

參見:機器學習時間線

美國計算機遊戲人工智能領域的先驅Arthur Samuel於1959年在IBM時發明了“機器學習”一詞。作為一項科學探索,機器學習源於對人工智能的探索 [11]. 。 早在人工智能作為一門學術學科的時期,一些研究人員就對讓機器從數據中學習產生了興趣。他們試圖用各種符號方法以及後來被稱為“神經網絡”的方法來解決這個問題;這些模型大多是感知器和其他模型,後來被發現是廣義線性統計模型的再發明 [12]統計學推理也被使用,特別是在自動醫療診斷中 [13]

然而,對邏輯的、基於知識的方法的日益重視,導致人工智能和機器學習之間產生了裂痕,概率系統受到數據採集和數據表示的理論和實踐問題的困擾 [13]。 到1980年,專家系統已經主導了人工智能,而統計方法不再受歡迎 [14]。 基於符號與知識的學習的工作仍然屬於AI領域,這促成了歸納邏輯編程,但更多的在模式識別信息檢索 [13] 方面的統計方法的研究已經超出了人工智能本身的範圍。神經網絡的研究幾乎同時被人工智能和計算機科學所拋棄。而在AI/CS領域之外,這條路線也被其他學科的研究人員奉為“連接主義”而繼續存在,包括HopfieldRumelhartHinton。他們的主要成功是在上世紀80年代中期重新發明了反向傳播算法 [13]

機器學習,作為一個獨立的領域,在20世紀90年代開始蓬勃發展。機器學習的目標從實現人工智能轉變為解決可解決的實踐性問題。它將重點從AI中繼承的符號方法轉向了來自於統計學和概率論的方法和模型[14] ,同時也受益於數字化信息日益增長的普及性,以及互聯網傳播信息的能力。

機器學習和數據挖掘通常採用相同的方法,重疊程度很大。但是機器學習側重於預測——基於從訓練數據中學習到的已知屬性,而數據挖掘則側重於在數據中發現(以前的)未知屬性(這是數據庫中知識發現的分析步驟)。數據挖掘採用多種機器學習方法而目標不同;另一方面,機器學習也採用數據挖掘的方法作為“無監督學習”或作為預處理步驟來提高學習精度。這兩個研究對象之間的許多混淆(它們通常有單獨的會議和單獨的期刊,ECML PKDD是一個主要的例外)來自於它們所使用的基本假設:在機器學習中,性能通常是根據重複生產已知知識的能力來評估的,而在知識發現和數據挖掘(KDD)中,關鍵任務是發現以前未知的知識。在對學習已知知識進行評估時,其他監督學習方法很容易優於無監督學習方法,而在典型的KDD任務中,由於訓練數據的不可得性,則無法使用監督學習的方法。

機器學習與優化也有着密切的聯繫:許多學習問題被描述為訓練集上的一些損失函數的最小化。損失函數表示被訓練模型的預測與實際問題之間的差異(例如,在分類中,要為實例分配一個標籤,且模型要被訓練以正確預測一組預先分配過標籤的示例)。這兩個領域的區別來自於一般化的目的:優化算法可以最小化訓練集上的損失,而機器學習則涉及到最小化未知樣本的損失 [15]

與統計學的關係

機器學習和統計是密切相關的領域。據Michael I. Jordan說,機器學習的思想,從方法論原理到理論工具,都在統計學上有着悠久的歷史 [16]。 他還建議用數據科學這個術語來稱呼整個領域 [16]

Leo Breiman區分了兩種統計建模範式:數據模型和算法模型 [17] ,其中“算法模型”或多或少是指像隨機森林那樣的機器學習算法。

一些統計學家採用機器學習的方法,形成了一個他們稱之為統計學習的交叉領域[18]

理論

主文章:計算學習理論

學習者的一個核心目標是從經驗中舉一反三 [5] [19]。 這裡的舉一反三是指學習機器在經歷了學習數據集之後,能夠準確地對新的、未見過的示例/任務進行精確的操作。訓練實例通常來自一些未知的概率分布(常被認為是樣本空間的代表),並且學習者必須建立一個關於這個空間的通用模型,使得它能夠在新的情況下產生足夠精確的預測。

機器學習算法及其性能的計算分析是理論計算機科學的一個分支,稱為計算學習理論。由於訓練集是有限的但是未來是不確定的,所以學習理論通常不能保證算法的性能。然而,算法性能的概率的界限是相當普適的。偏差-方差分解是量化泛化誤差的一種方法。

為了在泛化的情境中獲得最佳性能,假設的複雜性應該與數據基礎上的函數的複雜性相匹配。如果假設沒有函數複雜,那麼模型就不適合數據。如果模型的複雜度因此增加,則訓練誤差減小。但如果假設過於複雜,則模型會被過度擬合,泛化也將變得更差[20]

除了性能界限外,計算學習理論家還研究了學習的時間複雜性和可行性。在計算學習理論中,如果可以在多項式時間內進行計算,則認為計算是可行的。有兩種時間複雜度的結果。正結果表明,一類函數可以在多項式時間內學習。負結果表明,某些類函數不能在多項式時間內學習。

方法

主文章:機器學習算法列表

決策樹學習

主文章:決策樹學習

決策樹學習使用決策樹作為預測模型,它將問題相關的觀察結果映射為問題目標值的結論。

關聯規則學習

主文章:關聯規則學習

關聯規則學習是在大型數據庫中發現變量間有趣關係的一種方法。

人工神經網絡

主文章: 人工神經網絡

人工神經網絡(ANN)學習算法,通常稱為神經網絡(NN),是一種受生物神經網絡啟發的學習算法。計算是根據一組相互關聯的人工神經元來構造的,它們使用連接主義計算方法來處理信息。現代神經網絡是非線性統計數據建模工具。它們通常用於模擬輸入和輸出之間的複雜關係,在數據中找到模式,或在觀測變量之間的未知聯合概率分布中尋找統計結構。

深度學習

主文章:深度學習

近幾年來,硬件價格的下降和個人用GPU的發展促進了深度學習概念的發展,該概念由人工神經網絡中的多個隱層組成。這種方法試圖模擬人腦將光和聲音處理成視覺和聽覺的方式。深入學習的一些成功應用是計算機視覺語音識別 [21]

歸納邏輯編程

主文章:歸納邏輯編程

歸納邏輯編程(ILP)是一種將邏輯編程作為輸入實例、背景知識和假設的統一表示的規則學習方法。給定已知背景知識的編碼和作為事實邏輯數據庫表示的一組示例,ILP系統將導出一個假設邏輯程序,其中包含所有正負示例。歸納編程是一個相關的領域,它考慮任何類型的編程語言來表示假設(而不僅僅是邏輯編程),例如函數程序

支持向量機

主文章:SVM支持向量機

SVM支持向量機(SupportVectorMachine,SVMs)是一種用於分類回歸監督學習算法。給出一組訓練實例,每個樣本會被標記為屬於兩類中的一個,SVM算法建立了一個模型來預測一個新的例子是否屬於一個類別或另一個類別。

聚類

主文章:聚類分析

聚類分析是將一組觀測數據分配到子集(稱為聚類)中,使同一簇內的觀測按照某些預先指定的準則相似,而從不同的簇中提取的觀測值則不同。不同的聚類技術對數據的結構提出了不同的假設,通常用某種相似性度量來定義,並通過內部緊密性(同一聚類成員之間的相似性)和不同聚類之間的分離性來評估。其他方法基於估計的密度和圖的連通性。聚類是一種無監督學習方法,是一種常用的統計數據分析技術。

貝葉斯網絡

主文章:貝葉斯網絡

貝葉斯網絡,或稱信任網絡或者有向無環圖形模型是通過有向無環圖(DAG)表示一組隨機變量及其條件獨立性概率圖形模型。例如,貝葉斯網絡可以表示疾病和癥狀之間的概率關係。給定癥狀,網絡可以用來計算各種疾病出現的概率。有效的算法可以進行推理和學習。

強化學習

主文章:強化學習

強化學習是指一個智能體(agent)應該如何在環境中採取行動,從而最大限度地獲得長期報酬的概念。強化學習算法試圖找到一種策略,將世界狀態映射到智能體在這些狀態中應該採取的行動。強化學習不同於監督學習問題,因為不會提供正確的輸入/輸出對,也沒有明確地修正次優行為。

表示學習

主文章:表示學習

一些學習算法,大多是無監督學習算法,旨在發現更好的輸入的訓練數據的表示。經典的例子包括主成分分析聚類分析。表示學習算法通常試圖在輸入中保留信息,並將其轉換成有用的方式,通常是在執行分類或預測之前的預處理步驟,允許重構來自未知數據生成分布的輸入,而不一定對不太可能服從該分布的結構可靠。

流形學習算法嘗試處理被學習的數據表示是低維的情況。稀疏編碼算法嘗試處理被學習的數據表示是稀疏(有多個零)的情況。多線性子空間學習算法的目的是直接從多維數據的張量表示中學習低維表示,而不將它們重構成(高維)向量[22]。深度學習算法能發現數據表示的多個層次,或者由低級特徵定義(或生成)的更高、更抽象的特徵層次。有人認為,智能機器是一種學習表示法的機器,它能找出那些解釋觀測數據的潛在變異因素[23]

相似性與度量學習

主文章:相似性學習

在這個問題中,學習機器給出了一對被認為相似的對象和一對不太相似的對象。然後,它需要學習一個相似函數(或距離度量函數),該函數可以預測新對象是否相似。該算法有時用於推薦系統

稀疏字典學習

主文章:稀疏字典學習

該方法將數據表示為基函數的線性組合,並假定係數是稀疏的。設x是d維數據,D是d乘n矩陣,其中D的每一列代表一個基函數,r是用D表示x的係數。數學上,稀疏字典學習意味着求解  x\approx Dr ,r 是稀疏的。一般說來,假設n大於d,以便稀疏表示。

學習字典和稀疏表示是強NP難解的,也很難近似求解[24] 。稀疏字典學習的一種流行的啟發式方法是K-SVD

稀疏字典學習已經在幾種環境中得到了應用。在分類中,問題是確定以前看不見的數據屬於哪些類。假設已經為每個類構建了一個字典。然後,將一個新的數據與類相關聯,使得它被相應的字典最優表示。稀疏字典學習也被應用於圖像去噪。關鍵的思想是一個乾淨的圖像補丁可以用圖像字典來稀疏地表示,但是噪聲卻不能[25]

遺傳算法

主文章:遺傳算法

遺傳算法(GeneticAlgorithm,GA)是一種模擬自然選擇過程的搜索啟發式算法,它利用變異重組等方法生成新的基因型,以期為給定問題找到好的解決方案。在機器學習中,遺傳算法在20世紀80年代和90年代得到了一些應用 [26][27]。 相反,機器學習技術被用來改進遺傳算法和進化算法的性能 [28]

基於規則的機器學習

基於規則的機器學習是任何機器學習方法的通用術語,它通過識別、學習或演化“規則”來存儲、操作或應用知識。基於規則的機器學習者的定義特徵是識別和使用一組關係規則,這些規則共同表示系統獲取的知識。這與其他機器學習者不同,這些機器學習者通常會識別出一個可以普遍應用於任何實例的奇異模型,以便進行預測[29] 。基於規則的機器學習方法包括學習分類器系統關聯規則學習人工免疫系統

學習分類器

主文章:學習分類器系統

學習分類器系統(LCS)是一組基於規則的機器學習算法,它將發現組件(通常是遺傳算法)與學習組件(執行有監督學習強化學習無監督學習)結合起來。他們試圖找出一套與情境相關的規則,這些規則以一種分段的方式,集體存儲和應用知識,以便進行預測[30]

應用

機器學習的應用包括:
農業
機器證明 [31][32]
適應性網站
情感計算
生物信息學
腦-機接口
化學信息學
分類DNA序列
計算解剖學
計算機網絡
電信
計算機視覺,包括目標識別
檢測信用卡詐騙
通用遊戲[33]
信息檢索
互聯網詐騙檢測[20]
語言學
營銷
機器學習控制
機器感知
醫學診斷
經濟學
保險
自然語言處理
自然語言理解[34]
優化元啟發式
在線廣告
推薦系統
機器人移動
搜索引擎
情感分析(意見挖掘)
序列挖掘
軟件工程
語音識別手寫識別
金融市場分析
結構健康監測
句法模式識別
時間序列預測
用戶行為分析
翻譯 [35]

2006年,在線電影公司Netflix舉辦了第一屆“Netflix獎”競賽,目的是尋找一個更好地預測用戶喜好的程序,並將現有Cinematch電影推薦算法的準確性提高至少10%。由AT&T實驗室的研究人員組成的一個聯合團隊與“大混亂與務實理論”合作,以100萬美元的價格建立了一個集成模型[36] ,贏得了2009年的大獎。在頒獎後不久,Netflix意識到,觀眾的收視率並不是他們觀看模式的最佳指標(“一切都是推薦的”),於是他們相應地改變了推薦引擎 [37]

2010年,《華爾街日報》發表了Rebellion研究公司及它們利用機器學習預測金融危機的相關報道。[38]

2012年,Sun Microsystems的聯合創始人VinodKhosla預測,在接下來的20年里,80%的醫生將因自動機器學習醫療診斷軟件而失業 [39]

2014年,有報道稱機器學習算法在藝術史領域被用於研究美術繪畫,並可能揭示了藝術家之間先前未被認識到的影響[40]

局限

雖然機器學習在某些領域是革命性的,但有效的機器學習仍是困難的,因為找出模式很難,而且往往沒有足夠的訓練數據;因此,許多機器學習程序往往無法達到預期值 [41] [42] [43] 。 造成這種情況的原因很多:缺乏(適當的)數據、無法訪問數據、數據偏見、隱私問題、錯誤的任務選擇和算法、錯誤的工具和人員、缺乏資源和評估問題[44]

機器學習方法尤其會受到不同數據偏見的影響。只針對當前客戶進行訓練的機器學習系統可能無法預測訓練數據中未表示的新客戶組的需求。當接受人工數據訓練時,機器學習很可能會產生與社會上已經存在的相同的成體制偏見和無意識偏見 [45] 。 從數據中學到的語言模型已被證明含有類似人類的偏見 [46] [47] 。 用於犯罪風險評估的機器學習系統被發現對黑人有偏見[48] [49] 。在2015年,谷歌上黑人的照片常常被貼上大猩猩的標籤 [50] , 而到2018年,這仍然沒有得到很好的解決,但據報道,谷歌仍在使用變通方法將所有大猩猩從訓練數據中刪除,因此根本無法識別真正的大猩猩 [51]。 在許多其他系統中 [52] ,也發現了識別非白人的類似問題。2016年,微軟測試了一個從Twitter上學習的聊天機器人,而後者卻很快學會了種族主義和性別歧視的語言 [53]。 由於這些挑戰,機器在其他領域的有效使用仍有很長的路要走 [54]。2018年,Uber的一輛自動駕駛汽車未能檢測到行人並導致其在事故中喪生。 [55]IBM Watson系統在醫療保健領域使用機器學習的嘗試,即便經過多年的時間和數十億美元的投資,也未能實現 [56] [57]

模型評估

分類機學習模型可以通過例如 Holdout 方法等精度估計技術來驗證,該方法將訓練和測試集(通常指定2/3為訓練集,1/3為測試集)中的數據分開,並對訓練模型在測試集上的性能進行評估。比較而言,N重交叉驗證方法將數據隨機分成k個子集,其中使用k-1個實例來訓練模型,而使用第k個實例來測試訓練模型的預測能力。除了Holdout方法和交叉驗證方法之外,Bootstrap還可以使用從數據集中替換的n個實例來評估模型的準確性。

除了總體準確性外,調查人員還經常報告敏感性和特異性,即真陽性率(TPR)和真陰性率(TNR)。同樣,調查人員有時報告假陽性率(FPR)和假陰性率(FNR)。然而,這些比率不能顯示它們的分子和分母。總運行特性(TOC)是表示模型診斷能力的一種有效方法。TOC顯示上述比率的分子和分母,因此TOC提供的信息比常用的受試者工作特徵(ROC)和曲線下ROC的關聯區域(AUC)提供的信息更多[58]

規範準則

機器學習導致了許多倫理問題。利用偏見收集的數據集進行訓練的系統可能會在使用時表現出這些偏見(算法偏見),從而將文化偏見數字化 [59] 。 例如,使用具有種族主義僱用政策的公司的招聘數據可能導致機器學習系統複製這種偏見,方法是將求職者與先前成功申請者的相似性打分 [60] [61] 。負責任的數據收集和系統使用的算法規則的記錄是機器學習的一個關鍵部分。

因為語言包含偏見,受過語料庫訓練的機器也必然會學習偏見 [62]

其他與個人偏見無關的道德挑戰則更多地體現在醫療保健方面。醫療保健專業人士擔心,這些系統可能不是為了公眾利益而設計的,而是作為創收機器設計的。這在改善醫療保健和增加利潤方面存在長期的道德困境的美國尤其如此。例如,這些算法可以設計為患者提供不必要的測試或藥物治療,而該算法的專屬所有者在這些測試或藥物中持有股份。在醫療保健領域,機器學習在成為為專業人員提供診斷、藥物治療甚至計劃病人康復路徑的偉大工具上有着巨大的潛力,但這在前面提到的個人偏見和這些“貪婪”偏見得到解決之前是不可能發生的[63]

軟件

包含各種機器學習算法的軟件包包括:

免費開源軟件

·CNTK                        ·MLPACK                         ·Spark MLlib
·Deeplearning4j              ·MXNet                          ·TensorFlow
·ELKI                        ·OpenNN                         ·Torch/PyTorch
·H2O                         ·Orange                         ·Weka / MOA
·Mahout                      ·scikit-learn                   ·Yooreeka
·Mallet                      ·Shogun

有免費開源版本的專利軟件

KNIMERapidMiner

專利軟件

期刊

會議

參見

參考文獻

  1. The "without being explicitly programmed" definition is often attributed to Arthur Samuel, who coined the term "machine learning" in 1959. But the phrase is not found literally in this publication, and may be a paraphrase that appeared later. Confer "Paraphrasing Arthur Samuel (1959), the question is: How can computers learn to solve problems without being explicitly programmed?" in Koza, John R.; Bennett, Forrest H.; Andre, David; Keane, Martin A. (1996). Automated Design of Both the Topology and Sizing of Analog Electrical Circuits Using Genetic Programming. Artificial Intelligence in Design '96. Springer, Dordrecht. pp. 151–170. doi:10.1007/978-94-009-0279-4_9
  2. Samuel, Arthur (1959). "Some Studies in Machine Learning Using the Game of Checkers". IBM Journal of Research and Development 3 (3): 210–229.
  3. http://www.britannica.com/EBchecked/topic/1116194/machine-learning
  4. Ron Kohavi; Foster Provost (1998). "Glossary of terms". Machine Learning 30: 271–274. http://ai.stanford.edu/~ronnyk/glossary.html.
  5. 5.0 5.1 5.2 5.3 5.4 Bishop, C. M. (2006), Pattern Recognition and Machine Learning, Springer, ISBN 978-0-387-31073-2
  6. Mannila Heikki(1996). Data mining: machine learning, statistics, and databases. Int'l Conf. Scientific and Statistical Database Management.IEEE Computer Society.
  7. Friedman, Jerome H. (1998). "Data Mining and Statistics: What's the connection?". Computing Science and Statistics 29 (1): 3–9.
  8. "Machine Learning: What it is and why it matters". www.sas.com. Retrieved 2016-03-29.
  9. Mitchell, T. (1997). Machine Learning. McGraw Hill. pp. 2.
  10. Harnad, Stevan(2008), "The Annotation Game: On Turing (1950) on Computing, Machinery, and Intelligence", in Epstein, Robert; Peters, Grace, The Turing Test Sourcebook: Philosophical and Methodological Issues in the Quest for the Thinking Computer , Kluwer
  11. R. Kohavi and F. Provost, "Glossary of terms," Machine Learning, vol. 30, no. 2–3, pp. 271–274, 1998.
  12. Sarle Warren."Neural Networks and statistical models". 10.1.1.27.699
  13. 13.0 13.1 13.2 13.3 Russell, Stuart; Norvig, Peter (2003) [1995]. Artificial Intelligence: A Modern Approach (2nd ed.). Prentice Hall. ISBN 978-0137903955.
  14. 14.0 14.1 Langley, Pat (2011). "The changing science of machine learning". Machine Learning 82 (3): 275–279.
  15. Le Roux, Nicolas; Bengio, Yoshua;Fitzgibbon, Andrew(2012). "Improving First and Second-Order Methods by Modeling Uncertainty Optimization for Machine Learning" In Sra, Suvrit; Nowozin, Sebastian; Wright, Stephen J. Optimization for Machine Learning. MIT Press. p. 404.
  16. 16.0 16.1 Michael I. Jordan (2014-09-10). "statistics and machine learning." reddit. Retrieved 2014-10-01.
  17. Cornell University Library. "Breiman: Statistical Modeling: The Two Cultures (with comments and a rejoinder by the author)". Retrieved 8 August 2015.
  18. Gareth James; Daniela Witten; Trevor Hastie; Robert Tibshirani (2013). An Introduction to Statistical Learning. Springer. p. vii. http://www-bcf.usc.edu/~gareth/ISL/.
  19. Mohri, Mehryar; Rostamizadeh, Afshin; Talwalkar, Ameet (2012). Foundations of Machine Learning. USA, Massachusetts: MIT Press. ISBN 9780262018258.
  20. 20.0 20.1 Alpaydin, Ethem (2010). Introduction to Machine Learning. London: The MIT Press. https://mitpress.mit.edu/books/introduction-machine-learning.
  21. Honglak Lee, Roger Grosse, Rajesh Ranganath, Andrew Y. Ng. "Convolutional Deep Belief Networks for Scalable Unsupervised Learning of Hierarchical Representations" Proceedings of the 26th Annual International Conference on Machine Learning, 2009.
  22. Lu, Haiping; Plataniotis, K.N.; Venetsanopoulos, A.N. (2011). "A Survey of Multilinear Subspace Learning for Tensor Data". Pattern Recognition 44 (7): 1540–1551. http://www.dsp.utoronto.ca/~haiping/Publication/SurveyMSL_PR2011.pdf.
  23. Yoshua Bengio (2009). Learning Deep Architectures for AI. Now Publishers Inc.. pp. 1–3. https://books.google.com/books?id=cq5ewg7FniMC&pg=PA3.
  24. Tillmann, A. M. (2015). "On the Computational Intractability of Exact and Approximate Dictionary Learning". IEEE Signal Processing Letters 22 (1): 45–49.
  25. Aharon, M, M Elad, and A Bruckstein. 2006. "K-SVD: An Algorithm for Designing Overcomplete Dictionaries for Sparse Representation." Signal Processing, IEEE Transactions on 54 (11): 4311–4322
  26. Goldberg, David E.; Holland, John H. (1988). "Genetic algorithms and machine learning". Machine Learning 3 (2): 95–99.
  27. Michie, D.; Spiegelhalter, D. J.; Taylor, C. C. (1994). Machine Learning, Neural and Statistical Classification. Ellis Horwood.
  28. Zhang, Jun; Zhan, Zhi-hui; Lin, Ying; Chen, Ni; Gong, Yue-jiao; Zhong, Jing-hui; Chung, Henry S.H.; Li, Yun et al. (2011). "Evolutionary Computation Meets Machine Learning: A Survey". Computational Intelligence Magazine 6 (4): 68–75. http://ieeexplore.ieee.org/iel5/10207/6052357/06052374.pdf?arnumber=6052374.
  29. Bassel, George W.; Glaab, Enrico; Marquez, Julietta; Holdsworth, Michael J.; Bacardit, Jaume (2011-09-01). "Functional Network Construction in Arabidopsis Using Rule-Based Machine Learning on Large-Scale Data Sets" (in en). The Plant Cell 23 (9): 3101–3116. http://www.plantcell.org/content/23/9/3101.
  30. Urbanowicz, Ryan J.; Moore, Jason H. (2009-09-22). "Learning Classifier Systems: A Complete Introduction, Review, and Roadmap" (in en). Journal of Artificial Evolution and Applications 2009: 1–25. http://www.hindawi.com/archive/2009/736398/.
  31. Bridge, James P., Sean B. Holden, and Lawrence C. Paulson. "Machine learning for first-order theorem proving." Journal of automated reasoning 53.2 (2014): 141–172.
  32. Loos, Sarah, et al. "Deep Network Guided Proof Search." arXiv preprint arXiv:1701.06972 (2017).
  33. Finnsson, Hilmar, and Yngvi Björnsson. "Simulation-Based Approach to General Game Playing." AAAI. Vol. 8. 2008.
  34. Sarikaya, Ruhi, Geoffrey E. Hinton, and Anoop Deoras. "Application of deep belief networks for natural language understanding." IEEE/ACM Transactions on Audio, Speech and Language Processing (TASLP) 22.4 (2014): 778–784.
  35. "AI-based translation to soon reach human levels: industry officials". Yonhap news agency. Retrieved 4 Mar 2017.
  36. "BelKor Home Page" research.att.com
  37. "The Netflix Tech Blog: Netflix Recommendations: Beyond the 5 stars (Part 1)". Retrieved 8 August 2015.
  38. Scott Patterson (13 July 2010). "Letting the Machines Decide". The Wall Street Journal. Retrieved 24 June 2018.
  39. Vonod Khosla (January 10, 2012). "Do We Need Doctors or Algorithms?". Tech Crunch.
  40. When A Machine Learning Algorithm Studied Fine Art Paintings, It Saw Things Art Historians Had Never Noticed, The Physics at ArXiv blog
  41. "Why Machine Learning Models Often Fail to Learn: QuickTake Q&A". Bloomberg.com. 2016-11-10. Retrieved 2017-04-10.
  42. "The First Wave of Corporate AI Is Doomed to Fail". Harvard Business Review. 2017-04-18. Retrieved 2018-08-20.
  43. "Why the A.I. euphoria is doomed to fail". VentureBeat. 2016-09-18. Retrieved 2018-08-20.
  44. Reasons why your machine learning project will fail "9 Reasons why your machine learning project will fail". www.kdnuggets.com. Retrieved 2018-08-20.
  45. Garcia, Megan (2016). "Racist in the Machine" (in en). World Policy Journal 33 (4): 111–117. https://read.dukeupress.edu/world-policy-journal/article/33/4/111-117/30942.
  46. Caliskan, Aylin; Bryson, Joanna J.; Narayanan, Arvind (2017-04-14). "Semantics derived automatically from language corpora contain human-like biases" (in en). Science 356 (6334): 183–186. http://science.sciencemag.org/content/356/6334/183.
  47. Wang, Xinan; Dasgupta, Sanjoy (2016), Lee, D. D.; Sugiyama, M.; Luxburg, U. V.; Guyon, I., eds., "An algorithm for L1 nearest neighbor search via monotonic embedding" (PDF), Advances in Neural Information Processing Systems 29, Curran Associates, Inc., pp. 983–991, Retrieved 2018-08-20
  48. "Machine Bias". ProPublica. Julia Angwin, Jeff Larson, Lauren Kirchner, Surya Mattu. 2016-05-23. Retrieved 2018-08-20.
  49. "Opinion | When an Algorithm Helps Send You to Prison". New York Times. Retrieved 2018-08-20.
  50. "Google apologises for racist blunder". BBC News. 2015-07-01. Retrieved 2018-08-20.
  51. "Google 'fixed' its racist algorithm by removing gorillas from its image-labeling tech". The Verge. Retrieved 2018-08-20.
  52. "Opinion | Artificial Intelligence's White Guy Problem". New York Times. Retrieved 2018-08-20.
  53. Metz, Rachel. "Why Microsoft's teen chatbot, Tay, said lots of awful things online". MIT Technology Review. Retrieved 2018-08-20.
  54. Simonite, Tom. "Microsoft says its racist chatbot illustrates how AI isn't adaptable enough to help most businesses". MIT Technology Review. Retrieved 2018-08-20.
  55. "Why Uber's self-driving car killed a pedestrian". The Economist. Retrieved 2018-08-20.
  56. "IBM's Watson recommended 'unsafe and incorrect' cancer treatments - STAT". STAT. 2018-07-25. Retrieved 2018-08-21.
  57. Hernandez, Daniela; Greenwald, Ted (2018-08-11). "IBM Has a Watson Dilemma". Wall Street Journal. ISSN 0099-9660. Retrieved 2018-08-21.
  58. Pontius, Robert Gilmore; Si, Kangping (2014). "The total operating characteristic to measure diagnostic ability for multiple thresholds". International Journal of Geographical Information Science 28 (3): 570–583.
  59. Bostrom, Nick (2011). "The Ethics of Artificial Intelligence" (PDF). Retrieved 11 April 2016.
  60. Edionwe, Tolulope. "The fight against racist algorithms". The Outline. Retrieved 17 November 2017.
  61. Jeffries, Adrianne. "Machine learning is racist because the internet is racist". The Outline. Retrieved 17 November 2017.
  62. Narayanan, Arvind (August 24, 2016). "Language necessarily contains human biases, and so will machines trained on language corpora". Freedom to Tinker.
  63. Char, D. S., Shah, N. H., & Magnus, D. (2018). Implementing Machine Learning in Health Care—Addressing Ethical Challenges.New England Journal of Medicine,378(11), 981-983. doi:10.1056/nejmp1714229

拓展閱讀

外部鏈接

本詞條內容翻譯自 en.wikipedia.org,遵守 CC3.0協議。

個人工具
名字空間
動作
導覽
工具箱