技術(shù)分析:人工智能的全面科普
人們?cè)谌粘I钪薪佑|人工智能的頻率越來(lái)越高,有可以幫用戶(hù)買(mǎi)菜的京東智能冰箱;可以做自動(dòng)翻譯的機(jī)器;還有Siri、Alexa和Cortana這樣的機(jī)器人助理;以及無(wú)人車(chē)、AlphaGo等已經(jīng)把人工智能技術(shù)帶到了“看得到摸得著”的境地。人工智能正以前所未有的態(tài)勢(shì)洶涌而來(lái),相關(guān)領(lǐng)域的融資總額一直在逐年穩(wěn)步增長(zhǎng),到2016年達(dá)到數(shù)十億美元的火爆程度。那么人工智能到底是什么?這個(gè)領(lǐng)域涉及哪些方面?人工智能要完成的目標(biāo)和任務(wù)有哪些?接下來(lái)的內(nèi)容將做一一介紹。
1.什么是人工智能
Alan Turing定義的AI是:能使計(jì)算機(jī)完成那些需要人類(lèi)智力才能完成的工作的科學(xué)。斯坦福大學(xué)的學(xué)者認(rèn)為AI是智能機(jī)器的科學(xué)和工程,特別是智能計(jì)算機(jī)程序。維基百科定義AI是指由人工制造出來(lái)的系統(tǒng)所表現(xiàn)出來(lái)的智能,該詞同時(shí)也指研究這樣的智能系統(tǒng)是否能夠?qū)崿F(xiàn),以及如何實(shí)現(xiàn)的科學(xué)領(lǐng)域。不管怎樣定義,都離不開(kāi)智能,然而到目前為止人類(lèi)還沒(méi)能統(tǒng)一地給出智能的定義,通常所說(shuō)的智能也只是參考人類(lèi)智慧的表現(xiàn)形式。原中國(guó)人工智能學(xué)會(huì)理事長(zhǎng)鐘義信教授,認(rèn)為人類(lèi)智慧包含發(fā)現(xiàn)問(wèn)題、定義問(wèn)題、解決問(wèn)題三方面,而人工智能目前只做到了解決問(wèn)題的程度。筆者認(rèn)為智能是一種有序,是信息的體現(xiàn),也是使世界朝著有序的方向發(fā)展的能力??杀氖?,根據(jù)熵增原理,無(wú)論智能體做怎樣的努力,整個(gè)宇宙總是朝著熵增加的方向發(fā)展,即越來(lái)越無(wú)序和混亂。不知道這是上帝故意的安排,還是人類(lèi)觀察到的宇宙之外另有天地。
2.人工智能的歷史
1950 年代初期,人工智能聚焦在所謂的強(qiáng)人工智能,希望機(jī)器可以像人一樣完成任何智力任務(wù)。強(qiáng)人工智能的發(fā)展止步不前,導(dǎo)致了弱人工智能的出現(xiàn),即把人工智能技術(shù)應(yīng)用于更窄領(lǐng)域的問(wèn)題。1980 年代之前,人工智能的研究一直被這兩種范式分割著,兩營(yíng)相對(duì)。但是,1980 年左右,機(jī)器學(xué)習(xí)開(kāi)始成為主流,它的目的是讓計(jì)算機(jī)具備學(xué)習(xí)和構(gòu)建模型的能力,從而它們可在特定領(lǐng)域做出預(yù)測(cè)等行為。

歷史上人工智能有三大學(xué)派:符號(hào)主義(symbolicism),又稱(chēng)為邏輯主義(logicism)、心理學(xué)派(psychologism)或計(jì)算機(jī)學(xué)派(computerism),其原理主要為物理符號(hào)系統(tǒng)(即符號(hào)操作系統(tǒng))假設(shè)和有限合理性原理。連接主義(connectionism),又稱(chēng)為仿生學(xué)派(bionicsism)或生理學(xué)派(physiologism),其主要原理為神經(jīng)網(wǎng)絡(luò)及神經(jīng)網(wǎng)絡(luò)間的連接機(jī)制與學(xué)習(xí)算法。行為主義(actionism),又稱(chēng)為進(jìn)化主義(evolutionism)或控制論學(xué)派(cyberneticsism),其原理為控制論及感知-動(dòng)作型控制系統(tǒng)。
符號(hào)主義認(rèn)為人工智能源于數(shù)理邏輯。其早在1956年首先采用“人工智能”這個(gè)術(shù)語(yǔ)。后來(lái)又發(fā)展了啟發(fā)式算法-專(zhuān)家系統(tǒng)-知識(shí)工程理論與技術(shù),并在20世紀(jì)80年代取得很大發(fā)展。
連接主義認(rèn)為人工智能源于仿生學(xué),特別是對(duì)人腦模型的研究。20世紀(jì)60~70年代,連接主義對(duì)以感知機(jī)(perceptron)為代表的腦模型的研究出現(xiàn)過(guò)熱潮,由于受到當(dāng)時(shí)的理論模型、生物原型和技術(shù)條件的限制,腦模型研究在20世紀(jì)70年代后期至80年代初期落入低潮。直到Hopfield教授在1982年和1984年發(fā)表兩篇重要論文,提出用硬件模擬神經(jīng)網(wǎng)絡(luò)以后,連接主義才又重新抬頭。1986年,魯梅爾哈特(Rumelhart)等人提出多層網(wǎng)絡(luò)中的反向傳播算法(BP)算法。此后又有卷積神經(jīng)網(wǎng)絡(luò)(CNN)的研究,連接主義勢(shì)頭大振,從模型到算法,從理論分析到工程實(shí)現(xiàn),為神經(jīng)網(wǎng)絡(luò)計(jì)算機(jī)走向市場(chǎng)打下基礎(chǔ)。2006年,Hinton在《Science》和相關(guān)期刊上發(fā)表了論文,首次提出了深度信念網(wǎng)絡(luò)(DBN)的概念,將深度學(xué)習(xí)推向?qū)W術(shù)界并成為當(dāng)前人工智能領(lǐng)域非常熱門(mén)的研究方向。

行為主義認(rèn)為人工智能源于控制論??刂普撍枷朐缭?0世紀(jì)40~50年代就成為時(shí)代思潮的重要部分,影響了早期的人工智能工作者。維納(Wiener)和麥克洛克(McCulloch)等人提出的控制論和自組織系統(tǒng)以及錢(qián)學(xué)森等人提出的工程控制論和生物控制論,影響了許多領(lǐng)域??刂普摪焉窠?jīng)系統(tǒng)的工作原理與信息理論、控制理論、邏輯以及計(jì)算機(jī)聯(lián)系起來(lái)。早期的研究工作重點(diǎn)是模擬人在控制過(guò)程中的智能行為和作用,如對(duì)自尋優(yōu)、自適應(yīng)、自鎮(zhèn)定、自組織和自學(xué)習(xí)等控制論系統(tǒng)的研究,并進(jìn)行“控制論動(dòng)物”的研制。到20世紀(jì)60~70年代,上述這些控制論系統(tǒng)的研究取得一定進(jìn)展,播下智能控制和智能機(jī)器人的種子,并在20世紀(jì)80年代誕生了智能控制和智能機(jī)器人系統(tǒng)。行為主義是20世紀(jì)末才以人工智能新學(xué)派的面孔出現(xiàn)的,引起許多人的興趣。這一學(xué)派的代表作者首推布魯克斯(Brooks)的六足行走機(jī)器人,它被看作是新一代的“控制論動(dòng)物”,是一個(gè)基于感知-動(dòng)作模式模擬昆蟲(chóng)行為的控制系統(tǒng)。
3.人工智能的目標(biāo)
人工智能的目標(biāo)包括:推理、知識(shí)表示、自動(dòng)規(guī)劃、機(jī)器學(xué)習(xí)、自然語(yǔ)言理解、計(jì)算機(jī)視覺(jué)、機(jī)器人學(xué)和強(qiáng)人工智能八個(gè)方面。知識(shí)表示和推理包括:命題演算和歸結(jié),謂詞演算和歸結(jié),可以進(jìn)行一些公式或定理的推導(dǎo)。自動(dòng)規(guī)劃包括機(jī)器人的計(jì)劃、動(dòng)作和學(xué)習(xí),狀態(tài)空間搜索,敵對(duì)搜索,規(guī)劃等內(nèi)容。機(jī)器學(xué)習(xí)這一研究領(lǐng)域是由AI的一個(gè)子目標(biāo)發(fā)展而來(lái),用來(lái)幫助機(jī)器和軟件進(jìn)行自我學(xué)習(xí)來(lái)解決遇到的問(wèn)題。自然語(yǔ)言處理是另一個(gè)由AI的一個(gè)子目標(biāo)發(fā)展而來(lái)的研究領(lǐng)域,用來(lái)幫助機(jī)器與真人進(jìn)行溝通交流。計(jì)算機(jī)視覺(jué)是由AI的目標(biāo)而興起的一個(gè)領(lǐng)域,用來(lái)辨認(rèn)和識(shí)別機(jī)器所能看到的物體。機(jī)器人學(xué)也是脫胎于AI的目標(biāo),用來(lái)給一個(gè)機(jī)器賦予實(shí)際的形態(tài)以完成實(shí)際的動(dòng)作。

人工智能、機(jī)器學(xué)習(xí)、數(shù)據(jù)挖掘這些非常相關(guān)的術(shù)語(yǔ)或知識(shí)我們經(jīng)??吹?,也見(jiàn)到很多關(guān)于三者關(guān)系的文章和討論。一般來(lái)說(shuō),人工智能是一個(gè)很大的研究領(lǐng)域;機(jī)器學(xué)習(xí)是人工智能的一個(gè)目標(biāo),提供很多算法;而數(shù)據(jù)挖掘是偏向算法應(yīng)用的部分。三者相輔相成,另外也需要其他領(lǐng)域的知識(shí)支持。具體關(guān)系請(qǐng)參考下圖。

4.人工智能的方法
為了達(dá)到人工智能的目標(biāo),下面依次梳理一下學(xué)術(shù)和工業(yè)界研究的各種方法和成果。
4.1 知識(shí)的表示和推理
知識(shí)表示包括:基于知識(shí)的系統(tǒng),表示常識(shí)知識(shí)等。傳統(tǒng)的知識(shí)表示已經(jīng)很成熟了,包括了描述邏輯,也包括了語(yǔ)義網(wǎng)(資源描述框架RDF)。知識(shí)推理建立在邏輯上,首先需要龐大的數(shù)據(jù)集,比如freebase;其次需要關(guān)系抽取自動(dòng)化工具;最后需要合理的知識(shí)存儲(chǔ)結(jié)構(gòu),比如資源描述框架RDF。谷歌提的知識(shí)圖譜概念就是一種知識(shí)工程,它有龐大的知識(shí)庫(kù)和基于知識(shí)庫(kù)的各種服務(wù)。早年業(yè)界研究的知識(shí)本體也是一種知識(shí)工程,研究成果有 FrameNet、WordNet、中文知網(wǎng)HowNet等。具體的知識(shí)本體的例子請(qǐng)參考下圖。

IBM在2011年研發(fā)了Watson問(wèn)答系統(tǒng)。谷歌在2012年提出知識(shí)圖譜,作為谷歌的兩大重要技術(shù)儲(chǔ)備,一個(gè)是深度學(xué)習(xí),形成了谷歌大腦;另一個(gè)就是知識(shí)圖譜,用來(lái)支撐下一代搜索和在線廣告業(yè)務(wù)。臉譜公司利用知識(shí)圖譜技術(shù)構(gòu)建興趣圖譜,用來(lái)連接人、分享的信息等,并基于此構(gòu)建了graph search。其他的工業(yè)應(yīng)用還有:SIRI、EVI、Google Now、Dbpedia、 freebase等。一般一個(gè)知識(shí)工程的底層技術(shù)架構(gòu),請(qǐng)參考以下圖示。

4.2 自動(dòng)規(guī)劃
首先要說(shuō)一下有限狀態(tài)機(jī)(FSM),一般應(yīng)用于游戲機(jī)器人,網(wǎng)絡(luò)協(xié)議,正則表達(dá)式,詞法語(yǔ)法分析,自動(dòng)客服等。如下圖是一個(gè)簡(jiǎn)單的游戲機(jī)器人狀態(tài)轉(zhuǎn)移和行動(dòng)圖。

其次是狀態(tài)空間搜索,最簡(jiǎn)單粗暴的是盲目搜索,就像特斯拉評(píng)價(jià)愛(ài)迪生:“如果說(shuō)有一根針掉進(jìn)草垛了,讓他去找,他會(huì)毫不猶豫的,一根一根草挑出來(lái)找”。優(yōu)化改進(jìn)的版本是啟發(fā)式搜索,如A*算法。這方面的應(yīng)用有國(guó)際象棋Deepblue,圍棋AlphaGo。AlphaGo 在蒙特卡洛樹(shù)搜索 (Monte Carlo Tree Search, MCTS) 基礎(chǔ)上使用了深度學(xué)習(xí),監(jiān)督學(xué)習(xí)和增強(qiáng)學(xué)習(xí)等方法。“蒙特卡洛樹(shù)搜索”是一類(lèi)啟發(fā)式的搜索策略,能夠基于對(duì)搜索空間的隨機(jī)抽樣來(lái)擴(kuò)大搜索樹(shù),始終保證選取當(dāng)前抽樣中的最優(yōu)策略從而不斷接近全局最優(yōu),確定每一步棋應(yīng)該怎么走才能夠創(chuàng)造更好機(jī)會(huì)。另外還包括:計(jì)劃、動(dòng)作和學(xué)習(xí),敵對(duì)搜索,基于邏輯的規(guī)劃方法,狀態(tài)演算等內(nèi)容。

4.3 機(jī)器學(xué)習(xí)
谷歌CEO桑德?tīng)枴てげ淘谝环庵鹿蓶|信中,把機(jī)器學(xué)習(xí)譽(yù)為人工智能和計(jì)算的真正未來(lái),可想而知機(jī)器學(xué)習(xí)在人工智能研究領(lǐng)域的重要地位。機(jī)器學(xué)習(xí)的方式包括:有監(jiān)督學(xué)習(xí)、無(wú)監(jiān)督學(xué)習(xí)、半監(jiān)督學(xué)習(xí)和強(qiáng)化學(xué)習(xí)。其中的算法有:回歸算法(最小二乘法、LR等),基于實(shí)例的算法(KNN、LVQ等),正則化方法(LASSO等),決策樹(shù)算法(CART、C4.5、RF等),貝葉斯方法(樸素貝葉斯、BBN等),基于核的算法(SVM、LDA等),聚類(lèi)算法(K-Means、DBSCAN、EM等),關(guān)聯(lián)規(guī)則(Apriori、FP-Grouth),遺傳算法,人工神經(jīng)網(wǎng)絡(luò)(PNN、BP等),深度學(xué)習(xí)(RBN、DBN、CNN、DNN、LSTM、GAN等),降維方法(PCA、PLS等),集成方法(Boosting、Bagging、AdaBoost、RF、GBDT等)。想要深入學(xué)習(xí)的同學(xué)請(qǐng)參考《機(jī)器學(xué)習(xí)知識(shí)表格》和《機(jī)器學(xué)習(xí)方法匯總》。
深度學(xué)習(xí)是機(jī)器學(xué)習(xí)中人工神經(jīng)網(wǎng)絡(luò)算法的延伸和發(fā)展,近期深度學(xué)習(xí)的研究非?;馃幔驮谶@里介紹一下神經(jīng)網(wǎng)絡(luò)和深度學(xué)習(xí)。先說(shuō)兩層網(wǎng)絡(luò),如下圖,其中a是“單元”的值,w表示“連線”權(quán)重,g是激活函數(shù),一般為方便求導(dǎo)采用sigmoid函數(shù)。采用矩陣運(yùn)算來(lái)簡(jiǎn)化圖中公式:a(2) = g( a(1) * w(1) ), z = g( a(2) * w(2) )。設(shè)訓(xùn)練樣本的真實(shí)值為y,預(yù)測(cè)值為z,定義損失函數(shù) loss = (z – y)2,所有參數(shù)w優(yōu)化的目標(biāo)就是使對(duì)所有訓(xùn)練數(shù)據(jù)的損失和盡可能的小,此時(shí)這個(gè)問(wèn)題就被轉(zhuǎn)化為一個(gè)優(yōu)化問(wèn)題,常用梯度下降算法求解。一般使用反向傳播算法,從后往前逐層計(jì)算梯度,并最終求解各參數(shù)矩陣。

深度學(xué)習(xí)采用多層神經(jīng)網(wǎng)絡(luò),在求解參數(shù)矩陣時(shí)計(jì)算量隨層數(shù)呈指數(shù)上升。假設(shè)處理一張300*300像素的圖片,采用8層網(wǎng)絡(luò),每層6個(gè)節(jié)點(diǎn),那么在全聯(lián)接的情況下將有300*300*6^8個(gè)參數(shù)需要計(jì)算求解。卷積神經(jīng)網(wǎng)絡(luò)(CNN)提出卷積算子和權(quán)值共享來(lái)大幅減少參數(shù)個(gè)數(shù)。另外一個(gè)問(wèn)題是梯度彌散,由于sigmoid函數(shù)求導(dǎo)后的函數(shù)小于0.25,標(biāo)準(zhǔn)化正態(tài)分布產(chǎn)生的初始隨機(jī)參數(shù)w也都在0-1之間。而各層的梯度是從后往前逐層求解,且前面層的梯度是來(lái)自后面層的值乘積。因此會(huì)有一個(gè)剃度指數(shù),一旦初始值小于1,經(jīng)過(guò)多層乘積后將會(huì)迅速變小。一個(gè)有效的解決方案是使用ReLU做激活函數(shù)。介于篇幅這里只做簡(jiǎn)介,想要深入了解深度學(xué)習(xí)的同學(xué)請(qǐng)參考《一文讀懂深度學(xué)習(xí)》。

4.4 自然語(yǔ)言處理NLP
NLP是人工智能的另一個(gè)目標(biāo),用于分析、理解和生成自然語(yǔ)言,以方便人和計(jì)算機(jī)設(shè)備進(jìn)行交流,以及人與人之間的交流。它的應(yīng)用領(lǐng)域包括:機(jī)器翻譯,文本、語(yǔ)音、圖片轉(zhuǎn)換,聊天機(jī)器人,自動(dòng)摘要,情感分析,文本分類(lèi),信息提取等。以下給出了自然語(yǔ)言處理簡(jiǎn)要的知識(shí)架構(gòu)圖。

4.5 機(jī)器人視覺(jué)
視覺(jué)對(duì)人很重要,人類(lèi)獲得訊息90% 以上是依靠眼睛的,那么對(duì)于機(jī)器人要想獲得人獲取信息的能力,重點(diǎn)是解決機(jī)器人視覺(jué)系統(tǒng)。目前機(jī)器視覺(jué)已經(jīng)可以做到很多事情,比如識(shí)別人臉、標(biāo)志和文字;探測(cè)物體并了解其環(huán)境的應(yīng)用,如自動(dòng)駕駛無(wú)人車(chē)等;檢測(cè)的事件,對(duì)視頻監(jiān)控和人數(shù)統(tǒng)計(jì);組織信息,如對(duì)于圖像和圖像序列的索引數(shù)據(jù)庫(kù);造型對(duì)象或環(huán)境,醫(yī)學(xué)圖像分析系統(tǒng)或地形模型;自動(dòng)檢測(cè),如在制造業(yè)的應(yīng)用程序。
4.6 機(jī)器人學(xué)和強(qiáng)人工智能
機(jī)器人學(xué)是一個(gè)交叉學(xué)科,主要研究包括環(huán)境適應(yīng)機(jī)器仿生,機(jī)器人自主行為,人機(jī)協(xié)作,微納操作機(jī)器人,制造裝備機(jī)器人、科學(xué)工程機(jī)器人、服務(wù)型機(jī)器人等。目前國(guó)內(nèi)的機(jī)器人行業(yè)還沒(méi)有形成規(guī)模,商業(yè)化做得好的比如大疆、沈陽(yáng)新松機(jī)器人公司。
強(qiáng)人工智能是人工智能研究的最主要目標(biāo)之一,強(qiáng)人工智能也指通用人工智能(artificial general intelligence,AGI),或具備執(zhí)行一般智慧行為的能力。強(qiáng)人工智能通常把人工智能和意識(shí)、感性、知識(shí)和自覺(jué)等人類(lèi)的特征互相連結(jié)。實(shí)現(xiàn)強(qiáng)人工智能至少需要擁有以下能力:
自動(dòng)推理,使用一些策略來(lái)解決問(wèn)題,在不確定性的環(huán)境中作出決策;
知識(shí)表示,包括常識(shí)知識(shí)庫(kù);
自動(dòng)規(guī)劃;
學(xué)習(xí);
使用自然語(yǔ)言進(jìn)行溝通;
整合以上這些手段來(lái)達(dá)到同一個(gè)的目標(biāo)。
目前的強(qiáng)人工智能主要出現(xiàn)在電影或小說(shuō)里,比如斯皮爾伯格導(dǎo)演的《人工智能》里面的機(jī)器男孩大衛(wèi)。
最后,再回到人類(lèi)智慧和人工智能的討論上,人類(lèi)智慧是人類(lèi)的“隱性智慧”與“顯性智慧”相互作用相互促進(jìn)相輔相成的能力體系。其中,“隱性智慧”主要是指人類(lèi)發(fā)現(xiàn)問(wèn)題和定義問(wèn)題從而設(shè)定工作框架的能力,由目的、知識(shí)、直覺(jué)能力、抽象能力、想象能力、靈感能力、頓悟能力和藝術(shù)創(chuàng)造能力所支持,具有很強(qiáng)的內(nèi)隱性,因而不容易被確切理解,更難以在機(jī)器上進(jìn)行模擬;“顯性智慧”主要是指人類(lèi)在隱性智慧所設(shè)定工作框架內(nèi)解決問(wèn)題的能力,依賴(lài)于收集信息、生成知識(shí)和創(chuàng)生解決問(wèn)題的策略并轉(zhuǎn)換為行動(dòng)等能力的支持,具有較為明確的外顯性,因而有可能被逐步理解并在機(jī)器上模擬出來(lái)。目前幾乎所有的人工智能都只能模仿人類(lèi)的解決問(wèn)題的能力,而沒(méi)有發(fā)現(xiàn)問(wèn)題、定義問(wèn)題的能力。因此,“人工智能將全面超越人類(lèi)智慧”的說(shuō)法沒(méi)有科學(xué)根據(jù),目前的人工智能只是幫助人類(lèi)提高生產(chǎn)力的工具而已。
轉(zhuǎn)自:千鋒教育