摘要:究竟什么是人工智能,我們這一整年都在聽人工智能這個東西非常火,可以是圖像識別,可以是一切的一切,究竟這個名詞的定義到底是什么?什么程度的智能才算人工智能?本次討論可能會給你一個答案。
SoPlus沙龍:AI從云端到終端
時間:2017年12月12日下午
地點:搜狐媒體大廈三層開放演播室
主持人:歡迎大家來參加今天的活動,我是博羽,今天我來主持這場活動,現在就把舞臺留給各位嘉賓。大家介紹一下自己。
錢晨:大家好,我是洪泰智造的錢晨,在這里負責技術,洪泰智造工場主要做硬件孵化和產品孵化的公司,同時還有基金,還有產業園,三塊領域。
陳忠民:大家下午好,我叫陳忠民,來自深鑒科技,目前負責人工神經網絡的加速器設計和一些芯片相關的研究工作。非常高興認識大家。
毛嵩:大家好,我是高通創投部的毛嵩。高通是一個移動芯片公司,我們創投部是高通的風險投資部門,我們最近的投資方向也逐漸向前沿科技轉移,而人工智能也是前沿科技中一個非常大的話題,很高興過來跟大家一塊兒交流。
程健:大家好,我是來自中科院自動化研究所的程健。
亓超:大家好,我是三角獸科技的亓超。三角獸是一個創業公司, 是洪泰智造投的創業公司,運營兩年時間,我們focus的方向是自然語言處理以及相關的AI產業應用。
主持人:感謝大家的自我介紹。我們先從第一個問題開始。究竟什么是人工智能,我們這一整年都在聽人工智能這個東西非常火,可以是圖像識別,可以是一切的一切,究竟這個名詞的定義到底是什么?什么程度的智能才算人工智能?
亓超:從智能來講,我個人的理解,還有很多緯度來定義,希望類人的方式去做一些思索或者反饋,在我們現在這個方向,自然語言處理能夠理解人說的話,清楚表達出自己的反饋。另外,它能夠做更多主動的反應可能會體現它的智能方面,當然在圖像或者其它方面還有另外的一些定義,可能由其他幾位嘉賓來解釋。
程健:人工智能現在沒有特別明確的定義,學術界有很多不同的看法,有人說人工智能像人一樣思考、行動,這樣的就是人工智能。我看到有的對人工智能的定義比如研究能夠模擬人和拓展延伸人的智能的學科,這個還是比較準確,當然非常廣泛。
主持人:就是說還是要和人產生一定的關系,像人一樣思考,像人一樣行走或者……
程健:模擬人的一些智能或者延伸拓展,有可能模擬像人說話,甚至比人說得更好或者記憶力更好,比如下棋,模擬人下圍棋,但是比人下得更好。
主持人:基于人超越人的觀點。
毛嵩: 這個問題其實真的挺難的。我所理解的人工智能是能夠以類似于人的方式去理解、分析和解決問題的一種方式方法。當然這本身也是一門學科。那么無論是此前的研究語音的人工智能也好,還是研究圖像的人工智能也好,其實第一步都是讓機器去感知和理解人類,而光是這一步就走了很久。我們人類從上個世紀發明計算機開始用鍵盤錄入信息,到現在發展到用攝像頭來看到和感知外部世界,其實都在解決這第一步怎么讓機器去理解人所觀察到的世界。而第二步才是從中去分析這些個環境這些個因素中我們人所分析到到的東西。比方說這張圖片里是男孩還是個女孩,這是第二步。而什么樣程度的智能才算是人工智能呢?我認為我們現階段其實還停留在特別特別早的第一步的位置,就是還是讓讓機器開始理解這個世界的這一部,后面才是怎么樣用學習的辦法去解決人類希望它解決的問題,那樣才更“智能”一些。
陳忠民:整個人工智能其實不是突然出現在我們眼前,它也發展了很久很久,其實近些年來我們主要通過設計的一些算法、硬件或者兩者結合起來以后對人的思維過程有一個擬合的方式出來,同時表現出在商業市場上可能有一些很有前景的應用,包括在語音方面、圖像方面已經有成功的例子表明這項技術發展來看初步有一點點像人的一些思維,它能夠做到實時性或者準確性,能夠達到或者超過一些人目前表現出來的能力。我想這個事情從本質上來講還是一個機器對人的模仿,一個擬合,大概是這樣一個觀點。
錢晨:人工智能這個東西我看了很長時間,我發現其實不同學科的人對這個東西有不同的解釋,做算法的人天天說我的算法怎么樣怎么樣,做傳感器的人說我的算法加上我的傳感器怎么怎么樣,還有一批人解釋,它像人一樣思維。這里面為什么會有不同的理解?跟他們的學識背景有很大的關系。算法里面目前看到的基本上是大數據的方法跟決策樹、博弈論那些東西,那都是基礎科學的東西,包括語音處理,目前看到的語料庫。我以前是聲學所的,20年前大家都在做這些事,只是現在的科學技術發展計算機發展,尤其計算機的算力上來了,還有算法提高,這幾個結合,很顯性表達在語音處理。智能音箱特別明顯,以前說語音一維,后來大數據又出來一派Face++那些面部識別二維信號處理,這里面目前我看到比較流行的人工智能基本基于大數據的概念。實際上還有另外一個潮流邏輯,怎么計算,這個派系我還沒有看到很明顯的人工智能很突出的東西。傳感器+算法,這個大家也有爭論,到底是傳感器技術還是一個大數據算法技術?我現在有點看不清楚這個。但是傳感器流派尤其工業控制,在工業產業里面傳感器流派認為還是傳感器的技術是核心,人工智能其實大家談到最后一個點就談到節約了人的勞動力,提高了人的效率,這是一個核心問題。
主持人:那就是說剛才大家都提到了AI是提高人的效率,解決人的勞動力,越來越像人,甚至有可能超越人。我想問一個比較宏觀的問題,這個事情對于人類社會包括失業率、以后社會的發展究竟是好還是壞?究竟會有怎樣正面和負面的影響?
錢晨:我有一句話,杞人憂天。我是樂觀派,技術是好的,改善人們的生活,多余的時間我們有無限的創造力做多余的事,不希望人工智能提高了勞動力,讓人閑出來沒事干,讓人閑得無聊過著好像人們不希望的生活方式。實際上這是不會存在的,人類進步是越來越往前的,我們看到機器替代了勞動力的時候,其實人好像并沒有衰退,人還是再繼續進步。人工智能一句話總結,人工智能對社會是正面的推動,而且正面的東西比負面的東西多很多。
主持人:剛才錢博士提到人的創造力,機器現在AI也是越來越有創造力,會不會有一天創造力的部分也會被機器超越?
錢晨:這件事蠻有意思,我有一次開會講過一個事,一個老師在前面講課,一幫學生在聽,學生會出一個結果嗎?一定不一樣,老師教出來學生有學文科的有學理科的。機器不一樣,你把機器教出來都是一個性格特征。人工智能來了以后,人的創造力還會繼續發展,但人工智能這件事的創造力是在它所被經驗基礎上的邏輯分析擴展,而不可能一個學理工科的人突然變得有文科素材。這是我的一個想法。
陳忠民:主持人現在提到的這個問題其實在工程界或者學術界有時候會分成兩個類別,一個類別叫做強人工智能,一個叫做弱人工智能。強人工智能跟主持人提到的情節很相似,能思維、能推理甚至表現出某種創造力更像人,事實上這件事情從科學上來說,到目前為止沒有任何技術層面能夠達到這一點。相反而言,對我們來說,目前大家能夠切實感受到的人工智能其實屬于弱人工智能的范疇,只是說讓機器通過對人的思維方式的分析擬合去代替人們做一些事情。總的來說,它仍然是工具層面的創新,仍然是一個更高起點的工具,能夠幫助人去承擔一些重復性的或者是比較枯燥的勞動。從某種程度上來說,我認為它雖然會影響一些就業,但是同時它會創造出一些新的生活方式,產生一些新的崗位的需求,對于人的發展我覺得到目前為止在我們看來仍然是一個非常正向的部分。
毛嵩:我一直有一個觀點,縱觀人類歷史,你會發現,我們所有好的發明創造其實都干了同一件事,就是讓我們變得更懶。我們不想走路,于是我們發明了車,我們想走得更快更遠,于是我們發明了飛機,現在我們連思考都不想思考,于是我們開始發展人工智能。然后大家慢慢變得越來越懶。而對于今天的人工智能而言,我其實非常贊同陳總的這個觀點,就是目前我們還是弱人工智能,即我們當前的人工智能還是針對某一個特定領域甚至某一個特定應用,用大量數據反復訓練之后達成的一個智能化解決方案,這樣的弱人工智能創造力是有限的,我們人類跟它有著巨大差別。比方說人類的愛因斯坦能夠從我們現實生活的觀察想明白相對論,而這個事情我理解對于當今的人工智能而言,無論你用什么數據去灌它,無論怎么去深度學習它都是創造不出來的。當然我個人也不知道愛因斯坦怎么想出來的,因為我也想不出來。
主持人:靈光一閃是機器無法模擬的。
錢晨:人的多樣性。
毛嵩:目前我們的人工智能的基本思路是針對某一特定問題或特定應用基于大量標定數據反復訓練之后得出的規律性解決方案,而恰好我們人的能力是基于小數據非反復訓練去得出其規律,這是兩者的本質區別。
程健:前面幾位嘉賓講到的這個觀點基本上贊同,人工智能不會超越人類,我覺得從哪個方面來講?將來很多人的功能方面,比如剛才提到的下棋,機器已經超越人類,包括其它的方面甚至包括繪畫,現在已經有深度學習能夠模擬出梵高畫風的畫,比一般的模擬畫得更像一點。在特定的一些領域一些方面,人工智能超越人肯定是已經超越了,未來可能在更多領域會超越人。但是超越人并不可怕,就像剛才毛總說的,人不想走路了,我發明汽車,這樣的話腿為了趕路的功能越來越少,更多的是體育鍛煉或者其它的需求。但是人在更高層次或者其它方面發展有更多的時間和精力做這樣的事。人工智能既然分兩個,一個是人工一個是智能,一定基于人的模擬或者在人能夠思考能夠觸及到的范圍內來模擬這樣一些智能。我覺得機器超越人永遠只是在一些特定上面超越,但是永遠不可能取代人。
主持人:就是一個點和一個面的關系,它可能取代了這些點,但是由于我們人類思維的發散性,可能我們會發散出更多新的東西。
程健:而且這個時間會很漫長,可能逐漸在很多領域取代人或者超越人,但是人又可以發展出更多新的東西,更有意思的東西,挑戰性的東西去做。
主持人:其實可以理解為機器和我們一起進化,一起朝向更好的未來邁步。
亓超:我的觀點沒有什么特別大的出入,還是偏向樂觀。剛才幾位嘉賓提到,會讓機器做一些人不愿意做的事情,這個事情是大部分AI落地最大的場景。額外還有一些人做不到的事情,也需要機器來做一些,例如最近大家比較關注幼兒園事件,這里面如果我是家長恨不能24小時陪著孩子,讓他絕對安全,這個做不到。那么你加一個攝像頭在幼兒園也不可能8小時一直盯著屏幕去看你的孩子。這時候可以用到一些AI技術來解決這個環節的問題,比如聲音的檢測,孩子哭了收到報警,孩子受到關鍵詞的威脅收到報警,引起家長的關注,這是人沒辦法做到,實際你可以做,理論上可以做,但是實際無法執行,都可以讓人工智能參與角色。
另外,人工智能并不是新的替代人的方式去演化,而是一個角色的補充。咱們經常看各種機器人在科幻動畫片、科幻世界里面出現,它的角色更多是補充。比如機器貓出現在康夫家里,康夫的爸爸媽媽沒有消失掉,同學沒有消失掉,只是增加24小時可以陪伴在他身邊幫他一塊兒度過童年狀態的機器人,并沒有取代某人做這個事情。另外,每次技術的更新迭代其實也像幾位嘉賓提到的,促進了更多的可能性,讓人的生活更好,或者舒適程度更高。原來通過狩獵、捕魚去過生活也不錯,但是有了農業以后可以比較穩定吃飽飯,開始創造更多的藝術或者催生對人類發展更好的工作,這實際上是對人的一個促進。現在還是幫助咱們解決一些問題,幫助社會的發展。
現在大家對人工智能充當的角色,我認為目前狀態還是偏向于可以替代一些實習生或者助理的身份。什么樣助理?我們跟廣發證券合作,代替投行專家這是很難的,但是我可以讓機器來搜集很多參考消息,給行業分析師做參考,用他們自己的模型做一個輸出,這個是可以做的事情。取代資深醫生非常難,但是可以給醫生提供輔助的信息讓他們參考,這個也是可以做到的,可以補充角色,這個其實在某些行業大大降低用人的成本,其實會讓這個事情往前的發展會更快。
主持人:像每一項新技術出現的時候一定需要相關的法律法規、道德規范,各位覺得我們現在是不是有一些包括數據的泄漏包括安全方面保密方面的工作,現在規范的建立是已經健全的嗎還是大家覺得需要一套新的規矩,需要一套新的體系來規范人工智能。
亓超:任何一個國家的法律都是逐漸完善的,在這種情況下沒有一個完美的東西,根據實際的情況做出調整。大家現在目前來說從從業人員也好,學術界、產業界更關注怎么把這個技術往前推進,如何在有限的范圍內使用技術,大家還沒有到特別關注的程度。也有國外的產業用戶會去成立類似于人工智能倫理委員會,探討這樣一些方向的發展。現在目前來說沒有特別大的約束。無論是人工智能的技術,涉及到人的隱私、安全都是需要考量的,不能歸因人工智能技術帶來的問題,而是全方位的考量更有力一些。
陳忠民:這方面我認為所謂的安全性或者隱私還有一些人是不是每時每刻在機器觀測底下變得不自由了,這件事情跟沒有人工智能之前并沒有什么變化。首先在沒有人工智能之前我們有互聯網,我們有攝像頭,我們有移動互聯網,每天會在云端或者個人交換很多數據,這個場景并沒有發生什么變化,各級既有倫理委員會,行業部門協會,出臺的各種規范和需要各個行業遵循的標準,科技走在法律和行業標準之前,我們還在探索很多新的方式,但是這個問題跟互聯網時代我們面臨的問題是一樣的。技術向前發展,相信各個行業協會、一些聯盟或者政府部門,他們都會出臺相應的法律或者規范來約束防止這項技術的濫用。
毛嵩:坦白說,我們目前對隱私保護是否健全跟人工智能這個技術其實沒什么特別的關系。當然有意思的是,如果你反觀人類歷史,從文明發展的角度來講,人類文明最大的一個發展的源泉其實來自于協作。其實如果你把我們某一個人放到樹林里去,這個人類個體實際上是很弱小的。別說老虎、熊,估計一只豹子也干不過。但人類之所以變成現在這樣,我們幾乎掌控這個地球,根本原因是因為我們在一塊兒工作。這是一個很有意思的事,比如我們今天的談話,之前我們幾位并不認識,但是我們在一瞬間能夠建立談話的關系,如果沒有我們的社會體系,沒有交互關系的話,是需要很長時間的。這就要感謝互聯網,要感謝社會法律法規等等一切。但同時,快速建立合作關系的代價是我們要放棄我們的部分隱私,甚至很多的隱私。比方我坐在這兒大家就知道我長什么樣,大家知道這個時間我在這個位置,不喜歡我的就可以準確的扔個石頭過來。我們所有的法律法規實際上一直是在對個人隱私個人安全的保護與提高效率之間的平衡中不斷發展。人工智能很可能是下一步提高效率的一個辦法,它也勢必會帶來一系列的影響,甚至是一系列對個人隱私披露的要求,但著一定是平衡的,只是誰先往前走這一步的問題。即便在沒有人工智能的時代,我們的隱私也并沒有被完全的保護。
主持人:本來應該被保護嗎?
毛嵩:這點很難說,是一個平衡,如果把自己保護得太死,你就喪失了效率。
程健:我覺得確實人工智能技術的發展給我們很多人的自由、隱私等等提出新的挑戰,剛才大家講這個社會的法律法規不斷在完善。之前可能做人臉識別,智能技術沒有現在這么高的時候,以前不存在網絡而需要到銀行去開戶的程序。現在人臉識別可以做到,可以我在網上去銀行開戶,必須有法律法規保證這樣的行為。今年高考機器人都可以做題做得很好,將來可能必然要有相關的法律法規來約束這樣一些行為。其實還有很多其它方法,隨著人工智能技術發展提出新的挑戰。任何新的技術出現以后,都會對現有的社會和法律提出挑戰,我們就不停給它打補丁,不停去發明新的規章制度來約束這樣一個技術,從而讓它更好地為社會服務。
錢晨:程老師剛才講的我很贊同,這就是一個新的技術出現,會導致新的社會現象,這個社會現象導致你的法律應對,其實就是三者的相互調整。毛總說的還是調整出來以后的效率在哪兒,如果效率好就是一個平衡點,效率不好這件事要么技術完蛋了,要么法律又得調整。這個事不是人工智能特有,汽車技術出來我們的焦慮是交通法規,建立了很好。石油出來,又污染出來了一套。技術、人類行為、社會平衡三種調整。
主持人:我們把話題從宏觀的社會意義拉回來,這次Panel的話題,AI在云端還有在終端的應用,開始說了一下云端,我們現在就來聊一下終端。第一個問題,云端和中端人工智能有哪些不同的表現?
錢晨:回答一部分,我以前一直做電子類產品,在云端解決算力算法,在終端解決交互問題,這是兩個完全不同的東西。為什么最近智能音箱火?后端的問題,算力和算法已經達到一定的程度,echo到了消費者那兒,交互輕松實現,所以這件產品就出來了。實際上再往下說,從用戶端終端到云端是打通了的,這中間是很好的很有效的協同了,這是云端,云端是通了以后的問題,而不是說云端一定如何如何,終端不能如何如何。語音處理這個行業做了多少年,其實語料庫做了多少年?現在計算機能力上來了,我們以前做單機的與處理怎么都不靈,手機為什么靈,手機省事兒,4G5G的速度在那兒,把一段話拆上去放到云端算力夠,直接送下來,這跟網絡基站都是相關的。
陳忠民:我從硬件方面說一下我的看法,剛才錢總說的還是很正確的,我們現在同時面對云端和終端兩種情況,并不是說二者對立,只是說二者在各自合適的場景底下工作,終端每天跟著我們到處跑,對于終端設備來說,算法不可能很大,算法也不可能很淺,限制條件比較多,隨身攜帶要很輕,多少瓦電力能買到多少算力,這是我們終端考慮的點。在云端很多時候對電力的需求當然也要控制,從云端來說往往應對的算法是非常龐大的算法,可能需要幾百臺機器,像AlphaGO需要用到四、五百臺頂別的機器一起算才能把這個事情做好。在終端遇到的場景有很多的并發性,接入很多終端,每個終端都可能產生需求。從云端的設計來說考慮并發性以及設備能不能分割來做一些小的事情。
毛嵩:在我理解的中,首先AI是一個技術解決方案,它會針對不同的場景實現不同的應用,而每個應用都有云端和終端。終端側會著重關注交互,以及關注這樣一個應用在終端這個位置所所最需要的那些基本功能,但是終端側受制于終端本身的算力和功耗。舉一個例子,我要做一個人臉識別應用,這個應用是因為我要抓一個壞蛋,需要判斷這個城市攝像頭中看到的所有人是不是這個壞蛋,要把他給比對出來。這個事這個比對過程我們就沒有辦法放到每個攝像頭這么去做,因為這個過程所需要的算力很大,我們在終端側只能是把它拍下來然后根據我所需要的基本特征把人臉抓好提取出來,然后傳到云端做對比。所以一個應用是云端終端配合起來做的一件事,而我會認為終端側會更關注具體應用相關的功能。
主持人:人工智能不能做的事情會不會以后在算力方面有一個突破,現在覺得不能做的事情變成能做的事情,我們引以為傲的創造力也好,發散性思維也好,多元性也好,都被強大的人工智能淹沒?
毛嵩:以前有一個大數據家拉布拉斯說過一句話,叫“給定世界初態,我就可以預測未來”。他認為任何東西可以算出來的。但這句話要能實現,首先這個初態必須要足夠細致,其次我們的算力需要能足夠強。在人工智能現在這個階段琢磨這個話題實在太早了,哪怕我剛才我談到的人臉識別抓壞蛋這件事所需要的算力已經很高了,我們其實很難短期之內大幅突破算力的瓶頸。
程健:算力只是一方面,現在大家經常講人工智能三要素,算力、大數據、算法。這三者缺一不可,比如AlphaGO下圍棋,以前超級計算機算力足夠強,為什么2016年之前沒有AlphaGO出來,沒有能夠打敗人類選手。算法沒有突破,有算力提高了就能把所有的事情解決。
亓超:我們需要把我們的技術和場景落地,到底在手機端上實現完全的語義方案還是把數據傳回到云端去處理,我們始終會遇到這樣一些問題。還有發在我們的端還是合作方的云端,具體根據自己的場景選擇合適的狀態就好,不一定是所有手機端的東西處理掉,很多場景非要在手機處理的話,影響手機體驗,對用戶想達到理想的狀態是沒有辦法實現的。極度涉及到隱私或者需要保密的條件嚴苛環境下來說可能針對選擇封閉的環境更好。
語音識別過程也會分終端實現還有云端的實現,比如喚醒搜查搜集前端信號降噪,清洗加工后的數據去算,現在比較完美合并到整個解決方案里面去。到底用終端實現還是終端實現不了這方面的應用,還看最終的研究效果哪個更有利,是最終大家選擇的方式。
計算這個事情像百度很早之前就有非常大的集群,幾十萬臺機器幫你做排序搜索的結果,現在有新的硬件產生,讓原來更多的集群能做的事情匯集在相對小的集群的,跟算力結合起來。你給我足夠的時間我能不能當成好演員?很難。對機器也好對人也好都是一個道理。
主持人:接著超總的回答,我們剛才談到了云端和終端,談到了應用場景,最近比較火的一個概念AI手機,它到底是什么東西?和普通手機的區別在哪里?是不是一個概念性炒作?
亓超:首先看看AI手機場景應用更好理解,最開始Siri出現在蘋果手機里面,隨著時間的推移大家發現,人們經常調動Siri做的一些事情,并不是AI的服務,反而是應用讓IOS市場有比較繁榮的表現。
智能機比功能機有更多的擴展在上面使用,沒有達到人工智能的體現。人工智能可以產生一些手機上的應用落地,更多是一種更主動的方式去幫助人們做一些主動的嘗試。Siri語音助手一打開沒有東西,我認為并不是很好的體驗,手機好的助手是在我沒有需求的時候給我提供服務,就像今日頭條打開不是找某條新聞,我看到某條新聞可能牽扯出我的其它需求。打開Siri也有這樣的內容,比如8點提醒岸邊的比賽,我可能起床有交互的需求,等著我一個用戶,喚醒Siri再找到比賽的概率非常小。AI在手機上更傾向于主動的方式去幫助人們把一些他想要去獲取的信息主動搜集和推送,這樣是更好智能的表現。你沒想到的事情它幫你去做了,體現出它的價值。
程健: AI手機到底是指通過手機接入到AI系統還是本身這個手機就有AI智能的功能?剛才提到的Siri還有小冰小娜等等,這樣的東西早就有,不是今天才有。手機有這樣的AI功能,雖然我一直不太清楚哪一點可以成其為智能,第一次聽到AI手機很好奇,我也想去看一看,有點震驚。
毛嵩:當然我們做手機芯片的說聽到“AI手機”這個詞覺得震驚似乎有點不合適,不過我個人確實并沒有聽到太多關于AI手機的新聞或者消息。那么我的理解是這樣的,這肯定是一個新的概念。從手機的結構上講,如果我們在手機中搭載了支撐AI運算的模塊,無論軟件模塊還是硬件模塊,并且能夠跟傳感器連在一起,我個人覺得我們就可以稱呼它為AI手機。我們現在看到很多手機都有一些AI應用,可以直接被植入的,比方說人臉識別,這個可以做表情包,打開相機一拍,就可以在相片上加一些額外的元素,比方說覺得我生氣了就在我頭上加一團火,這個功能實際上是人連臉識別的結果,知道你的面部位置、面部標準點的位置,知道你的心情,就能做到,這其實是手機層面上基于人工智能的小應用。隨著時間的推移,以后這樣的應用越來越多,那么在手機上為了支持這種圖像識別也好,語音識別也好,在軟件硬件和層面的修改就會越來越多,那時候可以我們就稱其為越來越AI的手機。
陳忠民:AI手機這部分從我接觸的范圍來說,華為、蘋果、高通都有相關的AI解決方案出來,通常來說會植入一個專用的加速器來做這些事情,同時上層軟件會做一些類似于毛總提到的人臉識別、語音分析等等功能。這個交互方式對我們來說,從一個手機用戶的角度來說,這件事情改進了我和手機之間的交互方式,整個方式變成我不需要再觸摸碰手機,不用我冬天帶手套掏掉手機摘掉手套再按,可以用語音甚至聲調控制他。你不是在跟機器對話,而且是一個助理。大部分人不太擅長拍照,大家通常說我照十張最后選一張還可以就留著,如果有硬件或者軟件的模塊,代替我來做一些判斷,更有表現力,雖然安下快門那一剎那,他在尋找最佳的拍攝時間,識別出人更加好看的角度,或者這個人眼睛真的睜開了。人和手機的交互變得更加流利、自然,另外代替人操作手機比我們操作得更好,AI手機給我們帶來了可以值得去試的一個行業。
錢晨:我已經離開手機行業了,手機行業是一個喜歡造詞的行業,每年有新詞,不然消費者不知道怎么買東西了。第二,手機是一個集成商,沒有自己的新東西,把行業里面的新技術拿進來。手機廠商把一些關于AI的應用放進來,但是這會兒突然發現它的傳統CPU高通不行了,ISP不靈了,高通又編了一個故事,AI的應用芯片。高通這個故事好,接著來,他們的目的是什么?想把AI應用放到手機里,用手機給客戶帶來更好的感受。但是感受的時候可能在剛出現的時候不太好,過幾年就好了,跟我們智能手機一樣,剛開始功能機換成智能機的時候,沒有感覺到那么好。我們在摩托還覺得客戶挺不理解我們,那時候用鍵盤,手寫輸入不如鍵盤打的快。實際這個東西慢慢變化,誰還用功能機?鍵盤也用得很好。
AI就是一個方向,大家今天認為是AI的應用越來越多放到手機,有可能明天大家覺得這不是AI,手機輸入也可以理解成是一個東西。目前交互還沒有完全變。
主持人:剛才提到AI芯片,AI芯片這年也是非常火的東西。AI芯片到底好在哪里?到底是怎樣突破性的東西,讓所有人覺得這簡直是下一個XSpace。
錢晨:我以前做電路的時候東一件西一件拼成一個電路板拼成一個手機,你拆開芯片看模塊都差不多,用的總線都差不多。主要是現在的算法強調的不一樣了,以前浮點算法,TI做了很多浮點算法,TI做了很多卷積的算法,實際是底層支撐的核心算法,算法表現力表現出來叫AI芯片。AI技術算力,大數據算法的出現可能有一些對芯片效率的重新提高,這是大家提到的AI芯片算法。
高通兩年前還不談AI,為什么今天談AI?做產品定義的時候,他們已經定義了這個技術趨勢,做出來符合目前技術流派的芯片,芯片符合AI。
主持人:換湯不換藥?
錢晨:不是,要換藥的,我以前接觸芯片的底層結構,變了很多,TPU的時候和GTU還是有蠻大區別的,Caffe等等區別還是挺大的。
陳忠民:我是做芯片的,替芯片說幾句話。第一,我們通常為什么AI相關的芯片廠商談到一些投資,大家比較重視芯片對于AI的加速功能,主要原因,傳統上我們認為像我們自己以前用的CPU這些東西某種程度上來說它是非常通用的,它為了通用性,犧牲了一些對于計算性能的需求,但是除了超級計算機,我們早期做的運算還不是性能那么好,一般人的處理器不需要特別的處理器。但是AI出現以后,它的算法相對比較單一,很多人發現,如果我今天拋棄處理器來做這件事情,我設計一個硬件結構非常符合算法的需要,同時我們可以在CPU不是花很多芯片面積做這件事情,只花了一點點,CPU里面大部分東西對我們沒什么用,把那部分縮小,偏計算單元的部分處理器里面,有8G,比如谷歌放六萬四千進去,算力一下子幾千倍增長,GPU也是類似原理,并行計算做得非常好。一加一減進去,芯片對于算法的支持,尤其神經網絡有些想法的支持變得非常好,神經網絡算法有很多點有一些weights去計算,并行很多運算單元一起上的話,傳統上處理器要一秒鐘才能識別出人個算法。實時性有很大的價值,我跟人交互要很流暢,不能說我跟語音設備丟一個命令過去,隔倆小時再給我反饋,誰都受不了這種體驗。從芯片的角度來說,不是因為這項芯片技術有了什么突破性的進展,而是說如果只服務于單一算法,這個芯片可以做得很特殊,堆砌很多算力,相對傳統GPU處理器性能表現更好。這里面還是一個算法變化、場景變化,導致今天發現必須硬件上做出一些改進,才能做得更好。我們拋棄了像CPU追求的通用性,只是為了并行計算做一些事情,這樣的話會得到很好的結果。從計算力的角度來說,尤其AI芯片類公司做的是實時給用戶一些體驗,我在故引擎上圖片一個圖片識別的任務,不能讓我等五分鐘才能拿到結果,我希望一分鐘得到結果,專用硬件設備會變得非常重要。這個是發展AI芯片基本的邏輯。
主持人:專人做專事。
毛嵩:基本上大家都說得挺明白了。我們從CPU到GPU再到AI芯片,實際上是一個芯片專業化的過程。當然對于目前的AI芯片呢,我的理解是這樣,它是當前針對基于深度學習的人工神經網絡的基礎運算單元而特別研制的運算芯片,所以其實我們今天把它叫做人工智能芯片是不科學的,因為基于人工神經網絡的深度學習只是人工智能里的很小的一部分,只不過恰好我們發現這個東西拿出來他對圖像識別特別好用,而圖像識別有本身又恰好應用很廣泛,需求也很大,于是我們就有這樣一個需求和資源去做這么一個芯片出來。而純粹就算法而言,在過去幾十年中人工神經網絡算法并沒有本質的變化,之所以最近突然冒出來,是因為計算機性能提高了,算力強了。
主持人:下一個比較大的問題,各位有些是創業者有些是投資者,各位在看待AI的時候會不會有比較不同的理解,我們業界對于AI的理解還有民眾對AI的理解有沒有區別?
程健:大家對人工智能的看法不一樣很正常,千人千面。每個不同的專業方向和不同行業的人來看這個事肯定是不一樣的,以亓總做語音,可能覺得讓語音自動識別,說話人,這是非常好的人工智能,我在研究所里面做人工智能,對我來說算法理論這些東西是我關注比較多的人工智能,剛才幾位做芯片的嘉賓認為AI芯片相關的人工智能,包括還有很多其它行業智能制造,對于它們來說,一定是有不同的看法。
主持人:剛剛收到千帆網友的問題,很好玩的問題,下一個人工智能爆發的場景會是什么?語音識別很火了,圖像識別已經很火了,下一個爆起來的應用場景會是什么?
亓超:我不認為火是真火,包括剛才提到的,大家對這個事的關注程度比較熱還是說期待能夠真的在很大的范圍或者場景中實實在在落地,或者帶來實實在在非常大場景的輸出可能是真的比較火,就像電,在這個屋子里面很多設備用電,如果比較火,我認為人工智能技術在這個屋里或者設備里面植入比較多,這是火,如果大家的關注程度比較高,我認為還是屬于偏早期的感知。
主持人:您覺得火的其實并不一定那么火。
亓超:生活場景里面用到的AI技術并沒有那么多,我認為并不是擴散的狀態,包括圖像也好,語音也好還都在探索和逐步迭代和提升的狀態,沒有真正去發揮它應該有的比較大的作用。
主持人:只是概念火,東西沒有真正火起來。
毛嵩:我可能更多站在投資人的角度來講這個話題,現在AI確實很火,但是我現在做投資有這么一個觀點,就是單純的技術本身的價值是有限的,只有當技術找到了合理的應用場景,并且在切實的供需關系中真正產生價值,這時候這個技術才才能火起來。最近的AI公司像商湯、曠視他們所處的行業是金融和安防,金融里面其實也是和安全相關的,做智能人臉識別,在這個領域他們做出了不錯的成績也獲得了不少收入。如果問我下面什么樣的場景AI會火,我往往會反過來想這個問題,即在在什么樣的一個需求下,AI技術能夠去滿足這樣一個需求。剛才我們提到幼兒園的場景,孩子們受到傷害了,大家都不愿意看到,在這里我們就可以想像,當然這個想像之前并沒有做過任何調研,如果每個班都有一個攝像頭,并且AI能夠在攝像頭視頻流當中很容易識別出有沒有老師去傷害學生這么一個動作,有的話給家長報警,如果這個事情能夠做出來的話,相信一定可以賺錢,可以很火。
主持人:謝謝這個BP。
陳忠民:我見到的場景來說,現在AI幫助人們畫畫下棋大家已經耳熟能詳了。目前圖像分析領域我們能夠做到人臉識別、車輛識別,但是精度還不夠。現在只能識別出來一輛車,但是識別出沃爾沃有點困難。如果下一步出現更高精度的算法,比如更多數據的訓練,會使得這個東西能識別出這個車的型號,甚至像美國一些學校做的研究,比如在不同的州里,通過車上的攝像頭判斷不同的車開過來,我對面開過來什么車,最后判斷這個州哪個人當上總統這些學習的方向。我是覺得因為把AI的能力賦予給各種各樣的機器或者說賦給各種各樣的解決方案,很難說哪個東西會突然爆出來特別火。從技術的成熟度上來說,現在在視頻流里面比如去連續檢測移動的目標,在多個鏡頭之間去追蹤一個東西,這個東西慢慢已經達到真正能用的地方。視頻里面通常是識別人臉,識別唇語特別困難,連續幾千張圖片里面分析嘴唇的變化,達到超過人類聽唇語的能力,其實這些都在不停往前發展。全世界各地各個研究院所還有一些公司在各個方向上探索,我想想象力空間很大,但是很難說在哪個點突然有一個人會做出什么東西,大家會覺得它很火。
主持人:一切皆有可能。
錢晨:這個我的答案是看不見。AI目前的狀態是什么樣的?科技界突然跑到應用行業了,但是在應用行業并沒有完全普及,尤其在工業界并沒有完全普及。媒體比較發達,大家天天看到,什么時候覺得火?突然你不知不覺每天都會感受到這件東西,那是火的時候。就跟手機一樣,在2005年你還沒有感覺到手機如此強大,就覺得是一個通話的東西,但是今天覺得手機可以處理你一切所有的事情。回顧歷史的時候,沒有發現突然某一天這件事情出現了,而是一點一點,而是行業領域在推動。AI的出現其實對行業,對整體大家的思維是一個好的方向的推動,這是很核心的問題。我們不回答哪天會怎么樣,會在哪個方面會火,但是這個技術不斷推動,最終有一天會很好,大家忽然感受到了,我們回頭去看AI是一個好東西。但是今天來說哪個點,其實大家還沒有看到,手機的人說會在手機上爆發,因為手機是每個人都用的東西。目前其實工業界開始大量使用,尤其視覺檢測這些東西,用的很多,醫療界有人說用了,但是好像用的少。
主持人:我們接下一個千帆網友的問題,各位說了AI這個東西可能只是概念層面上一個火起來的事情,各位對將要步入AI行業的創業者有什么忠告?
亓超:就是要有一個特別好的心態,不是因為什么火去創業,其實像我們三角獸幾位技術合伙人包括聯合創始人都是做技術的,并不是因為這幾年AI火投身相關,我們在做的自然語言處理的方向已經做了十幾年,一直持續做這個方向,并沒有說因為這個火去跳到這個創業的火坑里來。每個人自己擅長做什么事情可能是每個人定位先明確,如果擅長做這個方向的研發工作或者擅長做某個市場的工作,我會做得很好,如果強掰自己去追逐,可能會影響自己的目標和結果。
三角獸創業兩年以來的實踐,特別有一個感觸,找場景找落地特別困難,商業模式,雖然技術不錯,但是離真正落地中間的距離還是蠻大的。
主持人:市場還沒被教育好?
亓超:非常多方面的原因,一方面在某一個場景下你可能會解決其中的一部分問題,但是這個場景需要你完善解決方案的時候并沒有所有問題都解決掉,這是一個不完整的解決方案,沒有辦法端到端去實現打穿這個場景。另外一些場景,用戶的期望或者合作方希望跟實際上技術水平差距還是蠻大的,沒有辦法完全滿足他們的期待。如果說這個期待一旦滿足了,其實像你應該能在平時用到的很多產品體驗出來非常完善的AI產品,實際上還是差異蠻大的。這個事情還是一定要往前推進,如果始終閉門造車,自己在家里面研究算法,研究各種模型,一定沒有辦法推進這個事情,你遇到真正的問題,沒有指導解決什么問題,反過來所有的研發方向或者設計初衷都會偏離。即使非常難推動這個邏輯,也要放到實際去檢驗迭代,這是我們現在做的事情。三角獸雖然做的時間不長,但是落地的技術方案,我們也在不同場景下得到不同的體驗,在每個場景下困難是什么,需要解決什么問題,我們離真正解決有多大的差距,這是我們的經驗,可能為將來的發展或者選擇提供比較寶貴的經驗。
毛嵩:我再重申一下我剛才的觀點,就是技術本身的價值在實際落地之前,技術價值本身很難被評估和檢測的。這也是我看項目時一個大原則,技術是好技術,那么這個技術到底能夠幫什么樣的產業或者什么樣的一幫人解決什么樣的問題。如果說創業者沒有辦法回答這個問題,那么很可能他沒有辦法產生收入,沒有辦法產生收入就沒有辦法產生后面的利潤,這樣的話投資就是白投了。除非我投資是有別的目的,比方說想要收購你的技術。如果是對創業者在這個方向的建議的話,那么就是不要閉門造車,盡量多出去看看,想清楚這個技術要去哪兒用,怎么去用,集中在一個點把這個實際問題理理清楚。說到現在老百姓心目中的AI跟業界的AI有區別,老百姓說的AI是特別聰明的一個東西,就跟人一樣,什么都能干,而產業里面的AI還只能是針對某一個很特殊的場景中的某一個定義得很清楚的問題的一個解決方案。實際上現在很多AI創業的一個困難點反而是在某一個明確定義下可以這個方法能夠工作,但是真實的實際情況卻這個定義千差萬別,有無數實際問題產生,不符合最開始的定義邏輯,而且沒辦法解決,這也是很多AI算法無法落地的原因。
主持人:理想很完美,現實很骨干。
毛嵩:對,你比方說我在實驗室往那兒一坐背后是白背景識別初出我來被別人Demo沒問題。但是在大街上隨便拍到一個人,這個人可能很遠,可能是側臉,可能戴帽子,可能臉上有道疤,就會有無數個新問題產生,而這樣識別率就會直線下降。這就是實驗室Demo可以,出去不行,這實際上也說明我的實驗室Demo所解決的問題不完整,實際情況還有別的問題,比方說拍一個側臉能不能擰過來再識別,或者拍一個遠處的人能不能先放大再識別,這都是一系列很現實的問題,而能不能最后真正解決并順利執行下去不知道。現在的創業公司說自己是AI公司就跟以前說自己是平臺公司一樣,太多了,我們都快聽吐了。我們一般也不去質疑這類公司的技術怎么樣,更多的還是去搞清楚這公司怎么賺錢?這個技術能不能落地?有沒有什么實際問題?
主持人:不管AI也好還是什么其它東西,最重要的還是商業模式,自己要想清楚,要解決什么問題,利潤點在哪里。
毛嵩:不能說技術不重要,技術很重要,技術在某個商業模式可以快速放大,關鍵是技術在商業模式中的價值。
主持人:各位觀眾們有什么問題想問各位嘉賓?
智東西:從行業來講,目前人工智能技術發展到哪一步?為什么說實際應用的點在智能客服、智能分析員上?
亓超:首先客服能快速落地,比較看得透的場景,其實在這一塊人機對話客服的挑戰是蠻高的,找到客服是帶著怒氣來的,即使人去服務也是很難的挑戰,把技術做到很完美,這個事可能需要比較長的過程。跟金融行業的嘗試,金融客服,有很多的業務和支點,換到另外一個行業,ST股可能有十億種問法,根據智能客服和行業關聯度非常緊密,自然語音理解跟你相關,好比咱們說人都有說話的動力,但是不見得每一項工作都能去做,即使是一些銷售人員,有人擅長賣衣服有人擅長賣樓,跟專業知識有關。智能客服看似比較美好的產業落地,實際看到很大的痛苦和很大的挑戰在這里面。
還有一個,互相聊天其實是反的,并不是說解決你的問題為驅動,更多像朋友互相聊天,互通有無。對這個話題,我知道的告訴你,你把你知道的告訴我,大家互相信息互動,并沒有說要解決某個問題,相對來說這部分的數據和客服數據還會有一些區別。人工智能的客服數據很難在之前的狀態大量獲取機器學習的數據。即使客服對話,機器學習特別難,人說話比較散,比較斷斷續續,一句話分成N句話去說,再加上錄音條件識別的問題或者插入的問題、大的問題,讓機器人能夠比較好地吸收到。但是開放語音聊天不一樣,可以從互聯網上獲取大量廉價的人和人的對話,讓機器通過算法模型包括深度學習或者傳統的方法做得相應好一些。現在人工智能相關的技術做得好的還是積累數據場景才能有比較好的突破,否則還是在爬坡積累數據的過程。IBM Watson的投入,投到像醫院材料的建設、電子化建設的過程中,先把數據積累起來,才可能有機器的后來的作用。
提問:問一下毛總,您是高通創投,高通是國外的芯片,國內頂尖的芯片寒武紀還有曠視、海康威視,核心技術國家有一些保護措施,你們作為高通這塊會怎么去選項目或者怎么去搶項目?
毛嵩:作為一個國際芯片公司,我們在中國做事肯定會遵循中國的法律法規。目前來看我們投資過程中倒還沒有感受到在芯片層面或者算法層面有過多的限制。在選擇項目上講,有些公司明確講不拿美元的,這種項目即便很喜歡也沒辦法。有些公司愿意跟美元基金或者美國公司合作,我們當然很歡迎的。在這個方向上我們并沒有過多的偏好。
提問:請問各位專家,你們自己覺得在中國可以看得見的七年時間內,你們覺得看好的可以利用AI這個技術或者概念開展的應用方面的領域各自看好的是哪些?能不能簡單給我們談一下?
毛嵩:目前已經在進展的行業包括安防、金融、自動駕駛。
錢晨:其實我目前比較看好人工智能在工業智能制造領域,剛才亓總講自然客戶交互場景太復雜,數據不好做。但是在智能制造物料檢測這件事實際上場景很固定,很好做,又省了工廠大量的IQC來料檢驗的工程師、出貨檢驗的工程師這些勞動力,圖像檢測這一塊在智能制造是很大的格局。機器人現在也在談這個,圖像、聲音都是做交互。這里面可能未來七年,中國的工業正在升級改造,在工業應用普及以后,尤其中等規模的企業特別有動力,大規模企業早做了,富士康這種企業早做了,不是今天才做,五六年前就開始做這些東西。中等企業勞動力又短缺,勞動力成本上升,壓力很大,自動化改造用人工智能這件事在最近的五年到七年會大量普及,而且普及的程度相當高。普及到這個程度之后可能各種數據、算法又有提高,下面進入到消費類產品會更多一點。
陳忠民:現在人工智能技術真正落地來說非常希望在兩部分,第一安防產業,現在太多的算法公司也好產品公司也好,都在進入這個行業。在中國我們可以有很多的圖像數據,各種行業里面積攢的圖像數據以及交通場景積攢的圖像數據。在安防產業來說是將來兩三年對于AI行業是非常大的增長點。另外,在更久的將來,可能三到五六年區間來看,AI技術一個廣泛推廣的可能是來自于自動駕駛。自動駕駛無論在北美還是中國有相當多的公司在投入自動駕駛的研發,而且相關的測試數據有非常鼓舞人心的結果。如果以三年到五年的長度來看,自動駕駛可能是量非常大的市場。
程健:他們兩位是在芯片領域,其實AI芯片蠻有前途的,這是我看好的第一個方向。我是研究所出來的,我自己能感受到的,現在人工智能這么火,很多人對于人工智能技術、算法并不太了解。從這個角度來講,未來人工智能教育特別火。教育有兩種,一種教大家來學習人工智能技術、方法,還有在教育過程中用到人工智能技術,這兩種未來都是很有前途。
亓超:我補充幾句,特別火的首先是從業人員肯定特別火,人才供不應求,大家比較扎堆扎向這個行業,一旦積累更多的人才,首先大家能看到第一個露出。應用場景來說,先是工業界包括安防這些都是可見的,馬上可以有應用的狀態。從我的關注點,我關注普通人體驗的產品,可能在娛樂性比較強像游戲會有非常大的機會。在娛樂和游戲里面用戶對AI的要求并沒有像他們在平時接觸的助手要求那么高,這種情況下能達到很多場景上的狀態。我們最近也在嘗試探索這種可能性。
主持人:謝謝大家!今天過來,我們歡迎創業者為自己打廣告,有什么問題也可以過來問嘉賓,也可以關注搜狐科技的微信號留言。
近日,科大訊飛智能辦公本X3宣布正式接入DeepSeek,與其原本搭載的訊飛星火大模型組成AI大模型...
投資家網(www.51baobao.cn)是國內領先的資本與產業創新綜合服務平臺。為活躍于中國市場的VC/PE、上市公司、創業企業、地方政府等提供專業的第三方信息服務,包括行業媒體、智庫服務、會議服務及生態服務。長按右側二維碼添加"投資哥"可與小編深入交流,并可加入微信群參與官方活動,趕快行動吧。