您現(xiàn)在的位置:首頁 > 科技 > 正文

從理解語義到“讀心術(shù)” AI有了認(rèn)知智能萌芽

時間:2019-01-07 15:25:54    來源:科技日報    

每個人身體里都有一個“杠精”:“這可不一定”“我可不這么認(rèn)為”“那可說不準(zhǔn)”……這些“杠”詞要么在心里默念、要么在口中碎碎念、要么大聲講出來,無論是否表達,“杠”的意識出現(xiàn)均是人類獨立思維的表現(xiàn),所基于的正是人類的綜合分析能力。

如今,人工智能(AI)也開始“杠”得有條理、有邏輯、有思路起來。日前,在百分點舉辦的無界智能發(fā)布會現(xiàn)場,IBM大中華區(qū)全球信息科技服務(wù)部總經(jīng)理謝少毅介紹了人工智能做辯論的項目,“杠精”們大愛的口頭禪出現(xiàn)在了IBM的人工智能系統(tǒng) “Project Debater”口中,這背后是機器學(xué)習(xí)、自然語言處理、海量數(shù)據(jù)搜索處理、識別情緒等大量人工智能技術(shù)的應(yīng)用。

越來越多的人工智能研究者發(fā)明新的技術(shù)讓AI向人類“偷師”,一定程度上習(xí)得觸類旁通、獨立思考的能力。從“傻白甜”到“杠精”,AI向真實的“人”又貼近了一步,從“感知智能”慢慢走向“認(rèn)知智能”,哪些技術(shù)是AI不可或缺的?還有哪些仍待攻堅呢?

從理解語義到“讀心術(shù)”,認(rèn)知智能初現(xiàn)

“你告訴一個AI自己有減肥計劃,AI如果每天建議你吃沙拉,你就會說它不好,不符合心意;如果它天天讓你吃蛋糕,你也會說它不好,不符合減肥需求。”上海紐約大學(xué)商學(xué)部主任陳宇新教授舉了個連真正的人類都難以把握的兩難抉擇,充分說明理解語義并不一定能夠真正把握要義。

“雖然主人說這是我想要的,但AI做了之后,主人仍會說這不是他想要的……”擁有“認(rèn)知智能”的未來AI將充分理解這句堪比繞口令的實質(zhì),陳宇新認(rèn)為,當(dāng)數(shù)據(jù)足夠多、算法足夠強大、模型足夠優(yōu)秀之后,AI將從理解語義到擁有“讀心術(shù)”,分析推測出人類當(dāng)時可能都不確定的真正想法,在人心里矛盾時給出“撓到癢處”的答案。

將這個“減肥吃什么”的難題放大來看,就是對正反的“兩難”進行一系列諸如身體指征、愛好、時間等多維度的數(shù)據(jù)綜合分析后,用到大量的人類學(xué)、心理學(xué)、社會學(xué)的內(nèi)容和方法,通過一系列探索性地問答獲得數(shù)據(jù),給出結(jié)果。

這種探索性的分析將使AI得到進化,并擁有更廣闊的“職業(yè)”選擇。據(jù)介紹,美國有公司做出了第一個人工智能律師ROSS,美國一個律師以往用上百上千個小時做一個案例的分析和調(diào)查,現(xiàn)在用了ROSS和人一起合作,時間減少到28分鐘,ROSS,可以提供正反雙方的意見讓律師做決策。

“正反意見的博弈還可以幫高層做決策,可以通過一個機器人提供正反兩面意見的辯論,幫助高層綜合分析做更好的決策。”謝少毅認(rèn)為,這方面的研究才剛剛開始。進化的AI將被用在更多需要做信息分析或做決策的領(lǐng)域,例如高級銷售、經(jīng)濟分析師、企業(yè)高級管理人員等。

數(shù)據(jù)動態(tài)融合,AI走進認(rèn)知智能的“基石”

從海量數(shù)據(jù)中“摘出”與當(dāng)前任務(wù)關(guān)聯(lián)的數(shù)據(jù),是AI擁有綜合分析能力的第一步。百分點董事長兼CEO蘇萌表示,AI走進認(rèn)知智能首先建立在數(shù)據(jù)融合的基礎(chǔ)上。

以辯論項目為例,沃森化身的這位“女性”辯手,和另一位人類辯手就“是否應(yīng)該把體育博彩合法化”的議題展開辯論時,能在聽懂人類長達4分鐘的快速陳述(700—900個單詞)后,進行迅速反應(yīng),搜集資料、選取角度,給出旁征博引的辯駁;在短兵相接的短辯交鋒中也能很快理解對方的觀點、組織語句并做出有針對性的論述。

蘇萌表示,數(shù)據(jù)目前來看仍然是人工智能的基石。不久前,德國商業(yè)軟件巨頭SAP以80億美元收購全球最大在線調(diào)查公司Qualtrics,說明了數(shù)據(jù)融合的重要性。2017年,百分點也并購了中國最大的在線調(diào)研服務(wù)商極速洞察,使得百分點同時擁有高達380萬的中國最大用戶樣本庫,將雙方的行為數(shù)據(jù)和態(tài)度數(shù)據(jù)進行融合。

數(shù)據(jù)融合包括擁有海量數(shù)據(jù)和實現(xiàn)高效融合兩方面。

蘇萌表示,數(shù)據(jù)融合指的是打破業(yè)務(wù)系統(tǒng)的煙囪融合海量的多元異構(gòu)的數(shù)據(jù),它既是一次企業(yè)內(nèi)外部數(shù)據(jù)的融合,也是大小數(shù)據(jù)的融合,同時也是歷史數(shù)據(jù)和實時數(shù)據(jù)的融合,只有數(shù)據(jù)融合了之后,才能洞見真相避免偏見,才能明智決策避免武斷。

“知識圖譜是我們讓機器去了解、認(rèn)識人類世界的核心,它把我們的知識構(gòu)建成網(wǎng)狀的知識結(jié)構(gòu),再通過人機交互直接輸出。”蘇萌進一步解釋,數(shù)據(jù)融合意味著知識需要不斷更新,但在更新一個知識點的時候往往需要更新整個知識系統(tǒng),操作非常繁瑣。

“出版行業(yè)或者媒體,甚至公安行業(yè),所涉及的知識都需要實時動態(tài)理解,某一個知識不是固定不變的,所以知識圖譜未來的發(fā)展方向是動態(tài)知識圖譜。” 蘇萌解釋,這個世界由很多的東西構(gòu)成,比如人、事、地,這些可以理解為本體,本體發(fā)生變化或者本體間的關(guān)系發(fā)生變化后,動態(tài)知識圖譜能夠迅速自動重構(gòu),高效地實現(xiàn)對一個行業(yè)的知識圖譜的構(gòu)建。

攻堅在路上,來自小數(shù)據(jù)的挑戰(zhàn)

新的領(lǐng)域、沒有海量樣本、訓(xùn)練速度不夠,是不是每遇到一個特殊場景,都要重新建模,輸入大量的樣本讓機器重新學(xué)習(xí)一次呢?條件并不允許。

“很多客戶的實際應(yīng)用場景是數(shù)據(jù)量不夠甚至是比較少的,在這種情況下我們結(jié)合遷移學(xué)習(xí)技術(shù),解決了小樣本的模型訓(xùn)練問題,標(biāo)注量只有以往的10%。”百分點首席算法科學(xué)家蘇海波說。

從小數(shù)據(jù)中獲得學(xué)習(xí)能力,也是人工智能走向認(rèn)知智能的一個重要部分。人工智能專家經(jīng)常用貓舉例:小孩子認(rèn)得貓只要指給他看一兩次就夠了,AI卻需要成百上千張圖片,才能掌握貓的特征。

為此,人工智能科學(xué)家嘗試結(jié)合遷移學(xué)習(xí)開發(fā)一系列算法,節(jié)約人工標(biāo)注樣本的時間,讓模型在少量的標(biāo)注數(shù)據(jù)上,也能取得好的效果,可以理解為賦予AI“舉一反三”的能力。“例如像電商評論情感分類這樣一個任務(wù),用傳統(tǒng)的深度學(xué)習(xí)模型需要數(shù)萬條數(shù)據(jù)才能達到85%左右的效果,但是如果采用深度遷移學(xué)習(xí)技術(shù),數(shù)百條數(shù)據(jù)就能達到同樣的效果。”蘇海波說,我們判斷認(rèn)知智能未來會迎來黃金十年的發(fā)展,為此百分點成立了認(rèn)知智能實驗室。除了深度遷移學(xué)習(xí)技術(shù),實驗室還會重點研發(fā)多語種自然語言處理技術(shù),幫助認(rèn)知智能實現(xiàn)跨種族、國際化。

“未來我們會與各大高校和研究機構(gòu)開展合作,建立聯(lián)合實驗室,共同探索更多前沿的認(rèn)知智能技術(shù),包括各個重點行業(yè)的知識圖譜構(gòu)建、自動問答等等?;谶@些技術(shù),實驗室會研發(fā)出更多行業(yè)落地的應(yīng)用產(chǎn)品,為客戶創(chuàng)造價值,用認(rèn)知智能推動社會進步。”蘇海波說。(張佳星)

關(guān)鍵詞:

相關(guān)新聞

凡本網(wǎng)注明“XXX(非中國微山網(wǎng))提供”的作品,均轉(zhuǎn)載自其它媒體,轉(zhuǎn)載目的在于傳遞更多信息,并不代表本網(wǎng)贊同其觀點和其真實性負(fù)責(zé)。

特別關(guān)注