您的位置:首頁 > 資訊 > AGV資訊 > 正文

微軟鄧力:深度強化學習在聊天機器人領域的應用

2016-08-09 08:50 性質:轉載 作者:CSDN大數(shù)據(jù) 來源:CSDN大數(shù)據(jù)
免責聲明:中叉網(wǎng)(www.zulingongsi.com.cn)尊重合法版權,反對侵權盜版。(凡是我網(wǎng)所轉載之文章,文中所有文字內容和圖片視頻之知識產權均系原作者和機構所有。文章內容觀點,與本網(wǎng)無關。如有需要刪除,敬請來電商榷?。?/div>
微軟人工智能首席科學家鄧力在此前接受CSDN的采訪時曾表示深度強化學習是A.I.Bots的關鍵技術,在這篇發(fā)表于venturebeat的文章中,他詳...

  微軟人工智能首席科學家鄧力在此前接受CSDN的采訪時曾表示深度強化學習是A.I.Bots的關鍵技術,在這篇發(fā)表于venturebeat的文章中,他詳細解析了為什么需要A.I.Bots,A.I.Bots的實現(xiàn),以及深度強化學習如何發(fā)揮作用。
  在今年3月份,微軟CEOSatyaNadella談到了關于更普遍地使用人類語言與計算機設備交互的未來產業(yè)趨勢,他稱之為“對話即平臺(Conversationasa Platform)”。
  同時,他還宣布了幾項Bot項目,其中包括微軟Bot架構(botframework);四月份,F(xiàn)acebook發(fā)布了基于Bots的聊天機器人平臺MessengerPlatform;五月份,Google宣布嘗試開發(fā)AI驅動的Bots,并命名為GoogleAssistant。至此,Bots已被廣泛地視為一種新的用戶界面(UI),將從根本上改變人機交互的體驗。
  Apps和Web模型存在的問題?
  Apps平臺是由Apple公司多年前為智能手機開發(fā)的,隨后,Google推出了GooglePlayStore。應用平臺是基于一個統(tǒng)一的資源模型(模型中規(guī)定了手機滿足需求時所需的內存和處理速度),但缺點是大量的應用程序充斥著用戶的手機屏幕,盡管他們常使用的APPS不超過20個左右。
  事實上,常用到的智能手機應用的總數(shù)目實際正在下降??偟膩碚f,盡管數(shù)以百萬計的應用已被開發(fā)上架,但其中的大多數(shù)是從未被使用的。這無疑會導致設備資源和用戶時間(用于下載、安裝和管理Apps)大量的浪費。
  Web模型在移動界面上表現(xiàn)更為糟糕。通過移動設備訪問web服務的使用量較低。這種較低的使用率源于一個事實:很多流行網(wǎng)站的設計和優(yōu)化是為了迎合非移動的PCs端,而PCs端通常都是典型的寬帶接入方式。
  智能手機有限的帶寬和計算資源是許多Web服務的嚴重障礙。然而,大多數(shù)網(wǎng)站遵循傳統(tǒng)地以頁面為中心的信息配置范式,導致(非移動端)瀏覽器暗中模仿閱讀器,這對移動設備而言是次優(yōu)的。
  結果:我們需要從頭開始重設設計手機用戶界面,以便于實現(xiàn)移動時代的全部潛力。
  對話成為新興的移動用戶界面范式
  幸運的是,在重新設計和部署中,一種新興的范式十分適合移動終端。這種新的對話(即平臺范式)使得移動用戶能夠發(fā)現(xiàn)、訪問、交互日常生活中息息相關的信息與服務,從而使得有用的信息和服務能夠自然地整合到對話流中(conversationstreams)。
  這一對話UI范式將導致一個新的生態(tài)形成,新生的生態(tài)要比之前的Web和Apps的生態(tài)系統(tǒng)具有更大的規(guī)模優(yōu)勢。這之所以成為可能,是因為信息產業(yè)正在進入物理世界數(shù)字化以及連接這些鏈接到物理服務的新時代。這一物理的、交互的、以服務為中心的世界遠超之前靜態(tài)網(wǎng)絡信息配置時代。
  消息(Messaging)是該新的對話范式的核心,包括一系列的短文本、音頻和視頻信息。由于兼具異步和近實時兩種特性,消息變成了一個加速器,驅動著數(shù)字對話的成長。用戶無需再額外花費進行交互預先計劃的時間成本,且仍保留近實時對話的能力。
  Bots作為智能對話接口代理
  在對話交互中,相比于以對話為中心的移動UI范式,更為重要的是所提供的各類型智能服務。我們既有像siri、GoogleNow、Cortana和Alexa這類的智能個人助理,又有可通過自動對話接口獲取獲取的個體Bot。
  新興對話范式的最終模式:用戶無需再下載Apps,AIBots利用語音和自然語言處理能力監(jiān)控并相應消息UI,自動地將必要的服務資源(可能存在云端)提供給用戶。
  由于最近機器學習和AI技術的巨大進步,AIbots的實現(xiàn)成為可能。這些進步使得我們能夠將越來越多所關心的事物自動化。過去幾年內深度學習的發(fā)展,尤其是過去一年半發(fā)展起來的深度強化學習(Deepreinforcementlearning,RL),高效地利用了不斷增長的數(shù)據(jù)和計算資源,促進了我們?yōu)槭澜绛h(huán)境和與我們生活相關的應用領域構建計算模型的能力。
  在機器學習中,RL具有鮮明的特點。你需要從用戶處得到反饋,也必須給予用戶獎勵。就像在玩一盤暫時不知道最終獎品的國際象棋比賽。你知道與人工智能的交互會導致任務完成的結果。例如,你知道最終的目的是預定航班,但是Bot僅會說那些對于完成目標有幫助的事情,即使用戶可能無法理解bot正在努力追求的最終目標和獎勵。
  這些進步使得自動語音和自然語言理解變得觸手可及,最終使得我們能夠解決對話理解和很多領域的對話問題?;谏疃葟娀瘜W習的A.I.Bots能夠理解所有領域的語義,還能夠擴展到今日尚無法涉足的領域。
  A.I.Bots將采用迭代和反饋回路進行自我發(fā)展,并逐步趨近于完美。內置在A.I.Bots的RL組件中的環(huán)境模式能夠自動且精致地檢測、獲取、創(chuàng)造并積累新知識,使得我們可以開發(fā)更多的智能服務、積累更多的經(jīng)驗,尤其是預定、付款等行為導向型服務。
  A.I.Bots的三種類型
  一般來說,存在三種類型的A.I.Bots。第一類是搜索信息,因此它的目標是明確的;第二類同樣是搜索信息,但目標不是立即明確的。例如你可能問的是一個電影院的開放時間,這不是說你的目的只局限于答案,而是獲得答案是達到看電影這個最終目標的一個步驟。對于第一種類型,獎勵是明確定義的;對于第二種類型,獎勵同樣也是相當明確的(或者將會明確定義)。
  當使用強大的深度強化學習技術進行構建時,以上兩種Bots都有自己的、定義較為直接的獎勵函數(shù)(強化學習的關鍵組件)。這兩類Bots均可用于完成搜索信息或者完成預定機票、酒店等特定任務。
  第三類A.I.Bot是社交Bot,它們需要的指導最多,通常也被稱為聊天Bot或閑聊Bot。該類Bot的獎賞函數(shù)(用于深度強化學習算法)–簡單地稱為“情感智能”–不能被輕易地量化。例如,可以向其進行要求咨詢,或者是詢問一些今天做什么之類的含糊問題。
  處理社交Bot十分復雜的獎勵函數(shù)需要擴展能力,為了給該擴展能力提供數(shù)學基礎,學術界以及從業(yè)者都需要深入調查。這里的目標是將常用的RL算法(例如用于AlphaGo的關鍵學習方法)擴展成更好的算法,以便利用信息理論上的和內在動機的獎勵。
  在轉向其他類試圖完成任務的Bot對話之前,這類獎勵會抓取用戶在與Bot對話中獲取的情感滿意度。對于計算機科學家和電氣工程師而言,這是一片十分有前景的人工智能研究領域。

網(wǎng)友評論
文明上網(wǎng),理性發(fā)言,拒絕廣告

相關資訊

  • AiTEN丨西班牙冷庫行業(yè)新突破
    近日,西班牙某冷庫通過引入AiTEN海豚之星AE1516及調度系統(tǒng),成功實現(xiàn)了從傳統(tǒng)到智能的華麗轉身。項目背景1.倉庫中限位塊不可拆卸,對自動化設備對接構成挑戰(zhàn),...

    2024-12-29 08:45

  • 卓一智能叉車在CeMAT ASIA (2024)展示物流領域的先鋒力量
    2024年11月5-8日,全球矚目的亞洲國際物流技術與運輸系統(tǒng)展覽會(CeMAT ASIA 2024)如期在上海舉辦。作為智能倉儲和物流領域的標桿性展會,吸引了來自全球的行...

    2024-11-16 10:25

  • 鐳神智能激光雷達全場景系統(tǒng)解決方案賦能低空經(jīng)濟新時代
    隨著科技的飛速發(fā)展,低空經(jīng)濟已成為全球經(jīng)濟增長的新引擎。從無人機導航與避障、低空空域管理,到無人機測繪、物流與配送,再到低空安防與監(jiān)測、災害應急與救援...

    2024-11-16 10:23

  • 飲料巨頭多次復購,只為這款智能倉
    1996年,一家從事飲用水生產與銷售的企業(yè)在杭州成立,經(jīng)多年發(fā)展,該企業(yè)在茶飲料、功能飲料及果汁飲料的市場份額均實現(xiàn)國內領跑。在撫松、河源項目中,企業(yè)為實...

    2024-11-02 08:58

  • 算法進階 | 深度學習驅動低速無人駕駛紅綠燈識別算法
    紅綠燈的識別是無人駕駛車輛安全行駛的關鍵技術之一,它涉及到在視覺圖像中定位信號燈的位置和判斷其顏色狀態(tài)。傳統(tǒng)的信號燈檢測方法依賴于顏色和形狀等基礎特征...

    2024-09-01 08:07

  • AMR,倉庫工人的新朋友
    (作者Ron May是美國盧卡斯系統(tǒng)公司(Lucas Systems)的創(chuàng)始成員和高級解決方案顧問,該公司是為倉庫經(jīng)理和現(xiàn)場工人提供智能軟件的供應商。)如果有機器人相伴,...

    2022-09-13 10:13

  • 再獲殊榮!邁睿潛伏系列AMR榮獲OFweek 年度獎
    近日,邁睿機器人潛伏系列AMR,在由高科技行業(yè)門戶OFweek維科網(wǎng)主辦的2021年“中國工業(yè)自動化及數(shù)字化行業(yè)”年度評選中,榮獲“年度優(yōu)秀產品獎”!OFweek 是什...

    2021-10-12 10:11

  • 科鈦新款RPL極速物流搬運機器人來襲
    AGV誕生的一個主要目的就是為了能夠安全高效的完成一些重復性的工作。更安全,更高效一直是機器人不斷升級換代的一個目標,這也是我們科鈦的目標。經(jīng)過多年的研...

    2021-08-28 10:40

  • 行穩(wěn)致遠 進而有為|宇鋒智能助力紡織行業(yè)智能化升級
    紡織行業(yè)屬于勞動密集型企業(yè),印染布轉運勞動強度大,人工成本及庫存成本高,加快自動化、信息化和智能化生產體系的建設,勢在必行。某紡織生產企業(yè)引入宇鋒智能...

    2021-08-28 10:33

  • 工博會延期,勱微與您相約12月1日-5日
    關心勱微及工博會的朋友們:大家好!接工博會主辦方正式通知,原定于2021年9月14日-18日在國家會展中心(上海)舉辦的第23屆中國國際工業(yè)博覽會將延期至2021年12...

    2021-08-28 08:54