人工智能技術的發(fā)展使機器人具備了越來越強大的機制來理解和與世界互動。近些年學者們開始關注研究這類機制,以便機器人在長期的實際環(huán)境中理解人類并與人類互動,從而揭示了學習人類多樣性的機遇和挑戰(zhàn)。
人機交互(Human-Robot Interaction)是一個多學科的領域,旨在理解和開發(fā)支持機器人與人類共存的技術。基于人文主義價值觀,HRI的一個子集是專注于研究提高個人生活質(zhì)量的機器人;此類研究包括醫(yī)療觸覺,康復機器人和社會輔助機器人(SAR)。SAR希望通過結合工程,計算機科學和社會科學來分擔和輔助教育工作者,父母,護理者和臨床醫(yī)生的工作。該領域的研究表明,人和機器人的伙伴關系可以緩解關鍵的健康挑戰(zhàn),這些挑戰(zhàn)需要社會調(diào)解,個性化的長期支持,例如特殊教育需求,老人護理和康復。人類的學習、發(fā)展和關懷都遵循每個人獨有的非線性軌跡。HRI的個性化計算針對個人用戶不斷變化的需求呈現(xiàn)出現(xiàn)實世界中的復雜性,而機器人和ML研究團體卻在很大程度上避免了這種復雜性。
幸運的是,在大數(shù)據(jù)時代,人機交互非常豐富;人們經(jīng)常與計算模型交互,無論是隱藏在他們最喜歡的數(shù)字媒體網(wǎng)站后面,還是在家里與AI助手進行交互。二十一世紀的用戶,不管是自愿還是不知情,都會用自己的個人數(shù)據(jù)換取“免費”服務。因此,提高生活質(zhì)量的個性化機器人和虛擬代理服務在行業(yè)中正在成為現(xiàn)實-商業(yè)實例,包括基于認知行為療法的治療性聊天機器人Woebot等。但是,在利用這些數(shù)據(jù)以更好地了解人類用戶并與之交互時,仍然存在許多開放的挑戰(zhàn),包括現(xiàn)實世界數(shù)據(jù)固有的噪音,個人的廣泛需求和偏好,意外的模型偏差、隱私和安全障礙,以及在學習更多個性化或更具普遍性的HRI模型之間進行權衡。為了應對這些挑戰(zhàn),將多模式,交互式和多任務ML范例應用于實際環(huán)境并對其進行評估至關重要。
從大型仿人機器人整機構型國內(nèi)外研究現(xiàn)狀入手,圍繞機器人整機構型、關節(jié)運動特點、伺服驅(qū)動器、減速器、仿真平臺等方面進行深度講解,最后就大型仿人機器人整機構型未來發(fā)展趨勢給出自己的見解
智能機器人視覺方面的工作,主要體現(xiàn)在感知、理解、學習及推理4個方面,涉及到目標檢測、目標追蹤、人體姿態(tài)估計、人臉識別、行為識別、推理等技術
基于康復機器人內(nèi)部傳感器識別記錄訓練過程中的運動學參數(shù),能夠?qū)崟r定量評估不同的運動模式,還能夠掌握患者是否主動參與訓練等情況
「Vision+Ask」的任務包含視覺問題生成、根據(jù)問題生成查詢、圖像描述等;「Vision+Answer」的任務包含視覺問答、視覺對話等
對于聯(lián)邦學習技術,數(shù)據(jù)應用推廣的經(jīng)驗,并深入探討聯(lián)邦學習在政務,醫(yī)療,金融,廣告,物流的應用價值,以期為數(shù)據(jù)應用價值的釋放帶來解讀和參考
DeepTech通過科研數(shù)據(jù)分析、專家訪談等方式洞悉先進計算領域發(fā)展趨勢,探尋具備技術顛覆性,有商業(yè)化前景的先進計算技術,提煉出 2022 年先進計算技術及應用七大趨勢
一種基于水凝膠彈性體混合物的仿生機器皮膚.分為三層結構,中間的水凝膠層構成機器皮膚的主體,可以實現(xiàn)電信號的傳遞,實現(xiàn)靜態(tài)和動態(tài)觸覺的模態(tài)識別
服務機器人潛在危險有:電擊、與能量有關的危險、著火、與熱有關的危險、機械危險、輻射、化學危險等
視頻搜索是涉及信息檢索、自然語言處理(NLP)、機器學習、計算機視覺(CV)等多領域的綜合應用場景
驅(qū)動系統(tǒng)由4個200W無刷直流電機構成,通過50:1的空心軸減速機可以最高達2m/s的速度在玉米、高粱等農(nóng)作物的地里前進
通過2D激光雷達信息采用Hector SLAM實現(xiàn)機器人對地圖的感知和自主導航規(guī)劃,通過頂部的RGB-D相機采集目標物體深度和RGB圖像信息
機器人的學習分為三個部分的軌跡預測包括示教者的手部運動軌跡、示教者的身體移動軌跡以及被操作物體的運動軌跡
Cosero是德國波恩大學的Sven Behnke團隊根據(jù)家庭環(huán)境中的日常操作任務而研制的一款仿人操作機器人基于深度學習方法的目標姿態(tài)估計和RGB-D SLAM等感知測量
機器人、無人機、自動駕駛汽車等加快落地,智慧城市深入建設,更是為傳感器產(chǎn)業(yè)帶來了難以估量的龐大機遇
中國移動聯(lián)合產(chǎn)業(yè)合作伙伴發(fā)布《室內(nèi)定位白皮書》,對室內(nèi)定位產(chǎn)業(yè)發(fā)展現(xiàn)狀及面臨的挑戰(zhàn),深入分析了垂直行業(yè)的室內(nèi)定位需求,并詳細闡述了實現(xiàn)室內(nèi)定位的技術原理, 及室內(nèi)定位評測體系
下一個十年,智能人機交互、多模態(tài)融合、結合領域需求的 NLP 解決方案建設、知識圖譜結合落地場景等將會有突破性變化
自然語言處理技術的應用和研究領域發(fā)生了許多有意義的標志性事件,技術進展方面主要體現(xiàn)在預訓練語言模型、跨語言 NLP/無監(jiān)督機器翻譯、知識圖譜發(fā)展 + 對話技術融合、智能人機交互、平臺廠商整合AI產(chǎn)品線
NVIDIA解決方案架構師王閃閃講解了BERT模型原理及其成就,NVIDIA開發(fā)的Megatron-BERT
基于內(nèi)容圖譜結構化特征與索引更新平臺,在結構化方面打破傳統(tǒng)的數(shù)倉建模方式,以知識化、業(yè)務化、服務化為視角進行數(shù)據(jù)平臺化建設,來沉淀內(nèi)容、行為、關系圖譜,目前在優(yōu)酷搜索、票票、大麥等場景開始進行應用