热久久免费精品视频,午夜激情福利,国产精品午夜免费福利视频,99热在线精品免费播放6,免费无码一级成年片,超碰在线播放黄片,亚洲视频欧洲视频日本视频

?
當前位置:首頁 >熱點 >Ai2發(fā)布開源AI模型,讓機器人在3D空間″規(guī)劃″動作

Ai2發(fā)布開源AI模型,讓機器人在3D空間″規(guī)劃″動作

2025-12-01 03:28:33 [焦點] 來源:素昧平生網(wǎng)

  

  西雅圖人工智能研究機構Ai2(艾倫人工智能研究所)今日宣布發(fā)布MolmoAct 7B,這是開源D空一個突破性的開源具身AI模型,通過讓機器人在執(zhí)行動作前進行"思考",模型為機器人技術帶來了智能。讓機

  空間推理對AI模型來說并不新鮮,器人這些模型能夠通過可視化圖像或視頻來推理世界,間″然后得出結論。規(guī)劃例如,″動用戶可以上傳圖像或視頻到OpenAI的發(fā)布ChatGPT,詢問如何組裝桌子的開源D空問題并得到答案。同樣,模型機器人AI基礎模型可以被指示拿起杯子并放到水槽里。讓機

  "具身AI需要一個優(yōu)先考慮推理、器人透明性和開放性的間″新基礎,"首席執(zhí)行官Ali Farhadi表示。規(guī)劃"通過MolmoAct,我們不僅僅是發(fā)布一個模型;我們正在為AI的新時代奠定基礎,將強大AI模型的智能帶入物理世界。"

  大多數(shù)機器人AI模型通過推理提供給它們的語言來運行,分解自然語言句子——比如上面的例子"拿起柜臺上的杯子放到水槽里"——并將其轉化為動作。它們通過結合從攝像頭和其他傳感器獲得的知識以及命令來做到這一點。

  Ai2表示,MolmoAct是該公司稱為動作推理模型(ARM)的新類別AI模型中的首個,它解釋高級自然語言,然后推理出一系列物理動作計劃,以在現(xiàn)實世界中執(zhí)行這些動作。與市場上當前作為視覺語言動作基礎模型運行的機器人模型不同,ARM將指令分解為一系列航點和動作,這些航點和動作考慮了模型能夠看到的內容。

  "一旦它看到世界,它就會將整個世界提升到3D中,然后繪制軌跡來定義其手臂將如何在該空間中移動,"Ai2計算機視覺團隊負責人Ranjay Krishna在接受采訪時表示。"所以,它為未來做規(guī)劃。在完成規(guī)劃后,它才開始采取行動并移動關節(jié)。"

  ARM和VLA模型都充當機器人的"大腦",包括AI模型機器人初創(chuàng)公司Physical Intelligence的pi-zero、英偉達公司用于人形機器人的GR00T N1、學術研究人員實驗常用的70億參數(shù)開源模型OpenVLA,以及930億參數(shù)的Octo模型。參數(shù)指的是模型用來做決策和預測的內部變量數(shù)量。MolmoAct包含70億個參數(shù),因此名稱中有7B。

  該公司使用256個英偉達H100圖形處理單元集群上的1800萬個樣本來訓練模型,預訓練大約在一天內完成。微調使用64個H100大約需要2小時。相比之下,英偉達的GR00T-N2-2B使用1024個H100在6億個樣本上進行訓練,而Physical Intelligence使用9億個樣本和未披露數(shù)量的芯片訓練pi-zero。

  "很多這些公司給你這些技術報告,但這些技術報告看起來是這樣的:它們中間有一個大黑盒,上面寫著'Transformer',對吧?除此之外,你真的不知道發(fā)生了什么,"Krishna說。

  與市場上許多當前模型不同,MolmoAct 7B是在大約12000個來自真實環(huán)境(如廚房和臥室)的"機器人事件"精選開放數(shù)據(jù)集上訓練的。這些演示用于映射目標導向的動作——比如整理枕頭和收拾洗衣。

  Krishna解釋說,MolmoAct通過完全開放克服了這個行業(yè)透明度挑戰(zhàn),提供其代碼、權重和評估,從而解決了"黑盒問題"。它既在開放數(shù)據(jù)上訓練,其內部工作原理也是透明和公開可用的。

  為了增加更多控制,用戶可以在執(zhí)行前預覽模型的計劃動作,其預期運動軌跡疊加在攝像頭圖像上。這些計劃可以使用自然語言或在觸摸屏上繪制修正來修改。

  這為開發(fā)人員或機器人技術人員在家庭、醫(yī)院和倉庫等不同環(huán)境中控制機器人提供了細粒度方法。

  Ai2表示,該公司使用SimPLER評估了MolmoAct的預訓練能力,這是一個使用一組模擬測試環(huán)境來測試常見真實世界機器人設置的基準。使用該基準,該模型實現(xiàn)了72.1%的最先進任務成功率,擊敗了來自Physical Intelligence、谷歌、微軟和英偉達的模型。

  "MolmoAct是我們進入這個領域的第一次嘗試,表明推理模型是訓練這些大規(guī)模機器人基礎模型的正確方式,"Krishna說。"我們的使命是實現(xiàn)真實世界的應用,所以任何人都可以下載我們的模型,然后為他們的任何目的進行微調,或者嘗試開箱即用。"

  Q&A

  Q1:MolmoAct 7B是什么?它有什么特別之處?

  A:MolmoAct 7B是由Ai2發(fā)布的突破性開源具身AI模型,屬于動作推理模型(ARM)新類別。它的特別之處在于能夠解釋高級自然語言,然后推理出物理動作計劃,在執(zhí)行前先進行"思考"和3D空間規(guī)劃,而不是直接執(zhí)行動作。

  Q2:MolmoAct與其他機器人AI模型有什么區(qū)別?

  A:與傳統(tǒng)的視覺語言動作模型不同,MolmoAct會將整個世界提升到3D空間,繪制軌跡定義手臂移動路徑,為未來做規(guī)劃后才開始行動。它還完全開源,提供代碼、權重和評估,解決了行業(yè)中的"黑盒問題",用戶還可以預覽和修改機器人的計劃動作。

  Q3:MolmoAct的訓練數(shù)據(jù)和性能如何?

  A:該模型使用約12000個來自真實環(huán)境的"機器人事件"數(shù)據(jù)集訓練,在256個英偉達H100 GPU上用1800萬樣本預訓練約一天完成。在SimPLER基準測試中,它實現(xiàn)了72.1%的任務成功率,超越了Physical Intelligence、谷歌、微軟和英偉達的模型。

特別聲明:以上文章內容僅代表作者本人觀點,不代表新浪網(wǎng)觀點或立場。如有關于作品內容、版權或其它問題請于作品發(fā)表后的30日內與新浪網(wǎng)聯(lián)系。

(責任編輯:焦點)

    推薦文章
    • 佩斯科夫:俄方目前只同美國就烏克蘭問題進行談判

      佩斯科夫:俄方目前只同美國就烏克蘭問題進行談判△俄羅斯總統(tǒng)新聞秘書佩斯科夫資料圖)當?shù)貢r間28日,俄羅斯總統(tǒng)新聞秘書佩斯科夫表示,目前俄方只同美國就烏克蘭問題進行談判。美國和烏克蘭23日在瑞士日內瓦舉行會談,將美方就結束烏克蘭危機所提28點新計劃 ...[詳細]
    • 歷任臺灣地區(qū)領導人誰最貪?粉專網(wǎng)絡投票結果出爐,“青鳥”炸鍋

      歷任臺灣地區(qū)領導人誰最貪?粉專網(wǎng)絡投票結果出爐,“青鳥”炸鍋粉?!安欢Y貌鄉(xiāng)民”對于歷任臺灣地區(qū)領導人的意見提出了四問,結果賴清德負評最多、甚至認為賴比前臺灣地區(qū)領導人陳水扁、蔡英文都貪。據(jù)臺媒報道,普發(fā)現(xiàn)金1萬新臺幣,下同)陸續(xù)入帳,符合條件的民眾也可以到指定 ...[詳細]
    • 反其道而行?“黑天鵝之王”現(xiàn)在在賣科技巨頭CDS

      反其道而行?“黑天鵝之王”現(xiàn)在在賣科技巨頭CDS注:紅線為甲骨文CDS,綠線為谷歌,藍線為亞馬遜,橙線為微軟“黑天鵝之王”反其道而行值得一提的是,這是Saba首次為部分公司出售對沖保護,也是銀行首次向該對沖基金提出此類交易需求。而在當前整個市場尋求 ...[詳細]
    • 高盛預測2026年底金價將升至4900美元

      高盛預測2026年底金價將升至4900美元高盛還提到,各國央行可能在今年11月購買大量黃金,這一趨勢已持續(xù)多年,旨在通過儲備多元化來對沖地緣政治和金融風險。18日,國際期貨黃金報4037美元/盎司。受多重因素影響,金價今年以來已上漲55%。完 ...[詳細]
    • 新規(guī)來了!銀行取錢不再一刀切式詢問

      新規(guī)來了!銀行取錢不再一刀切式詢問很多人生活中可能都遇到這樣的問題:去銀行取錢,總是被問及錢款用途、資金來源等問題。關于儲戶取現(xiàn)是否應該被詢問,反洗錢新規(guī)給出了更合理的解釋。11月28日,中國人民銀行、國家金融監(jiān)督管理總局、中國證監(jiān)會 ...[詳細]
    • 日本輿論擔心高市涉臺錯誤言論致經(jīng)濟負增長

      日本輿論擔心高市涉臺錯誤言論致經(jīng)濟負增長綜述丨日本輿論擔心高市涉臺錯誤言論致經(jīng)濟負增長日本首相高市早苗近日在國會答辯中就日本安保法中的“存亡危機事態(tài)”悍然發(fā)表涉臺挑釁言論。日本媒體和專家擔憂日中關系惡化,進一步?jīng)_擊本已面臨下行壓力的日本經(jīng)濟 ...[詳細]
    • 字節(jié)成立中國交易與廣告部門,抖音生服技術負責人王奉坤負責

      字節(jié)成立中國交易與廣告部門,抖音生服技術負責人王奉坤負責新浪科技訊 11月18日下午消息,據(jù)媒體報道,字節(jié)跳動近日把商業(yè)化、電商和生活服務的技術團隊進行整合,成立了中國交易與廣告部門,由抖音生服技術負責人王奉坤負責。相關報道稱,王奉坤是字節(jié)早期員工,他20 ...[詳細]
    • 違法!為了在飛機上免費上網(wǎng),留學生竟試圖侵入航司網(wǎng)絡服務器

      違法!為了在飛機上免費上網(wǎng),留學生竟試圖侵入航司網(wǎng)絡服務器為免費上網(wǎng),留學生竟在飛行途中嘗試侵入航司機上無線網(wǎng)絡后臺服務器。近日,上海機場公安對違法人員給予治安處罰。10月29日,一家負責某航司網(wǎng)絡運營維護的網(wǎng)絡科技服務公司通過系統(tǒng)監(jiān)測發(fā)現(xiàn),當日飛行中的墨爾 ...[詳細]
    • 棋迷互動媒體聚焦烏江寨 四隊參賽圍甲盛典激情點燃

      棋迷互動媒體聚焦烏江寨 四隊參賽圍甲盛典激情點燃羅洗河九段向播州區(qū)副區(qū)長孫縣章贈送棋手簽字棋盤棋聚烏江,弈彩紛呈,大腕云集,群賢畢至。隨著黔魯深閩四支圍甲戰(zhàn)隊16名職業(yè)棋手的亮相,11月28日晚的全國圍棋甲級聯(lián)賽“遵義播州·烏江寨專場”歡迎儀式星光 ...[詳細]
    • 日媒給高市早苗指了一條明路

      日媒給高市早苗指了一條明路來源:參考消息日本首相高市早苗明確表示,包括《國家安全保障戰(zhàn)略》在內的“安保三文件”將在2026年內完成修訂。自民黨將開始討論相關議題,力爭在明年春天提交建議。政府計劃將這些建議反映在修訂后的“安保三 ...[詳細]
    熱點閱讀