跳轉至
科技AI

一週人工智能重點信息盤點:從世界首款AI實時生成遊戲到Meta觸覺感知機器人

目錄

過去一週人工智能和機器人領域取得了顯著進展,Etched、Runway、NVIDIA、OpenAI、Anthropic、微軟、波士頓動力、ElevenLabs、Osmo、Physical Intelligence和Meta等公司發佈了重要成果。以下是過去一週值得關注的重點信息:

1.Etched和DecartAI推出了首款完全由AI生成的、可玩性高的Minecraft遊戲——Oasis。他們構建了一個實時交互的世界模型,並開源了其架構、權重和研究成果。這意味着未來網絡上AI生成內容的比例將大幅提升
2.Runway為其AI視頻生成模型Gen-3 Alpha引入了“高級相機控制”功能,允許用户控制AI生成場景的方向和強度,這將極大提升視頻編輯的效率和創作空間
3.NVIDIA的研究人員開發了HOVER,一個僅有150萬參數的神經網絡,用於控制人形機器人。該模型在模擬環境中訓練50分鐘,相當於虛擬世界中的一年,之後可直接應用於實體機器人,這將顯著加速人形機器人的學習進程
4.OpenAI為ChatGPT推出了網頁搜索功能,使用户能夠即時訪問實時信息並附帶來源鏈接,這將提升ChatGPT回答的準確性和時效性。該系統可以自主判斷何時進行搜索,並根據當前新聞、體育和市場數據提供情境化答案
5.Anthropic的Claude 3.5模型現在可以查看PDF文件中的圖像,這意味着它可以更準確地理解圖表、文本和圖形,這對於處理大量的研究論文非常有幫助
6.OpenAI為macOS和Windows平台上的ChatGPT桌面應用程序推出了高級語音功能,此前僅限於移動端
7.波士頓動力公司展示了Atlas機器人自主搬運發動機蓋的演示,該機器人利用機器學習視覺進行物體檢測和定位,並採用專門的抓取算法和連續狀態估計來處理容器和手推車之間的物料‍
8.ElevenLabs推出了X to Voice,這是一款開源應用程序,利用其新的Voice Design API,可以根據X個人資料創建獨特的AI語音。該應用集成了Apify的個人資料數據和Hedra Labs的頭像動畫
9.Osmo演示了“氣味傳送”技術,利用AI和先進的化學技術數字化並再現了李子的氣味,這預示着未來照片和視頻可能帶有氣味
10.Meta宣佈了FAIR實驗室在機器人技術方面的研究成果,重點是機器人的觸覺感知,包括通用觸覺編碼器、帶有多模式傳感的人工指尖以及用於集成機器人手部觸覺的平台
11.Physical Intelligence展示了其新的自主演示π₀,這是一個機器人基礎模型,旨在控制機器人執行“任何任務”

最新