伦理小说txt 从翰墨到轨迹:麻省理工学院的AI用话语匡助机器东说念主完成复杂的导航任务

指挥学生

  • 首页
  • 插插综合
  • 第四播播
  • 强奸乱伦小说
  • 9999adc
  • 淫荡的妈妈
  • 你的位置:指挥学生 > 强奸乱伦小说 > 伦理小说txt 从翰墨到轨迹:麻省理工学院的AI用话语匡助机器东说念主完成复杂的导航任务
    伦理小说txt 从翰墨到轨迹:麻省理工学院的AI用话语匡助机器东说念主完成复杂的导航任务
    发布日期:2024-08-20 04:07    点击次数:119

    伦理小说txt 从翰墨到轨迹:麻省理工学院的AI用话语匡助机器东说念主完成复杂的导航任务

    Robot-Maid-Household-Cleaning-Vacuum_webp(WEBP 图像伦理小说txt,2000x1333 像素) — 缩放 (69-.jpg

    也许有一天,您会但愿家用机器东说念主把脏一稔搬到楼下,然后放进地下室最左侧边缘的洗衣机里。机器东说念主需要迷惑您的疏通和它的视觉不雅察来细目完成这项任务的门径。

    关于东说念主工智能代理来说,这提及来容易作念起来难。当今的方法无为诓骗多个手工制作的机器学习模子来处理任务的不同部分,这需要多量的东说念主力和专科学问来构建。这些方法诓骗视觉表征径直作念出导航有野心,需要多量的视觉数据进行西宾,而这些数据常常很难获取。

    为了克服这些挑战,麻省理工学院和麻省理工学院-IBM 沃森东说念主工智能现实室的盘问东说念主员瞎想了一种导航方法,将视觉表征调换为话语片断,然后将其输入一个大型话语模子,从而终了多门径导航任务的整个部分。

    他们的方法不是将机器东说念主周围环境图像中的视觉特征编码为视觉示意(这需要多量谈判),而是创建描写机器东说念主不雅点的翰墨讲明。一个大型话语模子诓骗这些翰墨讲明来展望机器东说念主为完成用户的话语领导而应采用的举止。

    由于他们的方法隧说念诓骗基于话语的表征,因此不错使用大型话语模子高效生成多量合成西宾数据。

    天然这种方法并莫得卓越使用视觉特征的本事,但在空匮实足视觉数据进行西宾的情况下,它的施展却很出色。盘问东说念主员发现,将基于话语的输入与视觉信号相迷惑不错普及导航性能。

    "通过隧说念使用话语手脚感知表征,咱们的方法更为径直。因为整个的输入皆不错编码成话语,是以咱们不错生成东说念主类不错领略的轨迹,"电子工程与谈判机科学(EECS)盘问生、关连这种方法的论文的第一作家潘博文(Bowen Pan)说。

    2-Figure1-1.png

    潘的合著者包括他的守护人、麻省理工学院苏世民谈判机学院策略行业参与主任、麻省理工学院MIT-IBM沃森东说念主工智能现实室主任、谈判机科学与东说念主工智能现实室(CSAIL)高级盘问科学家奥德-奥利瓦(Aude Oliva);电子工程科学副教授、CSAIL成员菲利普-伊索拉(Philip Isola);资深作家、电子工程科学助理教授、CSAIL成员金允(Yoon Kim);以及麻省理工学院MIT-IBM沃森东说念主工智能现实室和达特茅斯学院的其他东说念主员。这项盘问将在谈判话语学协会北好意思分会会议上发表伦理小说txt。

    用话语处分视觉问题

    小萝莉渔网袜自慰流水

    潘说,由于大型话语模子是当今最纷乱的机器学习模子,因此盘问东说念主员试图将它们融入称为视觉话语导航的复杂任务中。但是,这类模子遴荐文本输入,无法处理来自机器东说念主录像头的视觉数据。因此,团队需要找到一种使用话语的方法。

    他们的本事诓骗一个通俗的字幕模子来获取机器东说念主视觉不雅察的翰墨描写。这些翰墨讲明与基于话语的领导相迷惑,并输入一个大型话语模子,由该模子决定机器东说念主下一步应采用的导航门径。

    谎话语模子会输出机器东说念主在完成该门径后应该看到的场景讲明。这将用于更新历史轨迹,以便机器东说念主大要跟踪到我方也曾到达过的地点。

    为了简化这还是由,盘问东说念主员瞎想了模板,以便将不雅察信息以要领的神态呈现给模子--即机器东说念主不错左证周围环境作念出的一系列取舍。

    举例,标题不错是"在你左侧 30 度的地点有一扇门,门边有一盆植物,在你的后头有一间小办公室,内部有一张桌子和一台电脑"等等。由模子来取舍机器东说念主应该向门照旧向办公室移动。

    潘说:"最大的挑战之一是,若缘何适合的情势将这类信息编码成话语,让代理了罢职务是什么,以及他们应该怎样复兴。"

    话语的上风

    在对这种方法进行测试时,他们发现这种方法天然无法卓越基于视觉的本事,但却具有一些上风。

    最初,与复杂的图像数据比较,文本合成所需的谈判资源更少,因此他们的方法可用于快速生成合成西宾数据。在一次测试中,他们左证 10 个果真宇宙的视觉轨迹生成了 10000 个合成轨迹。

    该本事还能弥补在模拟环境中西宾出来的代理在果真宇宙中施展欠安的劣势。这种差距频繁出现,因为谈判机生成的图像会因光照或神采等身分而与果真宇宙的场景大相径庭。但潘说,描写合成图像与果真图像的话语就很难诀别了。

    此外,他们的模子所使用的表述情势也更容易被东说念主类领略,因为它们是用天然话语编写的。

    "若是代理未能达到方针,咱们不错更容易地细目它在那里失败以及失败的原因。也许历史信息不够显著,或者不雅察效果忽略了一些紧迫细节,"潘说。

    此外,他们的方法不错更容易地应用于不同的任务和环境,因为它只使用一种类型的输入。只好数据不错编码成话语,他们就不错使用不异的模子,而无需作念任何修改。但纰谬之一是,他们的方法天然会丢失一些基于视觉的模子所能捕捉到的信息,如深度信息。

    但是,盘问东说念主员诧异地发现,将基于话语的表征与基于视觉的方法相迷惑,不错普及代理的导航能力。他说:"也许这意味着话语不错捕捉到一些纯视觉特征无法捕捉到的更高等次的信息。"

    这是盘问东说念主员但愿络续探索的一个限制。他们还但愿开荒一种以导航为导向的字幕机,以普及该方法的性能。此外,他们还念念探究大型话语模子施展出空间意志的能力,望望这将怎样匡助基于话语的导航。

    编译自/ScitechDaily

    arXiv:2310.07889伦理小说txt



    上一篇:【KRMV-339】もしも…時間を自由自在に行ったり来たりできるタイムマシーンがあったら? 安卓大屏X2/X2pro导航钢化膜10寸飞哥大屏ES1/ES2导航膜适用于丰田卡罗拉本田CRV飞度9寸中控屏幕膜GT1涌现屏-Taobao Singapore
    下一篇:【DVDPS-930】女子校生限定!中出しアリの!腰フリダンス甲痴園! VOL.2 西藏拉日铁路通车十周年记:再远的路也变近了