英国为低排量汽车竞赛投入1500万英镑 ACT Expo 2014第1天:鲍勃·鲁兹(Bob Lutz)告诉我们骑摩托车 加拿大的二氧化碳排放量:观点 Tesla + Orange为法国的S型车主提供无线连接 Tesla Gigafactory前往内华达州(非官方泄漏) 6项清洁技术促进剂将在国际范围内推出 特斯拉的首席设计师:到2020年,我们每年将制造和销售EV达500,000 插电式汽车与公用事业通过新的合作伙伴关系通过云进行通信 最容易和最艰难的城市找到上班的公车 警告火灾危险的锂离子电池在斯坦福大学发展 丰田RAV4 EV获得新的租赁激励措施以提高销量 酷转-宝贝,品牌塑造! 亚特兰大的新自行车网络初具规模 第一台梅赛德斯B级电动驱动器现已下线生产—美国仅推出一个月 减少温室气体排放可以帮助美国经济 能源效率新闻自助餐 她飞起来了!太阳脉冲2 #FIRSTFLIGHT(VIDEO) 新的车辆导航工具可以将电动汽车的能源消耗减少多达51% 经实践证明:碳排放权交易节省了十倍的健康福利成本 甜蜜的电动滑板车拥有便携式电池,宝马i3的销量猛增…(EV新闻) 控制世界的最后机会 Car2Go的新区域通行计划意味着在美国和加拿大境内旅行对会员来说非常容易 在房车露营地为电动汽车充电—外观财务 在首次飞行(VIDEO)之前测试太阳脉冲2 Borrego正在圣地亚哥国际机场安装太阳能 如何通过4个简单的步骤将碳污染减少80% 第二届年度Westport电动汽车拉力赛将于5月4日在康涅狄格州举行 在南加州拍摄的特斯拉Model X原型 汽笛酿造—经典汽车与绿色能源的结合 日产推出e-NV200 —电动紧凑型商用车加入日产的全球阵容 埃隆·马斯克(Elon Musk)和金巴尔·马斯克(Kimbal Musk)兄弟的搞笑热闹访谈(视频) 甘蔗制柴油—为美国开发的耐寒,高产,产油作物 Bob Tregilus,Kirsten Hasberg和我在“本周的能源”上聊天(播客) 电动汽车电池价格是否比我们想象的低得多?低于$ 200 / kWh? 2014年美国和欧洲最畅销的电动汽车将… 加州能否在十年内提前向100万辆电动汽车充电? 特斯拉首席执行官埃隆·马斯克(Elon Musk)和首席技术官JB Straubel在挪威问答(VIDEOS) 根据消费者报告,特斯拉汽车公司已经排名第五 高级电动汽车电池研究项目背后的创新汽车 宝马360°电动车远不止是电动车+太阳能 丰田授权WiTricity的无线EV充电技术 福特邀请您通过汽车的眼睛看世界 关于特斯拉Model S如何应对极端损坏并与驾驶员沟通的故事 您从未听说过的最令人印象深刻的复出故事 州长里克·佩里(Rick Perry)支持特斯拉直接汽车销售 万向美国以1.492亿美元收购了Fisker Automotive资产 加州电网迈出了两步,增加了更多可再生能源和电动汽车 加利福尼亚州用于电动汽车基础设施的600万美元 大唐高鸿与驭势科技达成战略合作,构建车联网产业新生态 像乐高一样,优雅的自行车道紧贴在一起

Facebook开发工具 帮助AI在复杂环境中导航

盖世汽车讯 据外媒报道,日前,Facebook发布了三款新工具,SoundSpaces、Semantic MapNet,以及一个探索模型,帮助AI将学习如何规划路线、观察周围的物理环境、倾听正在发生的事情,以及构建3D空间记忆。

AI,自动驾驶,AI导航

(图片来源:venturebeat.com)

“具身AI”(embodied AI )这一概念来源于“具身认知”(embodied cognition),该理论认为,心理学的许多特征都是由有机体整个身体的各个方面塑造的。研究人员将这一逻辑应用到AI中,旨在提高AI系统的性能,如聊天机器人、机器人、自动驾驶汽车,甚至是与环境、人以及其他AI进行交互的智能扬声器。例如,具身机器人可以检查一扇门是否上锁,或者取回楼上卧室里正在响铃的智能手机。Facebook表示,“通过推进这些相关研究,并与更广泛的AI社区分享我们的工作,我们希望加快构建具身AI系统和AI助手,帮助人们在现实世界中完成各种复杂的任务。”

虽然视觉是感知的基础,但声音也同样重要。声音能捕捉丰富的信息,这些信息通常难以通过视觉或力的数据察觉,比如干叶子的纹理或香槟瓶内的压力。但很少有系统和算法利用声音作为构建物理理解的工具,因此Facebook发布了SoundSpaces。

SoundSpaces是一个基于3D环境声学模拟的音频渲染语料库。该数据集旨在与Facebook的开源模拟平台AI Habitat一起使用,提供软件传感器,使其可以在扫描的真实环境中插入模拟声源。

SoundSpaces与卡耐基梅隆大学一个团队的工作有一定关联,该团队发布了“声音-动作-视觉”数据集和一系列AI算法,以研究声音、视觉和运动之间的相互作用。该团队称,研究结果表明,声音再现可用于预测物体受到物理力量时的移动方向。

但Facebook表示,与卡耐基梅隆大学的研究不同,创建SoundSpaces需要声学建模算法和双向路径追踪组件模拟空间中的声音反射。由于材料会影响环境中接收到的声音,如在大理石地板上而不是地毯上行走,因此SoundSpaces还试图复制墙壁等表面的声音传播。同时,SoundSpaces还允许渲染位于主流数据集(如Matterport3D和Replica)环境中多个位置的并发声源。

此外,SoundSpaces还引入了AI训练方法AudioGoal,即AI主体必须在环境中移动,以找发出声音的物体。AudioGoal训练AI在不熟悉的环境中,利用视觉和听觉定位可听到的目标物体。Facebook称,与传统方法相比,AudioGoal能加快训练速度,提高导航精度。Facebook还表示,“AudioGoal 主体不需要目标位置指示,因此主体可利用多模态传感发现目标位置。我们经过学习的音频编码提供与GPS类似,甚至比GPS位移更好的空间线索。这表明音频可提供对GPS噪声的抗干扰能力。”

Facebook还发布了Semantic MapNet,该模块使用空间语义记忆形式记录物体在探索周围环境时的图像。Facebook称,这些空间图像为完成一系列具身任务提供了基础,包括导航到特定位置和回答问题。

Semantic MapNet可以预测特定物体位于其绘制的像素级、自上而下的地图中的位置。MapNet构建所谓的“非自我中心的”记忆,这是一种助记表示,可以捕获物体之间与视图无关的关系,以及物体与环境之间的固定关系。Semantic MapNet从观察中提取视觉特征,然后使用端到端框架将其投射到某个位置,利用所看到物体的标注,解析自上而下的环境地图。

该项技术使Semantic MapNet能够分割可能从鸟瞰图看不到的较小物体。项目步骤还允许Semantic MapNet对给定点及其周围区域的多个观测进行推理。Facebook表示,“这些构建神经情景记忆和空间语义表征的能力,对于改进自动导航、移动操作和以自我为中心的个人AI助手而言非常重要。”

此外,Facebook还开发了一种模型,可以推断环境地图中无法直接观察到的部分,如餐厅的桌子后面。该模型根据静态图像帧预测占用率,即物体是否存在,并且随着时间的推移,在其学习导航的过程中,将这些预测汇总起来。Facebook表示,其模型在仅使用三分之一的移动次数的情况下,将地图精度提高了30%,优于最佳竞争方法。在今年的计算机视觉和模式识别大会上,该模型还获得了一项任务的第一名,该任务要求系统适应较差的图像质量,并在没有GPS或指南针数据的情况下运行。

该模型仅在模拟中部署,尚未部署到真实的机器人中。但Facebook希望,当与其支持LoCoBot等机器人的机器人框架PyRobot一起使用时,该模型可以加速具身AI领域的研究。

郑重声明:本文版权归原作者所有,转载文章仅为传播更多信息之目的,如作者信息标记有误,请第一时间联系我们修改或删除,多谢。