Google’s latest robot can offer you an energy drink
主题:谷歌发布AI学习模型Robotic Transformer(RT-2)来提升机器人智能。
要点:
- 谷歌发布了AI学习模型Robotic Transformer(RT-2),用于教导机器人更好地识别视觉和语言模式,以解释指令并推断出最适合请求的物体。
- 研究人员在厨房办公环境中使用机械臂测试了RT-2,要求机械臂决定什么是一个好的临时锤子(是一块石头),并选择一种饮料给一个疲惫的人(是红牛)。他们还告诉机器人将一罐可乐移到泰勒·斯威夫特的照片上。
- RT-2模型通过在网络和机器人数据上进行训练,结合了谷歌自己的Bard等大型语言模型的研究进展,并理解除英语以外的其他语言的指令。
- 过去,教导机器人需要很长时间,研究人员需要逐个编程指令。但是,借助RT-2等VLA模型的强大能力,机器人可以访问更多的信息来推断下一步该做什么。
- 谷歌去年开始进军智能机器人领域,宣布将在机器人领域使用其LLM PaLM,创建了名为PaLM-SayCan的系统,将LLM与物理机器人集成。
- 谷歌的新机器人并不完美,纽约时报观看了机器人的现场演示,并报道称其错误地识别了苏打水口味,并将水果误认为白色。
- 预计明年会推出更智能的机器人,甚至可以在最少的指令下清理溢出的液体。