Google’s latest robot can offer you an energy drink

主题：谷歌发布AI学习模型Robotic Transformer（RT-2）来提升机器人智能。

要点：

谷歌发布了AI学习模型Robotic Transformer（RT-2），用于教导机器人更好地识别视觉和语言模式，以解释指令并推断出最适合请求的物体。
研究人员在厨房办公环境中使用机械臂测试了RT-2，要求机械臂决定什么是一个好的临时锤子（是一块石头），并选择一种饮料给一个疲惫的人（是红牛）。他们还告诉机器人将一罐可乐移到泰勒·斯威夫特的照片上。
RT-2模型通过在网络和机器人数据上进行训练，结合了谷歌自己的Bard等大型语言模型的研究进展，并理解除英语以外的其他语言的指令。
过去，教导机器人需要很长时间，研究人员需要逐个编程指令。但是，借助RT-2等VLA模型的强大能力，机器人可以访问更多的信息来推断下一步该做什么。
谷歌去年开始进军智能机器人领域，宣布将在机器人领域使用其LLM PaLM，创建了名为PaLM-SayCan的系统，将LLM与物理机器人集成。
谷歌的新机器人并不完美，纽约时报观看了机器人的现场演示，并报道称其错误地识别了苏打水口味，并将水果误认为白色。
预计明年会推出更智能的机器人，甚至可以在最少的指令下清理溢出的液体。