
【穆斯塔法聊:2028年的世界是怎么样的?-哔哩哔哩】完整视频点击查看: https://b23.tv/8vYxga2
之前我们讨论过什么是智能,智能的定义是:完成复杂目标的能力。
穆斯塔法(Deepmind 联合创始人,Infection AI 创始人)在讨论 AI 未来 5 年会怎么样的采访中介绍,AI 下一步是自动化任务。
他描绘了这样一个未来景象。


而自动化任务其实并没有 5 年后那么遥远,因为目前 ChatGPT-4 在自动化任务的场景已经有了不错的能力,我们根据微软 ChatGPT -4 的报告来一探究竟。
在微软的这份报告中,研究人员尝试让 ChatGPT-4 自动化做以下几件事情,事情的复杂度是一点点升级:
- 让机器人自己完成成搜索目标,如下载一份麻婆豆腐菜谱、搜索今天热门新闻;ChatGPT-4 基本可以正确地预测下一步
- 让 ChatGPT-4 在搜索结果中完成多篇阅读的任务;ChatGPT-4 会自己知道看完一篇后挪到下一篇进行阅读;
- 让 ChatGPT-4 在亚马逊上购买键盘,价格要在 50 刀到 100 刀之间;存在部分错误预测,但是仍然有希望在未来自动化掉
- 让 ChatGPT-4 只看一个界面,自己判断接下来要做什么
我们针对1,3,4 这几个场景给大家做一个介绍。
1. 检索麻婆豆腐菜谱
Prompt:假设你现在是一个机器人在运行一台电脑,你需要预测你的下一步操作。如果你要移动鼠标,请描述你的动作。
在下面一系列图片里面,ChatGPT-4 均正确地预测了:
- 鼠标移动到 Google Chrome 浏览器
- 到检索框,输入“麻婆豆腐菜单”,点击回车进行检索
- 点击搜索界面的第一个关于“麻婆豆腐菜单”的结果
- 点击界面右上角“菜单”,查看具体的麻婆豆腐菜单
- 点击界面右上角的打印功能,获得麻婆豆腐详细菜单










2. 在亚马逊上购物
要求 ChatGPT-4 扮演一个机器人,在亚马逊上购买一个 50-100 刀的键盘,步骤分为:
- 找到手机上的亚马逊 app(具体位置识别错误)
- 搜索关键词,键盘
- 使用过滤按钮,过滤价格 50 刀- 100 刀
- 查看满足过滤条件的 1987个商品
- 查看第一个商品(位置信息描述有错误)
- 进入商品详情界面,点击购买(购买按钮 Buy new 判断错误,因为 Buy new 不是一个购买按钮)
- 加入购物车
- 进行结算,但是结算按钮位置判断错误









3. 根据界面,预测要做什么
在这个案例中,ChatGPT-4 正确地描述了界面,并且理解到了通知信息,以及接下来自己要处理通知信息的正确判断 。


未来畅想,你的工作中,有什么场景是希望 ChatGPT-4 自动化的么?
留下你的想法吧。