Playwright ,这是由微软推出的新一代端到端测试与浏览器自动化框架,接入AI IDE后可以让AI工具具备浏览器的某些功能。全面兼容 Chromium、Firefox 和 WebKit 三大主流内核,支持在 Windows、Linux 和 macOS 环境下运行,并原生提供无头模式及移动端设备模拟能力。相较于传统方案,Playwright 在执行速度和可靠性上具有显著优势,其内置的代码生成、智能元素定位及可视化调试工具,大幅降低了自动化脚本的开发门槛。通过精准定位机制和丰富的同步/异步 API,开发者无需关注底层浏览器细节,即可快速实现复杂的页面交互、自动化测试及数据抓取任务。
对于Playwright MCP服务的部署,可以本地化或者服务器端部署。在这里老蒋考虑到不同设备和多端的共享使用,所以我用手上的一台腾讯云轻量云服务器部署Playwright MCP,而且它默认有提供一键部署镜像。

如图所示,我们在轻量云服务器中选择应用模板,找到 Playwright浏览器工具选项,设置ROOT账号密码直接安装。

安装完毕之后,看到在应用管理有对应的JSON,这个等会需要复制到IDE中接入MCP。

在你使用的IDE中,一般现在当前的AI IDE都是有支持MCP TOOLS的,添加。

复制添加后看到并不是绿色的,说明没有畅通。检查是不是服务器安全组端口没有设置。

添加8931端口放行。

看到已经绿色说明在运行,有支持这么多的浏览器行为。
基础控制类(Browser 生命周期)
| 功能名 | 说明 |
|---|---|
browser_close |
关闭当前浏览器实例。常用于清理资源或结束会话。 |
browser_resize |
调整浏览器窗口大小(如 1920x1080),用于响应式测试或模拟不同屏幕。 |
browser_console_messages |
获取浏览器控制台输出的日志(console.log/error 等),便于调试。 |
页面交互类(DOM & 用户操作)
| 功能名 | 说明 |
|---|---|
browser_click |
模拟鼠标点击元素(按钮、链接等)。 |
browser_hover |
悬停在元素上,触发 hover 效果(如菜单展开)。 |
browser_drag |
拖拽元素(如拖拽排序、上传文件)。 |
browser_press_key |
模拟键盘按键(如回车、Ctrl+C)。 |
browser_type |
在输入框中输入文本(支持逐字输入或清空后输入)。 |
browser_select_option |
选择下拉框(<select>)中的选项。 |
browser_fill_form |
填充整个表单(自动识别输入框、下拉框、复选框等)。 |
browser_file_upload |
上传本地文件(如点击 <input type="file">)。 |
导航与网络类
| 功能名 | 说明 |
|---|---|
browser_navigate |
打开指定 URL(如 https://example.com)。 |
browser_navigate_back |
后退到上一页。 |
browser_network_requests |
获取当前页面的所有网络请求(URL、方法、状态码等),用于抓包或监控。 |
截图与快照类(视觉验证)
| 功能名 | 说明 |
|---|---|
browser_take_screenshot |
截取当前页面截图(支持全页、区域、格式如 png/jpg)。 |
browser_snapshot |
生成页面可访问性快照(Accessibility Snapshot),用于结构化分析或 AI 视觉理解。 |
高级脚本类(JavaScript 执行)
| 功能名 | 说明 |
|---|---|
browser_evaluate |
在当前页面执行任意 JavaScript 代码,返回值给 AI(如获取 DOM 状态、调用函数)。 |
browser_handle_dialog |
处理弹窗(alert、confirm、prompt),自动点击“确定”或“取消”。 |
多标签页管理
| 功能名 | 说明 |
|---|---|
browser_tabs |
列出当前浏览器所有标签页,支持切换、关闭、新建标签页。 |
等待与同步类
| 功能名 | 说明 |
|---|---|
browser_wait_for |
等待页面元素出现、消失、文本变化、URL 变更等(类似 waitForSelector)。 |
浏览器安装与准备
| 功能名 | 说明 |
|---|---|
browser_install |
自动下载并安装指定浏览器(如 Chromium、Firefox),确保环境就绪。 |
也就是说,利用这个工具可以实现像人一样的使用浏览器,当然是更为自动化。尤其是适合用于AI自动测试、爬虫抓取数据、自动化验证、动态数据提取,以及不同设备的模拟测试。

然后老蒋就测试,在IDE CHAT对话框中对于我们需要对于某个指定的网页打开和搜索,当然还有可以测试包括抓取提取数据,甚至表单的填写都没有问题。后续准备测试用它来替代Python进行数据的提取后加工处理实现采集数据的自动化看看效率如何。
原创文章,作者:老蒋,如若转载,请注明出处:https://www.lezaiyun.com/playwright-mcp.html