用 Steel 3 個步驟讓 AI 幫你操作瀏覽器,自動抓資料省下 5 小時

用 Steel 3 個步驟讓 AI 幫你操作瀏覽器,自動抓資料省下 5 小時

用 Steel 3 個步驟讓 AI 幫你操作瀏覽器,自動抓資料省下 5 小時

你有沒有遇過這種情況:想要把某個網站的資料自動抓下來,或是每天都要重複在幾個網頁之間點來點去?如果你問過工程師,他們可能會跟你提到 Puppeteer 或 Selenium 這些工具。但對大部分人來說,這些東西就像在寫天書,而且最痛苦的是,只要網站稍微改版,原本寫好的自動化程式就直接報廢,得重新修一遍 😫

今天想跟你分享一個超強的工具叫 Steel。簡單來說,它就像是給 AI 裝上了一雙「手」和一雙「眼睛」,讓 AI 可以直接控制 Chrome 瀏覽器,幫你完成那些無聊的重複性工作。

什麼是 Steel?你可以把它想成「AI 的專屬瀏覽器」

通常我們要讓 AI 讀網頁,頂多是把網址貼給它,但 AI 沒辦法幫你「登入帳號」、「點擊按鈕」或「在表單填資料」。

Steel 解決了這個問題。它提供了一個沙盒環境(你可以想成是一個獨立的、不會弄髒你電腦的虛擬瀏覽器),讓 AI Agent(就是能自主執行任務的 AI)可以直接操作 Puppeteer 或 Playwright 這些專業的自動化工具。

最厲害的是,它把這些複雜的底層技術「API 化」了。什麼是 API 化?就像你去餐廳點餐,你不需要知道廚房怎麼開火、怎麼切菜,你只需要在菜單上點「一份蛋炒飯」,廚房就會把成品端給你。Steel 就是讓 AI 只要下指令,瀏覽器就會乖乖照做。

Steel 到底強在哪?(這些功能超實用)

如果你之前試過自動化工具,你一定知道被網站「偵測到是機器人」而被封鎖的痛苦。Steel 內建了幾個讓開發者(或想嘗試自動化的人)尖叫的功能:

  • 完全控制 Chrome:它使用 Chrome DevTools Protocol (CDP),這就像是拿到了瀏覽器的最高管理權限,想做什麼都可以。
  • 記憶功能(Session 管理):它能記住你的 Cookie 和本地儲存資料。這意味著你不用每次都重新登入,就像你平常開瀏覽器一樣,分頁關掉再開,登入狀態還在。
  • 偽裝大師(偵測迴避):內建 Stealth 插件和指紋管理。簡單說,就是讓網站以為操作的是一個「真實的台灣使用者」,而不是一個冷冰冰的程式,大大降低被封鎖的機率。
  • 快速轉換 API:它可以一鍵把網頁變成 Markdown 格式(方便 AI 閱讀)、截圖或轉成 PDF。這對需要大量收集資料的人來說簡直是救星。
  • 代理伺服器(Proxy)支持:如果你需要從不同地區抓資料,它可以幫你切換 IP,避免被網站認定為異常流量。

只要 3 步,把 Steel 跑起來 🚀

雖然 Steel 需要一點點程式基礎,但如果你會用 Docker(一種像「快遞包裹」一樣,把軟體環境打包好直接安裝的工具),安裝過程其實非常快。

第一步:把程式碼抓下來

打開你的終端機(Terminal),輸入這行指令,把 Steel 的專案複製到你的電腦裡: git clone https://github.com/steel-dev/steel-browser.git && cd steel-browser

第二步:用 Docker 啟動

輸入下面這行,Steel 就會在後台跑起來: docker run -p 3000:3000 -p 9223:9223 ghcr.io/steel-dev/steel-browser

第三步:打開管理介面

啟動後,直接在瀏覽器輸入 http://localhost:3000/ui。你會看到一個簡單的介面,在這裡你可以監控 AI 正在怎麼操作你的瀏覽器,就像在看監視器一樣,非常直觀!

實際怎麼用?讓 AI 幫你幹活

安裝好後,你可以透過 Node.js 寫簡單的指令來建立一個「工作階段(Session)」。

你可以想像成是在幫 AI 準備一個「工作桌面」。你可以設定:

  1. 視窗大小:例如設定成 1280x800,模擬一般筆電螢幕。
  2. 擋廣告:開啟 blockAds: true,讓 AI 抓資料時不會被亂七八糟的廣告干擾,速度更快。
  3. 代理設定:如果你需要偽裝成國外 IP,就在這裡填入 Proxy 資訊。

一旦 Session 建立好,你就可以把這個控制權交給像 Claude 或 GPT-4 這樣的 AI Agent。你只要告訴它:「去幫我搜尋台灣最近三天的 AI 新聞,把標題和連結整理成表格」,AI 就會透過 Steel 在瀏覽器中搜尋、點擊、複製,最後把結果交給你。

總結:從「手動複製」進化到「AI 自動化」

以前我們要自動化,得花好幾天研究 HTML 標籤、寫複雜的 CSS Selector,只要網站改一個 class 名稱,程式就死掉。但有了 Steel,我們是讓 AI 去「看」網頁並操作,容錯率高非常多。

無論你是想要自動化報稅資料收集、追蹤競品價格,還是幫公司做大規模的市場調查,Steel 都能幫你省下大量重複點擊的時間。

現在就打開 GitHub 搜尋 Steel Browser 開始試試看吧!