Google Workspace CLI:針對 Gmail、雲端硬碟等的 AI 優先命令列工具

最後更新: 03/07/2026
作者: C 源追蹤
  • Google Workspace CLI 透過一個統一的介面集中存取 Gmail、雲端硬碟、行事曆、文件、表格、聊天、管理後台等服務。 gws 命令。
  • 該工具專為 AI 代理設計,具有結構化的 JSON 輸出、100 多種技能以及為 Gemini、Claude 和類似客戶端整合的 MCP 伺服器。
  • 其命令介面由 Google Discovery Service 動態生成,因此新的 Workspace API 端點無需手動更新即可出現。
  • 儘管它具備一些功能,但它仍然是一個開發者示例,沒有谷歌的官方支持,因此安全性、範圍界定和測試由用戶負責。

Google Workspace CLI 介面

過去幾年,命令列悄悄重回大眾視野, Google Workspace CLI 正是這轉變的核心所在。谷歌的最新工具並沒有將所有操作透過圖形介面完成,而是讓開發者和人工智慧系統能夠使用單一可編寫腳本的命令來控制 Gmail、雲端硬碟、日曆和 Workspace 的其他部分。

這個新項目,通常被稱為 gws旨在使Google的生產力套件更容易實現自動化,並使其更易於用於智慧 AI 工作流程。 它將幾乎所有主要的 Workspace API 整合到一個統一的命令列介面中。同時,它也疊加了明顯是為人工智慧代理而非僅僅是終端上的人類用戶而設計的功能。

Google Workspace CLI 究竟是什麼?

Google Workspace CLI(通常縮寫為 gws)的核心是 Google Workspace API 的統一命令列前端透過一個可執行文件,使用者和代理可以與 Gmail、Google 雲端硬碟、Google 日曆、Google 文件、Google 表格、Google 聊天,甚至管理端點進行交互,而無需管理多個 SDK 或自訂包裝器。

此專案託管在 GitHub 上,專案名稱為 googleworkspace/cli 它被存放在一個倉庫中,並以 npm 包的形式分發。使用以下命令進行全域安裝: npm install -g @googleworkspace/cligws 命令添加到您的路徑中, 將所有受支援的工作區 API 轉換為一個工具背後的子命令該存儲庫中使用的標語簡潔地概括了其意圖:“一個 CLI 即可滿足所有 Google Workspace 的需求——專為人類和 AI 代理而打造。”

與許多圍繞著固定用例精心打造的傳統命令列介面 (CLI) 不同,gws 是 使用 Google 的發現服務在運行時動態構建每次運行時,它都會查詢 Google 的 API 架構服務,根據最新的定義構建其命令接口,並將該架構緩存一段時間(例如大約 24 小時),以確保啟動時間可預測。當 Google 在 Workspace API 中新增或變更端點時,CLI 可以在下次刷新架構時自動公開該端點。

這種基於模式的方法意味著每次 API 發生變化時,無需等待新的二進位版本發布。 團隊不再需要重複更新靜態 REST 包裝器 只是為了隨時了解雲端硬碟、Gmail 或行事曆中的一些細微變化。

從技術角度來看,該專案是用 Rust 編寫的,但透過 npm 安裝它的開發人員不需要 Rust 工具鏈。 該軟體包包含適用於常見作業系統和架構的預編譯本機二進位。此外,如果願意,也可以選擇透過 Nix flake 或直接從 Cargo 來源進行安裝。

從一開始就為人工智慧代理而設計

Google Workspace CLI 的一個顯著特點是: 從一開始就以人工智慧代理作為主要用戶進行設計。谷歌高級開發者關係工程師兼該工具的創建者賈斯汀·波恩內爾特認為,許多現有的 CLI 都是為人類構建的,然後才進行改造以適應智能體,這導致了脆弱的行為和容易出現幻覺的整合。

相較之下,gws 的建構基於這樣的假設:大型語言模型和自主代理將解析每個標誌、每個參數和每一行輸出。 人機互動固然重要,但機器可讀性更為重要。你可以在設計選擇中看到這種理念:可預測的參數結構、嚴格的輸入驗證以及 JSON 優先的回應。

CLI 鼓勵使用更簡潔的格式,而不是依賴易於理解的簡寫符號和格式隨意的文字。 與底層 API 模式高度一致的原始 JSON 請求體對於人工智慧系統而言,這消除了對哪些欄位屬於哪裡的猜測,並最大限度地降低了智能體捏造參數或誤解輸出的風險。

該工具還具備自描述功能:代理程式可以在運行時查詢 CLI 本身以獲取最新的架構資訊。 這樣就減少了模型搜尋外部文件的需求。減少令牌使用,避免過時的文件與目前 API 之間出現不一致的情況。

gws MCP 如何將 Workspace 轉變為代理程式的即時端點

CLI 中嵌入了一個名為“ gws mcp,充當 模型上下文協定 (MCP) 伺服器啟動後,該伺服器會將 Workspace API 作為結構化工具透過標準輸入和輸出公開,從而允許任何相容 MCP 的用戶端透過相同的協定與 Google Workspace 通訊。

實際上,這意味著像 Claude Desktop、Gemini CLI、某些 VS Code 擴充功能和其他了解 MCP 的代理主機等工具可以直接連接到 Google Workspace CLI。 他們將工作區操作視為一流的工具。—查詢 Gmail、建立日曆事件、讀取或寫入雲端硬碟檔案—無需自訂的 HTTP 整合或自訂守護程式。

透過標準輸入/輸出 (stdio) 進行通訊可以簡化部署。 無需打開額外的端口,無需管理長時間運行的後台服務,防火牆的複雜性也更低。這在封閉的企業環境中可能是一個顯著的優勢。此代理程式只需啟動命令列介面 (CLI),透過標準輸入/輸出 (stdio) 交換結構化訊息,並在工作完成後關閉自身即可。

由於 MCP 用戶端通常限制了它們一次可以公開的工具數量(通常在幾十個到一百個左右),因此 CLI 實作了服務等級的過濾。 僅顯示與特定場景相關的 Workspace 服務。例如使用 Drive 和 Docs 進行文件處理,或使用 Calendar 安排工作流程,使主機用戶端的工具清單易於管理。

MCP 伺服器傳回的每一個回應,無論是查詢成功、錯誤訊息或下載元數據,都以結構化的 JSON 格式傳回。 代理管道可以直接解析輸出,並根據明確欄位進行分支。這樣就無需抓取文字日誌或解讀面向人類的散文。

代理技能、配方和命令介面

為了幫助代理人可靠地操作,該存儲庫附帶了一個名為“代理人技能”的廣泛書面說明目錄。 包含一百多個 SKILL.md 文件,涵蓋每個受支援的 API 和一系列更高層級的工作流程。這些文件為常見任務提供了精確的呼叫模式,以便模型不必從頭開始發明命令語法。

正如波恩內爾特在其他地方所言,其理念是: 精心製作的技能檔案比幻覺便宜如果沒有這些指南,呼叫命令列介面 (CLI) 的代理程式可能會錯誤地命名標誌、遺漏必需的參數或僅憑上下文推斷而誤用子命令。有了 SKILL.md 文件,模型就可以遵循明確的範例,這些範例展示了需要哪些參數以及輸出結果會是什麼樣子。

除了單步技能外,該項目還包含數十個精心挑選的食譜——根據文檔,大約有五十個——這些食譜捕捉了多步驟工作流程。 這些配方將諸如總結電子郵件線程、生成草稿或將文件篩選成可重複使用序列等任務打包在一起。 代理可以透過名稱觸發,而無需每次都從頭開始重新規劃。

由於 CLI 是根據 Discovery Service 動態建立的,因此隨著 Google Workspace 的發展,命令介面也會隨之調整。 新的端點會以全新子指令的形式出現,無需在程式碼庫中手動註冊。這樣可以降低依賴尖端功能的團隊的維護成本。

雖然這種動態構造是在運行時發生的,但模式文件會被緩存,這樣自動化管道中的頻繁呼叫就不會反覆存取網路。 這既保證了新鮮感,又兼顧了可預測的性能。 對於按順序運行多個命令的代理程式。

開發者體驗和整合選項

從開發者的角度來看,Google Workspace CLI 的入門設計非常簡潔明了。 主要前提條件是安裝相容的 Node.js。 使用 npm 發行版時,需要配合配置了適當 OAuth 憑證的 Google Cloud 專案。

安裝完成後,gws 可以直接整合到現有環境中。例如,可以透過一個簡單的命令將其作為擴充功能添加到 Google 的 Gemini CLI 中,該命令會將 Gemini 指向 GitHub 程式碼庫。 之後,雙子座可以直接存取全部內容。 gws 命令和代理技能這使得基於 Gemini 的代理程式更容易在 Workspace 資料上進行操作,而無需額外的黏合程式碼。

對於編輯器和整合開發環境 (IDE) 而言,整合 CLI 通常意味著調用 gws 作為子進程,傳遞 JSON 有效負載並使用 JSON 結果。 由於各命令的輸出格式一致,因此可以集中進行錯誤處理和日誌記錄。 而不是針對每個 Workspace 服務單獨客製化。

喜歡更多控制權的開發者可以直接編譯 Rust 原始碼,或利用提供的 Nix flake 進行可重複的建置。 開源的 Apache-2.0 許可證允許私有分支、內部修改和特定部署的適配。 無需額外許可證費用。

對於 CI 環境和基於伺服器的代理,CLI 支援非互動式身份驗證流程。 服務帳戶金鑰、預先取得的存取權杖和其他自動化憑證策略均已納入考慮範圍。因此,在使用者桌面會話之外運行的管道仍然可以以程式設計方式與 Workspace 進行互動。

CLI 在 Google Workspace 中實現的功能

配置完成後,Google Workspace CLI 可在整個套件中提供豐富的操作集。 代理商和使用者都可以透過命令搜尋 Gmail 郵件會話、撰寫回覆、管理標籤並完成收件匣分流。同樣,諸如列出文件、行動資料夾、更新元資料或建立新文件等雲端硬碟操作都可以作為可編寫腳本的基本操作來實現。

在 Docs 和 Sheets 中,CLI 可以幫助組裝內容或執行資料操作,作為更大工作流程的一部分——例如,從一組原始檔案產生摘要文件或從多個電子表格中提取單元格。 可以建立、更新或查詢日曆事件聊天訊息可以作為對話自動化的一部分發布或閱讀。

由於該工具還涵蓋管理端點,因此存在以下潛在風險: 圍繞帳戶管理、日誌記錄和合規相關任務的策略驅動型自動化也就是說,鑑於該層面的錯誤會產生更廣泛的影響,透過自主代理使用管理功能會更凸顯仔細的範圍界定和嚴格測試的重要性。

對於以人工智慧為先導的應用場景,這些操作是可組合的建構模組。例如,代理可以列出支援郵箱中的未讀訊息,將郵件執行緒匯總成狀態報告,將該報告儲存在雲端硬碟中,然後發送指向聊天頻道的連結—所有操作均使用命令列介面 (CLI) 呼叫串聯完成,無需與圖形介面互動。.

由於命令列介面 (CLI) 相比於佈局可能頻繁變化的使用者介面 (UI) 而言更加明確和穩定,因此自主系統可以 基於結構化回答,可以更可靠地推論下一步行動。 而不是基於像素的螢幕抓取。這種穩定性是許多從業者認為命令列存取是人工智慧驅動自動化更佳基礎的關鍵原因之一。

安全功能、防護措施和多帳戶支持

向代理商開放廣泛的 API 存取權確實會引入一些獨特的安全問題,而 Google Workspace CLI 的設計試圖預先解決其中的一些問題。 輸入驗證比許多以人為中心的工具更嚴格。並檢查無效路徑、控製字元和格式錯誤的資源標識符,部分原因是限制幻覺或敵對輸入的影響。

CLI 還包含敏感操作的預演功能。啟用此功能後,命令將在不實際向 Workspace API 發送寫入請求的情況下進行評估。 允許團隊在做出不可逆轉的改變之前確認將會發生什麼。 例如刪除或批次更新。

另一個值得注意的功能是可以透過與 Google Cloud 的 Model Armor 服務整合來清理回應。此外,它還提供了一個專用的 --sanitize 旗幟, 可以掃描回覆內容。 迅速注射嘗試 或其他惡意內容,在傳遞給模型之前當代理從使用者控制的文件或收件匣中讀取內容時,這一點尤其重要,因為其中可能存在對抗性內容。

在憑證方面,CLI 支援多種身份驗證模式。使用者可以互動式登入、透過服務帳戶連接、依賴現有存取令牌,或配置適用於伺服器和持續整合系統的非互動式流程。 憑證以加密形式儲存在每個帳戶的設定目錄中。使用 AES-256-GCM 和由作業系統金鑰環管理的金鑰。

該工具明確支援多帳戶場景。它可以同時保存多個谷歌帳戶的憑證。 允許使用者在它們之間切換,或設定日常使用的預設選項。這種靈活性可以幫助那些將個人環境、測試環境和生產環境分開,或在多個領域共享自動化基礎設施的團隊。

風險、支援狀況和營運考量

儘管託管在 GitHub 上一個看起來很正式的組織中,但 Google Workspace CLI 卻是 明確指出這是一個開發者範例,而不是Google提供的完全支援的產品。文件指出,隨著專案的演進,介面可能會發生變化,行為可能會發生顯著變化,而且沒有針對企業客戶的正式支援管道。

在社群討論中,包括 Hacker News 等平台上的討論帖,觀察家將該專案描述為更像是特定員工的實驗性或業餘愛好,而不是頂級商業產品。 這不會降低其效用,但確實會影響人們對穩定性和長期保障的預期。.

對於考慮在生產環境中使用 CLI 的組織而言,通常的原則仍然適用:將 CLI 視為功能強大但可能不穩定的基礎設施。權限過大——例如對整個 Gmail 網域的完全修改權限或不受限制的雲端硬碟權限——都可能導致一條錯誤的命令或一個有缺陷的計劃引發大規模的故障。 從唯讀權限入手,限制對特定資料夾的訪問,並使用沙盒帳戶,是一種更為謹慎的做法。.

諸如速率限制、破壞性操作的人工審批步驟以及撤銷令牌或撤銷更改的明確事件處理手冊等操作保障措施可以減輕一些固有的風險。 CLI 命令的清晰性對於審計和回滾來說是一大優勢。但這也意味著,可以用一行程式碼輕鬆表達影響廣泛的操作。

由於該工具基於標準的 Workspace API 構建,因此可以融入現有的治理模型。組織仍然可以依賴 OAuth 允許清單、資料遺失防護策略、Vault 保留規則和稽核日誌 透過管理員和司機活動 API 來監控和限制資料的存取方式,即使是代理發起呼叫時也是如此。

企業訊號及未來展望

對於已經在 Workspace 中嘗試使用代理程式工作流程的團隊,可以使用 Google Workspace CLI。 與為每個單獨的 API 客製化包裝器相比,這種方式能更直接地實現價值。常見情境包括為支援團隊產生收件匣摘要、在雲端硬碟中自動標記文件或執行定期清理任務以減少共用儲存中的雜亂內容。

更廣泛的人工智慧生態系統中的觀察人士注意到,CLI 引用了 OpenClaw 等框架,並能與 Gemini 和其他支援 MCP 的工具無縫整合。 獨立代理專案與主流人工智慧平台之間的這種交叉融合預示著,未來以命令列介面(CLI)為先的整合方式可能會成為常態。 對於生產力工具而言,減少對專有連接器的依賴。

Workspace CLI 的普及程度可能取決於幾個方面的發展。其中之一是谷歌最終是否會將其從實驗示例升級為正式的、有穩定版本發布的官方工具包。 另一個方面是安全 OAuth 範圍的標準化策略和模板的出現。 以便管理員可以更輕鬆地按角色批准或限制代理存取權限。

更全面、端到端的範例也至關重要。範例流程、測試框架和合成資料集可以幫助團隊在接觸生產資料之前驗證自動化流程。 能夠展示完整工作流程(從初始身分驗證到日誌記錄和錯誤復原)的文件可以降低謹慎型組織的進入門檻。 他們希望在推出人工智慧驅動的流程之前,能夠實現可預測的行為。

同時,該專案在開源許可下繼續以積極的發布節奏推進。諸如 0.4.x 等版本已經發布。 Apache 2.0 授權模式允許組織對 CLI 進行分支、擴展和自訂。 對他們的基礎設施,包括必要時為自訂平台進行交叉編譯。

總而言之,Google Workspace CLI 標誌著在使 Gmail、雲端硬碟、文件以及 Workspace 的其他功能更易於開發者和 AI 代理存取方面邁出了重要一步。它以結構化 JSON、動態模式生成、MCP 整合和明確的安全功能為核心,為自動化提供了一個靈活而又符合規範的基礎——同時,它仍然將仔細的範圍界定、測試和治理的責任牢牢掌握在選擇部署它的用戶手中。

api Gemini 3 的實現
相關文章:
Gemini 3 API 更新、模型與遷移指南
相關文章: