工作人員開發生命週期:從概念到生產 | Agentforce | 基本概念

此文字已使用 Salesforce 的自動翻譯系��進行翻譯。參閱我們的調查以提供此內容的回饋意見,並告訴我們您接下來想要查看的內容。

在傳統軟體開發中,軟體開發生命週期 (SDLC) 提供建構應用程式的結構化、分階段式方法。其可建立品質、降低風險,並提供從計畫到發行之間的明確藍圖。工作人員開發週期 (ADLC) 是一種類似的方法,專為處理建立自發工作人員的獨特複雜性量身打造。

工作人員並非被動應用程式,而是在動態執行環境中思考、採取動作和學習的系統。他們的非決定性行為使傳統 QA 不足。工作人員開發生命週期 (ADLC) 受到如 Agentforce 等平台的支援,涵蓋五個階段:計畫和設計、開發 (「內部迴圈」)、測試和驗證、部署,以及連續監視和調整 (「外部迴圈」)。

本文件為已熟悉軟體開發生命週期 (SDLC) 的開發人員和企業結構設計師提供全方位指南,並希望將專業知識擴充至以工作人員為基礎的系統。我們的主要目標是透過醒目提示其與傳統 SDLC 方法的關鍵區別,並提供結構化架構,以概念化建立、部署和管理智慧工作人員的整個流程,來協助快速瞭解工作人員開發週期 (ADLC)。

文件分為三個不同的章節,每個章節的設計目的為漸進式建立您的 Knowledge 和實際技能:

**第一章 Framework。**本章介紹工作人員開發生命週期 (ADLC),詳細說明其與 SDLC 的差異,因為開發自發工作人員的獨特挑戰。其會建立設計、開發、測試和部署工作人員的架構。
**第 2 章 Platform。**本章會探索 Agentforce,其統一平台可簡化和加速整個工作人員開發週期。Agentforce 提供工作人員設計、資料處理、模型訓練、部署和持續監視的工具,可簡化複雜工作並提升效率。
**第 3 章: Pro-Code 實作。**本指南使用 Agentforce 的 Pro-Code 工具,提供工作人員開發的實際、逐步指示和實際範例。它涵蓋了整個「工作人員開發生命週期」,從原型和功能工程到模型部署、效能調整和維護,為開發人員提供建立生產準備工作人員的技能。

本文件旨在為您提供 Agentforce 專業程式碼工具的理論與實際 Knowledge。您將學習有效率、安全且可靠地建立、部署和監視工作人員,全面瞭解 ADLC,並充分發揮 Agentforce 智慧工作人員開發的潛力。

AI 工作人員的非決定性性質需要專門的開發架構。本章介紹工作人員開發生命週期 (ADLC),概述該架構。本章提供 ADLC 五個核心階段的全方位概觀,從初始「計畫」和「設計」到「連續監視和調整」。本章會建立建立強大且可靠的工作人員所需的基礎 Knowledge。

本節將 SDLC 概念對應至 ADLC 的五個階段。

這是定義工作人員策略目的與營運界限的基礎階段。結構良好的設計階段是成功的最關鍵步驟,因為它將業務需求轉換為技術藍圖。設計流程可確保工作人員不僅具備功能,而且負責且符合使用者期望。這是撰寫任何程式碼之前建立「什麼」和「為什麼」的位置。

定義工作人員目標和能力:首先,您必須清楚說明工作人員的主要目標,以及其將執行的特定、可測量的工作。這涉及定義其角色 (例如「客戶服務助理」)、其核心功能 (例如「預訂約會」、「回答產品問題」),以及每個項目的成功度量。
建立個性人物與道德護欄:此步驟涉及設計工作人員的個性,並定義其道德界限,以確保其值得信賴且安全。它會建立工作人員的語氣 (例如「正式」、「友善」),並實作嚴格的規則以防止有害、偏見或不當的回應。
對應內容與瞭解:您必須決定工作人員需要瞭解並記住才能有效的資訊。這包括定義其 Knowledge 庫的範圍和交談記憶體,讓其擁有一致的多輪對話。
識別工具與系統整合:這涉及清點工作人員必須與其連線才能執行工作的外部系統、API 和資料來源。系統會識別每個工具 (例如預訂 API、客戶資料庫),且其功能會對應至特定的工作人員功能。
即時升級計畫:定義工作人員升級至人類的條件十分重要。這涉及檢閱潛在失敗點和對話的「無效結束」,以決定工作人員何時應升級為人類運算子。設計應描述此處理方式將如何執行,以確保轉移足夠的內容,以便快速取用以確保流暢的客戶體驗。

這是設計藍圖轉換為功能工作人員的實作建構階段。開發人員會建立工作人員、將其連線至其工具,並為其提供執行其工作所需的資料。建立和精簡此反覆的「內部迴圈」是工作人員真正開始生活的地方。

設定工作人員的邏輯和決策:此步驟涉及透過將其決策架構連線至內容、工具和資料來源,來打造工作人員的推理。開發人員的角色是透過建立 API 或重複使用現有 API、設定作業護欄,以及指定工作人員選取和使用可用工具完成複雜的多步驟工作的方式,來定義工作人員的行為。
工程師提示與微調模型:工作人員的角色、指示和限制會透過仔細的提示工程進行編碼。此流程涉及建立引導大型語言模型 (LLM) 的主要提示,針對更進階的使用個案,請微調網域特定資料上的模型以改善其效能。
整合與保護 AI 工具:在設計階段期間識別的函數和 API 會與工作人員連線。開發人員可以使用 SDK 來包裝現有函數或建立新函數,讓工作人員可以安全地呼叫這些函數,並確保其擁有適當的驗證和錯誤處理。
建立資料與 RAG 銷售管道:為了讓工作人員擁有外部 Knowledge,開發人員建立「取得增量產生」(RAG) 的資料銷售管道。這涉及連線至來源 (例如向量商店、關聯性資料庫、圖表資料庫或內部文件) 的資料並將其編製索引,讓工作人員可以存取該資訊,以提供準確且感知內容的回應。

測試 AI 工作人員會從傳統軟體的決定性驗證導入範例轉換。雖然會測試傳統應用程式是否正確 (特定輸入必須產生單一預期的輸出),但工作人員的非決定性性質需要更複雜的方法。目標不是驗證單一正確的回答,而是確保工作人員的行為符合其預期的目的、對應非預期的輸入,並在可接受成果的範圍內保持可靠。

單元測試:此層著重於工作人員的決定性、非 AI 元件。它涉及傳統單元測試,以驗證每個個別工具和函數在隔離中是否正確運作,以確保在套用工作人員的複雜推理之前建立可靠的基礎。
端對端 (E2E) 測試:此階段會評估工作人員在實際情況下達成目標的能力,因為其非決定性質很重要。這些端對端測試會驗證工作人員是否成功完成工作,且其效能不會隨著變更而降低,而不是檢查確切的輸出。
反向與穩定度測試:這是刻意嘗試破壞工作人員以主動發現其劣勢的作法。測試人員使用不明確的要求、惡意提示和其他邊緣個案來揭露漏洞,並確保工作人員在壓力下保持彈性與安全。
人類循環 (HITL) 評估:由於自動測試無法測量語氣或交談流程等細微的品質,因此此階段依賴人類的回饋意見。測試人員會與工作人員互動,為其回應評分實用性和整體使用者體驗,提供微調其行為的必要資料。
效能與規模測試:這是防止效能瓶頸影響使用者的關鍵步驟。此流程會模擬實際的峰值使用情況,以確保工作人員和應用程式可以順利且可預測地處理大量資料。其會驗證解決方案不僅正確,也可調整。

部署 AI 工作人員是一種受管理流程,專注於確保已驗證的工作人員是使用者以可靠且可重複的方式進行互動的方式。這需要結構化方法,將工作人員從版本控制的資產移至即時的監視服務。

封裝與版本控制:工作人員的整個定義 (包括其提示和工具) 會作為中繼資料在檔案中加成,並儲存在如 Git 等來源控制系統中。這會建立單一事實來源,以及所有變更的可稽核歷程記錄。
CI/CD 銷售管道:將生產路徑自動化,以消除人為錯誤並確保一致性。這些管道會透過開發、測試和生產環境自動升級工作人員,並在每個階段執行端對端測試,以作為品質門。
階段化首展策略:為了儘量降低風險,新工作人員版本會先使用如「Canary 版本」等策略,發佈給少量使用者子集。這可在完整首展之前進行實際效能監視,並可在發現任何問題時快速回復。
啟用與管治:首展工��人員的重要步驟是安全地啟用具有正確權限的工作人員,並確保其與監視工具連線。這可讓您立即瞭解新部署工作人員的健康與績效,從工作人員上線開始。

部署並非「工作人員開發生命週期」的結束,而是連續「外部迴圈」的開始。工作人員是動態系統,在無法預測的真實環境中運作。此階段專門觀察工作人員的即時績效、從其互動中收集洞察,並使用該資料以系統地精簡並改善其在一段時間內的效率、安全性和效率。

即時效能監視:這是追蹤工作人員與使用者互動時關鍵營運度量的作法。顯示面板用於監視延遲、權杖耗用 (成本) 和 API 錯誤率,提供工作人員健康與效率的立即高層級檢視。
行為與 Success Analytics:這涉及分析對話記錄,以瞭解工作人員如何實際執行其工作。其著重於追蹤工作完成率、識別常見失敗點或對話式「無效結束」,以及測量使用者滿意度,以判斷工作人員是否成功達成目標。作為服務工作人員的範例,其可提供工作人員升級為人類的頻率與原因度量。
智慧調整和精簡:這是使用監視洞察以改善工作人員的已啟用流程。這可以從提示工程到工具最佳化之間。
資料驅動 RAG 增強功能:工作人員的 Knowledge 庫品質會根據實際查詢持續改善。監視可能會顯示工作人員在處理特定主題時遇到困難,進而改善資料來源的精準度,或改進提取流程 (RAG 精簡),以改善回應的準確度。
持續學習與適應:這涉及建立回饋意見迴圈,其中會使用生產資料讓工作人員變得更聰明。透過標記互動記錄 (無論是透過人體監督或以 LLM 為基礎的標籤),會建立精密設計的資料集,可用來微調基本模型並建議進一步改善

Agentforce 透過設計、開發、測試、部署、監視和分析的整合工具支援每個 ADLC 階段,全都位於單一統一平台內,可快速建立和測試強大的工作人員。

Agentforce ADLC 以下列指導原則為基礎:

針對低程式碼和專業程式碼建立:支援以組態為基礎的部署 (低程式碼) 和程式設計擴充性 (Pro-code)。
持續 AI 驅動的協助與回饋意見迴圈:收集並分析對話資料,以便工作人員針對持續 AI 驅動的改善進行調校。
所有層級的測試驅動開發:跨所有階段進行嚴格測試、透過傳統單元測試驗證決定性元件,並提供測試工作人員推理和非決定性行為的新方法。
執行與 LOB 觀察性:為營運和執行利害關係人提供成本、用量和績效度量。

本章說明 Agentforce 如何 在單一統一平台中支援 ADLC 的各個階段。

計畫

計畫階段是 ADLC 的基礎階段,其中會針對工作人員制定初始願景與需求。它涉及深入瞭解問題、識別潛在解決方案,以及概述工作人員的核心功能。

透過定義主要屬性來啟動工作人員的計畫流程:

目標/目標:清楚定義工作人員的主要目標。計畫要解決的特定問題為何,或計畫要完成的工作為何?工作人員應為哪些人員服務?這應該是簡要且可測量的陳述式,可引導整個開發程序。
角色:為工作人員開發詳細的角色。這包括定義其身分、通訊樣式,以及其在與使用者或其他系統互動時要扮演的角色。考量其語氣、形式層級,以及在預期內容中有效的任何特定特性。
模式:識別並連結至相關的工作人員模式和實作策略。這涉及可告知工作人員結構和行為的結構設計或最佳作法。「Salesforce Agentforce 上的工作人員模式與實作:「技術白皮書」作為此步驟的重要資源,提供 Salesforce 平台和 Agentforce 上有效工作人員設計的洞察。

設計

設計階段會將概念從計畫轉換為工作人員建構的詳細藍圖。這涉及定義工作人員的結構、使用者流程、互動模型,以及如主題、工具和護欄等技術規格。

在設計階段期間,您會為工作人員的建構建立詳細藍圖,其中包括:

工作人員設計:概述工作人員的內部結構,包括其元件、模組及其互動方式。這可能涉及定義 Knowledge 庫、組態和邏輯來控制工作人員行為、自然語言處理 (NLP) 元件,以及與其他系統的整合點。
使用者流程/互動設計:對應完整的使用者旅程和工作人員的互動。定義對話流程、決策樹狀結構、錯誤處理和回饋意見機制,以建立直覺式且有效的體驗。
技術規格:記錄工作人員的技術非功能需求,例如效能度量、延展性考量事項、安全性通訊協定和整合規格。
原型與模型:建立工作人員介面和互動的視覺呈現或互動原型。這允許提早測試和回饋意見,協助在開始全規模開發前限定設計。
資料:決定工作人員需要的資料類型與來源時,請識別工作人員必須存取的資料集、API、資料庫和存放庫。針對 Agentforce,請專注於作為內容提供的資料、結構化或非結構化,以及即時或批次資料。Agentforce 平台與 Data 360 進行深度整合,可讓您使用 Salesforce CRM 和其他來源的結構化與非結構化資料。非結構化內容可以原生地針對 RAG 分割和編製索引。MuleSoft 可讓您連線至外部系統。
工具:識別工作人員必須執行的動作。使用 Agentforce 動作公開可達成業務目標的工具。這些動作利用現有的 Salesforce 資產,例如透過提示詞產生器、MuleSoft、Apex、Flow 和 API 使用 OpenAPI 規格的提示。任何「可叫用動作」可整合至 Agentforce 並由工作人員使用,使所有熟悉的 Salesforce 開發工具可立即作為 Agentforce 動作使用。
工作人員輸入資料:在傳統 SDLC 中,會精確指定輸入。在 ADLC 中,輸入通常是自然、非決定性的自由格式說話方式。收集預期會產生適當回應的代表說話方式。

開發階段著重於將在「計畫」和「設計」階段中決定的已定義工作人員目的、能力和作業範圍轉換為新的 Agentforce Agent。

為了協助開發人員建立工作人員,Agentforce 同時提供 Agent Builder 和 **Agentforce 開發人員體驗 (AFDX)。**這些基礎工具可作為建構和設定工作人員的主要環境。

工作人員產生器提供 UI 體驗,用於定義工作人員的核心功能。
AFDX 提供程式設計介面,可用於自訂和與其他系統整合。

開發和建立工作人員包含下列可使用「工作人員產生器」或 AFDX 執行的步驟:

定義個性人物:工作人員設計的關鍵層面是建立獨特的角色。這涉及設定:
- 工作人員描述:工作人員角色的詳細描述、目標,以及其設計要處理的特定客戶服務工作。
- 語調:工作人員的溝通風格、同理程度,以及其需要遵循的任何特定品牌指導方針。
定義工作人員主題與動作:若要讓工作人員更精密且能夠處理各種工作,將其功能分成不同的主題,並使用對應的動作是非常重要的。
- 主題:每個主題都可以使用獨特的指示與工具集,以專門工作人員的方式進行概念化。
  - **模組結構。**主題的模組化方法可提供更大的組織與延展性。透過定義多個主題,工作人員可以處理更廣泛的複雜案例陣列。例如,工作人員可能會有「訂單管理」、「常見問題」(FAQ)、「技術支援」和「帳單查詢」的個別主題。
- 主題指示 (護欄):每個主題都隨附作為護欄的特定指示,定義工作人員可在該主題中討論或執行的範圍。這些指示可防止工作人員偏離主題或提供不相關的資訊。它們也有助於維持回應的一致性和準確性。
- 動作:主題也具備「工具」,代表工作人員可以採取的動作。這些工具可以是:
  - 資訊動作:從 Knowledge 庫或外部系統提取資料以回答查詢。
  - 交易動作:代表使用者執行動作,例如下單、更新客戶記錄或起始退款流程。這些動作通常會與其他系統整合 (例如 CRM、ERP)。

評估 AI 工作人員的效能與可靠性時,測試人員通常會遇到一系列可能降低使用者體驗的挑戰。這些問題涵蓋從誤解使用者意圖到無法正確執行工作。

常見的工作人員失敗案例

建立強大的工作人員需要瞭解其如何與何處會失敗。下表將在工作人員生命週期期間遇到的常見問題分類,從邏輯錯誤到 Knowledge 不良。使用此作為開發期間的策略指南,以及測試期間的檢查清單,以確保工作人員不僅具有功能,而且對一般使用者來說也是可靠且直覺的。這些失敗情況應協助您定義測試個案。

種類	描述	失敗範例
主題分類	工作人員無法正確識別使用者的意圖或目標。	針對指定的查詢觸發不正確的主題。通常會不當地預設為「離主題」分類。
回應品質	工作人員回覆的內容、準確性和格式失敗。	提供未從其 Knowledge 庫來源的未奠基資訊。產生其指定網域專長之外的回應。儘管參照有效來源,仍包含不正確的資訊。傳送過長的訊息,這對於行動使用者而言特別有問題。
動作執行	工作人員在嘗試執行特定功能或工作時失敗。	叫用錯誤的動作或非預期的動作。傳回錯誤訊息,而非完成要求的動作。不需要建議升級至人類工作人員。無法正確收集使用者的必要輸入變數。
護欄與指示	工作人員違反預先定義的規則、限制或對話界限。	忽略明確的作業指示。針對人類工作人員進行非預期或早期的升級嘗試。在動作執行期間顯示不當的「請保留」訊息。顯示一般錯誤訊息,例如「目前無法提供協助」或「系統錯誤」。
取得Knowledge	工作人員無法從其 Knowledge 庫取得和呈現資訊。	從 Knowledge 庫取得不相關的文章。在回��中包含不必要或不需要的資訊。
結構化指引	工作人員努力引導使用者完成多步驟流程。	提供一般且無根據的疑難排解建議。在單一訊息中呈現過多步驟。在進行中的疑難排解程序期間遺失內容。專注於個別疑難排解步驟。儘管已收到有效的回應,仍會重複問題。

測試 AI 工作人員的最佳作法

以下概述在測試 Agentforce 上的「工作人員」時要記住的最佳作法。

增強測試資料
有效測試的基礎是全方位且實際的測試資料。請遵循下列原則來確保您擁有測試工作人員的有效測試資料:
- 涵蓋範圍足夠:盡量擁有足夠的測試資料,以涵蓋所有重要主題和使用者角色。
- 實際情況:確保您的測試資料準確地代表實際使用者互動。
- 負面與邊緣個案:包含負數測試個案 (工作人員應不執行的項目) 和邊緣案例,以挑戰工作人員的邊界。
- 護欄測試:新增專為驗證工作人員護欄正常運作而設計的特定測試個案。
最佳化測試回合
若要充分利用測試資源,請最佳化您執行測試的方式。以下是測試 Agentforce 工作人員時的考量事項:
- 測試個案量:您最多可以利用 1,000 個測試個案。
- 執行同時測試:您可以在 10 小時內一次最多執行 10 個測試個案。
- 管理資源:請注意,執行測試會耗用點數。開始執行之前,請確保您對測試資料感到滿意,以避免產生不必要的成本。
檢閱結果
仔細分析測試結果以找出改善的區域:
- 分析失敗:個別檢查每個失敗的測試個案。請仔細閱讀並瞭解預期結果與實際結果之間的差異,以找出問題。
- 使用 Sandbox 環境:測試工作人員可以修改 CRM 資料。若要避免即時資料發生非預期的變更,請一律在非生產環境中進行測試,例如 Sandbox 或臨時組織。
調整和重試
測試是一種反覆的流程,會隨著工作人員的發展繼續進行:
- 連續測試:在每次修改工作人員主題或動作後執行測試。這會驗證變更並確保維護品質。
- 展開測試涵蓋範圍:使用新的測試個案持續精密設計與展開資料集,以改善工作人員的整體涵蓋範圍和強大性。

測試方法

由於工作人員的複雜性,因此沒有單一測試方法足夠。必須將全方位驗證策略分層,結合不同的方法來涵蓋從可預測的決定性動作到其非決定性對話行為的細微差別。這些方法提供可系統評估工作人員每個元件的架構,以確保其是強大、可靠且安全的。

使用工作人員模擬器和計畫追蹤器進行手動測試
- 目的:這是測試工作人員的初始方法,通常是最簡單的方法。適用於一小組範例使用個案,以及深入瞭解工作人員行為。
- 機制:工作人員模擬器提供一個受控制的環境,開發人員和管理員可在此環境中直接與工作人員互動。此模擬器可詳細追蹤管理員/開發人員提供的資訊,提供工作人員如何處理輸入和產生輸出的洞察。
- :益處
  - 快速回饋意見
  - 容易識別立即問題
  - 協助瞭解工作人員的邏輯流程
使用測試中心或 AFDX 測試套件進行自動測試
- 目的:手動測試建立功能基準後,自動測試對於延展性、完整性和迴歸測試而言至關重要。
- 機制:如測試中心或 AFDX 測試套件等工具可根據預先定義的範例使用個案來產生自動測試。這些測試的設計目的為驗證工作人員的指示和子工作人員分類是否在更廣泛的案例中正確運作。
- :益處
  - 確保一致的效能
  - 識別細微錯誤
  - 支援連續整合/連續部署 (CI/CD) 銷售管道
  - 提供全方位涵蓋範圍
使用 Apex 和流程進行動作特定單元測試
- 目的:驗證在工作人員動作內壓縮的決定性業務邏輯。雖然工作人員的整體行為並非決定性,但工作人員動作通常由流程和 Apex 等技術提供技術支援,這些技術適用於標準開發作法。
- 機制:開發人員會針對工作人員動作叫用的特定流程或 Apex 類別撰寫單元測試。這些測試會驗證工作人員邏輯的個別元件,確保其產生指定輸入集的預期輸出。
- :益處
  - 將這些單元測試整合至 DevOps 管道可提供自動化的安全網路
  - 驗證動作邏輯的任何變更或增強項目不會導致迴歸
  - 部署至生產環境前,確保工作人員功能的可靠性
敵對測試 - 安全性與護欄強制執行:
- 目的:建立各種工作人員需要強調安全性,並確保其在定義的參數和護欄內作業。這對於防止非預期的動作、資料缺口或不當使用而言至關重要。因此,敵對測試的目的是主動識別並修復這些潛在漏洞,方法是使用專為略過其安全機制而設計的輸入來刻意挑戰工作人員,進而測試其穩定性和反操作性。
- 機制:反向測試透過製作具有挑戰性的、不明確的或惡意的輸入來實作,這些輸入會推動工作人員預期行為的限制。當平台工具 (例如「工作人員產生器」中的「護欄」功能) 提供指示符合度的洞察時,開發人員也應建立自訂的敵對測試個案,以主動嘗試在受控制的環境中讓工作人員失敗。
- :益處此方法會在部署前系統降低安全性和合規性風險。透過識別潛在失敗點,敵對測試可增強工作人員的可靠性,並確保工作人員在與使用者互動時安全且如預期運作。

在臨時組織和 Sandbox 中重複測試

「內部迴圈」是重要且反覆的循環,工作人員從概念移至已驗證元件,準備好進行部署。此流程的持續精簡需要開發和測試的環境。Agentforce 透過臨時組織提供此架構,其為隔離的臨時組織、不影響共用環境的快速原型化暫時環境,以及 Sandbox,其可使用實際資料進行全面測試,以加速生產的路徑。

臨時組織中的開發:初始開發應在臨時組織中發生。開發環境中提供的工具 (例如工作人員產生器和 AFDX) 可在此充分運用。臨時組織是 CI/CD 管道的強大候選項目,可執行單元測試、執行程式碼分析,並升級更高環境的變更。
部署至 Sandbox 以進行實際資料測試:在臨時組織中開發工作人員的核心功能後,請部署至 Sandbox。Sandbox 是生產環境的複本,提供更實際的測試場地。
- 實際資料與模擬資料:雖然某些開發人員可能會模擬臨時組織中的資料以進行初始測試,但部署至 Sandbox 可使用「實際資料」進行測試。這對於在密切反映實際客戶互動的情況下評估工作人員績效而言至關重要。在 Sandbox 中使用更具代表性的資料可大幅加快開發和精簡流程。
- 核心 CRM 資料的完整或部分 Sandbox:視資料量和特定測試需求而定,可利用完整或部分的 Sandbox。
  - 完整 Sandbox:提供生產環境的完整複本,包括所有中繼資料與資料。適用於大量測試和效能調整的大型資料集。
  - 部分 Sandbox:包含生產資料的子集,通常足以測試不嚴格需要完整資料集的特定功能。
- Knowledge 與 RAG 管理:如果工作人員依賴 Knowledge 庫或「取得增強型產生」(RAG) 模型,請將所有相關內容匯入 Sandbox 並重新編製索引。這可確保工作人員在測試期間使用最新資訊,並能準確地提取和合併內容。

Agentforce 透過中繼資料定義工作人員,因此可以使用標準 Salesforce 程序 (例如「變更集」或 AFDX) 來部署工作人員。此階段透過如工作人員版本化和個別啟用步驟等重要功能強調安全且受控制的首展,以確保系統穩定並允許快速復原問題。

請遵循下列步驟來部署並釋出您的新工作人員。

透過 Change Set/Metadata API 或 AFDX 部署:工作人員的部署流程利用標準 Salesforce 程序,將工作人員視為中繼資料。這應該是熟悉 Salesforce 開發和部署的任何人所熟悉的流程。利用變更集或 AFDX 可確保在環境之間移轉工作人員組態的結構化和一致方法,例如從 Sandbox 移轉至生產。此方法可協助版本控制和適當的變更管理,這對維護系統穩定性和可靠性至關重要。
啟用工作人員後續部署:成功部署後,系統管理員必須主動「啟用」工作人員。部署只會將工作人員的程式碼和中繼資料放入目標環境;啟用是讓工作人員運作且可供使用的步驟。在工作人員成為上線並與一般使用者或其他系統元件互動之前,此分隔允許控制的首展和測試。
使用版本化來安全管理工作人員:工作人員版本化是重要功能,可大幅提升工作人員開發和維護的安全性和彈性。
1. 建立、測試和發佈新版本:建議的作法涉及在需要變更或增強時建立工作人員的新版本。接著,您可以在 Sandbox 環境中全面測試此新版本,而不會影響已啟用的即時工作人員。新版本經過驗證且視為準備就緒後,便可發佈並後續啟用,以取代先前的作業版本。此反覆流程允許持續改善和創新,同時儘量減少中斷。
2. 回復至舊版:版本化的主要優點是,如果新部署或啟用的工作人員發生問題,則能夠快速輕鬆還原為先前的穩定版本。如果發生錯誤 (例如,如果工作人員發生錯誤或發生非預期的錯誤),管理員可以簡單地回復至最後一個已知的版本並加以啟用。此功能提供重要的安全網路,可快速復原並將停機時間降到最低,進而確保業務連續性與使用者滿意度。

工作人員監視

Agentforce 工作階段追蹤是以 Data 360 為基礎建立的可擴充、開放式模型,此模型可進行端對端工作人員的互動。Agentforce 工作階段追蹤會從不同的來源 (從推理引擎記錄開始) 提取資料,並在工作階段識別碼下結合所有內容。

工作階段追蹤資料模型 (STDM) 提供工作人員工作階段期間發生的情況詳細資訊,包括:

逐一互動
引擎執行的理由
動作、提示與門戶輸入/輸出
錯誤訊息
最後回應

STDM 是協助開發人員執行以下動作的重要工具:

在建立期間除錯工作人員設定和組態問題。
瞭解特定測試個案在批次測試期間失敗的原因。
說明工作人員無法處理一組使用者問題或離開主題的原因。

開發人員應使用此工作階段追蹤資料來觀察、監視、調查和疑難排解工作人員事件、事件和行為模式。

STDM 包含資料湖物件 (DLO) 和資料模型物件 (DMO),這些物件會儲存工作人員行為的詳細記錄。邏輯引擎對每個 LLM 呼叫的相關中繼資料可與回饋意見或護欄度量聯結。資料會串流至 Data 360 中的 DLO,並對應至適用的 DMO。

開發人員可以根據 STDM 執行查詢和報告,來存取此資料並取得洞察。以下描述 STDM 的元件。

Agentforce 工作階段追蹤資料模型 ERD

資料湖物件/資料模型物件	描述
AIAgentSession	與一或多個 AI 工作人員連續互動的整體容器。
AIAgentSessionParticipant	參與 AIAgentSession 的實體 (人類或 AI)。
AIAgentInteraction	工作階段內的區段。它通常會從使用者的要求開始,並在 AI 工作人員對該要求提供回應時結束。
AIAgentInteractionStep	在互動期間執行以滿足使用者的要求的離散動作或作業。
AIAgentInteractionMessage	由使用者提供或由 AI 工作人員在工作階段期間產生的單一通訊。

Agentforce 最佳化

Agentforce Optimization 是一個強大的功能,其設計目的為透過提供使用者互動的深入洞察來增強 AI 工作人員的效能。此模型以「工作階段追蹤資料模型」(STDM) 的分析功能為基礎,可讓管理員和開發人員瞭解使用者主題、參與模式,以及工作人員解決方案的成效。

Agentforce 最佳化的關鍵層面包括:

時間特定的資料 Optimization 會透過導入「時刻」來擴充 STDM,其代表在工作階段期間專注於特定使用者意圖或要求的互動。此細微資料允許詳細檢查互動的��個層面,從初始使用者要求到工作人員的解決方案。
自動化時刻處理:系統會每天產生時刻,然後使用進階的大型語言模型 (LLM) 每週在所有啟用中工作人員之間進行叢集和標記。此區段可簡化查詢,並提供工作人員工作階段各面向的洞察。
查詢與分析:使用者可以根據標記、品質分數和其他條件來查詢「時刻」。這可透過如「 Moment」持續時間和相關性品質分數等度量來評估使用者參與,協助找出改善的區域。
統一資料模型 最佳化利用統一工作階段追蹤資料模型 (STDM),此模型會在工作階段內捕捉每個記錄的事件,包括個別對話輪數。設定中啟用 STDM 時,會佈建所有相關實體。

透過分析 AI 工作人員的互動,Agentforce 最佳化可讓使用者找出可改善的區域,並限定組態以更符合使用者需求。

如需詳細資訊,請參閱 Agentforce 最佳化的資料模型。

本章是程式碼開發人員的實際指南。其中顯示如何使用 Agentforce DX (AFDX) 和我們的 Python SDK 快速安全地建立、測試和部署工作人員。我們會使用 AFDX 和 Python SDK 的強大組合,逐步完成整個生命週期,從初始設計到版本控制的工作人員。

下列範例會利用專為在 Agentforce 平台上建立和管理工作人員所設計的兩個關鍵工具集。建議您基本瞭解這些工具,以充分利用此指南。

1.Agentforce DX (AFDX):用於管理生命週期

Agentforce DX 擴充了熟悉的 Salesforce 開發人員體驗 (SFDX) 工具集,包括 Salesforce CLI 和 VS 程式碼擴充功能,以支援整個工作人員開發生命週期。其用於管理工作人員作為版本控制的中繼資料、從指令行自動化測試,以及協調您開發 Sandbox 與生產之間的部署。

若要深入瞭解,請參閱:開始使用 Agentforce DX Development。

2.Agentforce Python SDK:建立工作人員

Python SDK 提供開發的「內部迴圈」程式設計介面。它可讓您定義工作人員的推理邏輯、連線其工具,並直接在熟悉的 Python 環境中管理提示範本,以簡化 ADLC 的核心建構階段。

SDK 適用於 PyPI:https://pypi.org/project/Agentforce-sdk/。

完整的專案可在這裡找到:
https://github.com/akshatasawant9699/ADLC_Whitepaper。

此基礎階段會定義工作人員的目的、角色和核心功能。它涉及在撰寫任何程式碼之前回答重要問題,以架構工作人員的「頭腦」。在此範例中,我們正在為 Coral Cloud Resorts 設計工作人員。

任務:工作人員會擔任度假村經理,處理客戶的抱怨、管理員工排程,並確保度假村運作順利。
角色:工作人員有幫助、專業和對話的語氣。
工具與功能:工作人員需要存取保留系統、員工排程軟體和度假村原則。
決策邏輯:工作人員使用 AI 產生的主題來決定使用者的意圖並產生適當的動作。

透過 Agentforce DX,設計階段會翻譯為具體的規格檔案:Agentforce DX:產生工作人員規格。專業程式碼旅程中的第一步是產生 agentSpec.yaml 檔案。YAML 檔案會捕捉工作人員的核心設計,包括其角色、相關公司詳細資料,以及 AI 產生的主題清單,以定義其可處理的工作。

使用 Salesforce CLI 透過互動提示產生此規格。若要開始使用 Agentforce DX 建立工作人員,請執行:

您需要提供在計畫階段期間定義的特定詳細資料:

工作人員類型:客戶
公司名稱:珊瑚雲度假村
公司描述 Cloud Resorts 為客戶提供卓越的目的地活動、難忘的體驗和預訂服務,所有這些都以提供一流客戶服務的承諾為基礎。
工作人員角色:度假經理可處理客戶的抱怨、管理員工排程,並確保所有流程都順利執行。

執行此指令會在 DX 專案的規格目錄中建立 agentSpec.yaml 檔案。該檔案包含提供的資訊,以及 AI 產生的主題清單,其中包含每個主題的名稱和描述。視需要檢閱並編輯檔案,以限定工作人員的功能。

同樣地,Python SDK 實作使用互動式規格集合,以自動產生具有 SDK 相容性所需適當範圍欄位的工作人員主題。
此外,它會建立完整的工作人員規格 JSON 檔案,此檔案會用於在階段 2 中建立工作人員。

開發階段著重於建構工作人員的核心元件:推理引擎、可使用的工具,以及其 Knowledge 庫。Agentforce 會抽出許多複雜性,讓開發人員專注於業務邏輯。

本節分享 Agentforce 開發階段的兩種 Pro-Code 方法。首先,使用 Agentforce DX,然後使用 Python。

Agentforce DX:從規格建立工作人員

在準備好 agentSpec.yaml 檔案後,請在您的 Salesforce 組織中建立工作人員。執行此指令以建立工作人員,並將其相關聯的中繼資料同步回您的本機 DX 專案:

出現提示時,接受預設 API 名稱 Resort_Manager。此指令會剖析規格、建立工作人員,並取回中繼資料。中繼資料包含 機器人、BotVersion 和 GenAiPlannerBundle,其會將 AI 智慧新增至工作人員的主題與動作,並參照工作人員。

透過新增 --預覽 標記來預覽工作人員結構,以產生本機 JSON 檔案,詳細說明 LLM 將建立的工作人員類型,包括建議的動作。例如:

如需詳細資訊,請參閱從 Trailhead 建立 DX 專案的工作人員。

Agentforce Python SDK:定義特定工具

工作人員 SDK 透過建立模擬動作來協助工作人員測試。這些模擬動作最終需要被 Salesforce 中的實際動作取代。Salesforce 提供一系列平台功能,包括「流程」、「Apex」、「提示範本」和「API」,全部皆可壓縮為 Agentforce 動作。

以下是模擬的動作程式碼片段,說明 Agentforce 動作的外觀。

實作會建立與 Salesforce 的連線、建立工作人員例項,並定義工作人員可用來與外部系統互動並執行特定業務功能的自訂工具和動作。

如以上所述,測試工作人員比傳統軟體測試更為複雜。它需要驗證各種案例的行為、推理及穩定性。這包括個別工具的單元測試、對話的端對端測試,以及尋找漏洞的對手測試。

Agentforce DX 除了測試中心和直接測試 API 外,還提供建立、部署和執行測試的高階工作流程。本節示範使用 Agentforce DX 執行測試。

Agentforce DX:執行工作人員測試

使用 Agentforce DX 可直接從指令行執行預先定義的工作人員測試。這非常適合將工作人員測試整合至現代 DevOps 流程。

Agentforce Python SDK:模擬 E2E 和反向測試

在概念上,Python SDK 允許指令檔對話,以模擬端對端 (E2E) 測試並驗證工作人員的推理。

Agentforce Python SDK 與 Salesforce 測試 API

Python SDK 實作使用含 Salesforce Testing API 和 AiEvaluationDefinition 中繼資料的全方位測試,建立具有主題序列、動作序列、字串比對和品質度量的結構化測試個案。系統會產生可部署至 Salesforce 的 XML 中繼資料定義,以進行自動工作人員測試和驗證。

驗證後,工作人員便會部署至生產環境。在此階段期間,Agentforce DX 對協助管理和在不同組織之間移動工作人員中繼資料 (例如 Sandbox 與生產) 至關重要。工作人員部署會建立工作人員的新版本,且在您明確啟用工作人員之前,工作人員不會上線。這可讓您完全控制何時發行工作人員的新版本。

Agentforce DX:部署工作人員中繼資料

標準 Salesforce DX 專案結構會在 force-app 目錄下組織工作人員中繼資料。使用標準 sf project deploy 指令將工作人員及其相關聯的測試部署至目標組織。

建立或部署工作人員後,您可以直接在 Agentforce Builder UI 中開啟工作人員,以執行以下方式來驗證其組態:

驗證工作人員已部署後,您可以將其啟用。如果您遇到任何非預期問題,請回復至先前的工作人員版本。

Agentforce Python SDK:部署工作人員部署

實作會取用已驗證的工作人員規格,並將其部署至 Salesforce 組織,讓工作人員可供使用。部署流程包括工作人員建立、中繼資料同步化,以及驗證成功部署。

ADLC 是連續的週期;部署並非結束。工作人員是即時系統,需要持續監視才能追蹤如延遲、成本和成功率等度量。從監視取得的洞察會透過提示工程、工具最佳化和精簡 Knowledge 庫,用於調整和改善工作人員績效。

Agentforce 平台提供全方位的顯示面板和分析以支援此關鍵階段,確保工作人員會隨著時間繼續發展和改善。

Agentforce Analytics

Agentforce Analytics (位於 Agentforce (預設) 資料夾中) 使用 Data 360 來提供工作人員績效的洞察。可自訂的顯示面板和報告提供使用情況、回饋意見和用量的資料,協助您限定主題和動作以提升使用者滿意度。您可以按一下圖表或連結的報告來逐層細分結果。若要自訂,請複製現有報告並修改複本,以避免中斷分析流程。

說話方式分析

「說話方式分析」會顯示 Agentforce (預設) 使用者如何使用工作人員、他們要求的內容,以及工作人員是否能夠處理這些要求。這些可自訂的報告可協助您限定主題與動作,讓工作人員更有效且準確地回應。

Agentforce Python SDK:使用 Data 360 整合監視

工作人員 SDK 實作使用 Data 360 Python 連接器的進階監視與分析、建立 Salesforce Data 360 的連線、查詢工作人員效能度量,以及建立全方位監視顯示面板。
系統會追蹤回應時間、成功率、使用者滿意度和成本度量,以提供工作人員最佳化的可採取動作洞察。

Agentforce DX:工作人員監視

此實作使用標準 AFDX 指令搭配 CLI 型工作人員管理,讓工作人員掌握平台變更的最新資訊,並納入使用者回饋意見以持續改善。

如需使用工作人員 SDK 和 AFDX 的 ADLC 實作,請參閱此處的 GitHub 存放庫。

掌握工作人員開發生命週期需要遵循一組核心原則,以確保效率、可靠性和策略一致性。下列指導方針會將 ADLC 每個階段的重要教訓合併為結構設計師和開發人員的策略架構。

1.規劃和計畫

此初始階段著重於使工作人員的目標與業務目標保持一致,並確保其建立在堅實的基礎上。

排定業務影響的優先順序:從直接將潛在使用個案對應至策略業務目標開始。使用優先順序矩陣來評分其潛在影響,並從具有明確 KPI 的單一、專注使用個案開始。
及早參與利害關係人:收集有關難題的洞察,並確保對齊。
利用資料洞察:工作人員與其資料相同。使用 Data 360 探索可用的結構化與非結構化資料,以通知工作人員的內容與功能。檢閱現有報告和顯示面板,以識別可通知您使用個案選取的目前趨勢。
使用計畫架構:將結構化計畫方法套用至集意和精簡潛在應用程式,例如設計思維或 SWOT 分析。

2.建立工作人員

此階段涵蓋建立高績效且高效率的工作人員的最佳作法。

避免過多主題:限制主題數目,以降低建立可能讓工作人員混淆之類似或重疊主題的風險。
將指示與提示保持精簡:使用直接、簡單的語言,並提供範例說話方式來有效引導工作人員。
杠杆變數與決定性動作:使用這些工具可引導工作人員的行為,並最佳化其效能以取得更可預測的成果。
讓動作輸出保持簡短:請確保工作人員的回應簡短且精確。較長的輸出使用更多內容,產生速度較慢。
最佳化速度的動作:設計流程和 Apex 類別以傳回最少的必要資料。盡可能透過預先處理來產生回應所需的動作減少。
定義清除範圍:撰寫適當的動作描述、指示和範圍,以防止工作人員針對超出範圍的問題呼叫 RAG (Retrieval-Augmented Generation)。
謹慎使用混合搜尋:僅在絕對必要時使用混合搜尋,因為這會對延遲造成負面影響。

3.測試、監視和調整

此反覆階段對於精簡工作人員準確性和效能而言至關重要。

建立測試流程:遵循一致的測試週期:
1. 執行批次測試:執行一組全方位的測試。
2. 檢視分數/錯誤:分析效能度量並識別失敗。
3. 檢查失敗:檢查每個失敗列以瞭解不一致。
4. 更新工作人員:對工作人員或其評估資料進行必要調整。
檢閱工作階段追蹤資訊:使用「工作階段追蹤資料模型」和 Agentforce Interaction Explorer,在發現問題或非預期行為時執行根本原因分析。根據資訊調整工作人員,並繼續重複處理工作人員。

工作人員開發生命週期代表傳統軟體開發原則的關鍵演進,針對智慧型自發系統的時代而設計。

進化,而非取代:「工作人員開發生命週期」會延伸並增強傳統的「應用程式生命週期管理」,而不會加以取代。
資料為一流公民:資料在工作人員開發中扮演更為動態且中心的角色。
專業工具與技能:需要新工具和資料科學、ML 工程和工作人員開發之間更廣泛的專門技能。
持續學習:工作人員開發會增加系統本身的持續學習和調整。
未來影響:工作人員 AI 承諾會進一步自動化和最佳化複雜的 IT 作業和軟體開發工作流程。

計畫

設計