Questo testo è stato tradotto utilizzando il sistema di traduzione automatica di Salesforce. Partecipa al nostro sondaggio per fornire un feedback su questo contenuto e dirci cosa vorresti vedere dopo.
Nello sviluppo software tradizionale, il Ciclo di vita dello sviluppo software (SDLC) offre un approccio strutturato e scaglionato alla creazione di applicazioni. Stabilisce la qualità, riduce i rischi e fornisce una roadmap chiara dall'idea al rilascio. L'ADLC (Agent Development Lifecycle) è una metodologia simile che è distintamente personalizzata per affrontare le complessità specifiche della creazione di agenti autonomi.
Gli agenti non sono applicazioni passive; sono sistemi che ragionano, agiscono e apprendono all'interno di ambienti di esecuzione dinamici. Il loro comportamento non deterministico rende insufficiente il controllo di qualità tradizionale. L'ADLC (Agent Development Lifecycle), promosso da piattaforme come Agentforce, affronta questo aspetto in cinque fasi: Ideazione e progettazione, sviluppo (il "loop interno"), test e convalida, distribuzione e monitoraggio e messa a punto continui (il "loop esterno").
Questo documento funge da guida completa per gli sviluppatori e gli architetti Enterprise che hanno già familiarità con le complessità del ciclo di vita dello sviluppo software (SDLC) e desiderano espandere la loro esperienza nei sistemi basati sugli agenti. Il nostro obiettivo principale è facilitare una comprensione rapida del ciclo di vita dello sviluppo degli agenti (ADLC) evidenziandone le distinzioni chiave dalle metodologie SDLC tradizionali e fornendo un framework strutturato per concettualizzare l'intero processo di creazione, distribuzione e gestione degli agenti intelligenti.
Il documento è organizzato in tre capitoli distinti, ciascuno progettato per costruire progressivamente le tue Knowledge e abilità pratiche:
- Capitolo 1: Framework ADLC. Questo capitolo introduce l'ADLC (Agent Development Lifecycle), descrivendone le differenze rispetto all'SDLC a causa delle sfide specifiche dello sviluppo di agenti autonomi. Stabilisce un framework per la progettazione, lo sviluppo, il test e la distribuzione degli agenti.
- Capitolo 2: Agentforce Platform. Questo capitolo esplora Agentforce, una piattaforma unificata che semplifica e accelera l'intero ciclo di vita dello sviluppo degli agenti. Agentforce offre strumenti per la progettazione degli agenti, l'elaborazione dei dati, l'addestramento dei modelli, la distribuzione e il monitoraggio continuo, semplificando le operazioni complesse e migliorando l'efficienza.
- Capitolo 3: Implementazione pro-codice. Questa guida utilizza gli strumenti pro-code di Agentforce per fornire istruzioni pratiche e dettagliate ed esempi concreti per lo sviluppo degli agenti. Copre l'intero ciclo di vita dello sviluppo degli agenti, dalla prototipazione e l'ingegneria delle funzioni alla distribuzione del modello, al perfezionamento delle prestazioni e alla manutenzione, fornendo agli sviluppatori le competenze necessarie per creare agenti pronti per la produzione.
Questo documento si propone di fornire le Knowledge teoriche e pratiche degli strumenti pro-code di Agentforce. Imparerai a creare, distribuire e monitorare gli agenti in modo efficiente, sicuro e affidabile, acquisendo una comprensione completa dell'ADLC e massimizzando il potenziale di Agentforce nello sviluppo intelligente degli agenti.
La natura non deterministica degli agenti AI richiede un framework di sviluppo specializzato. Questo capitolo descrive questo framework introducendo l'ADLC (Agent Development Lifecycle). Questo capitolo offre una panoramica completa delle cinque fasi centrali dell'ADLC, dall'ideazione e progettazione iniziali al monitoraggio e alla messa a punto continui. Questo capitolo stabilisce le Knowledge di base necessarie per creare agenti affidabili e affidabili.
Questa sezione mappa i concetti SDLC alle cinque fasi dell'ADLC.
Questa è la fase fondamentale in cui vengono definiti lo scopo strategico e i confini operativi di un agente. Una fase di progettazione ben strutturata è il passaggio più critico per il successo, poiché traduce un'esigenza aziendale in un modello tecnico. Il processo di progettazione garantisce che l'agente non sia solo funzionale ma anche responsabile e in linea con le aspettative degli utenti. È dove il "cosa" e il "perché" vengono stabiliti prima di scrivere qualsiasi codice.
- Definizione di obiettivi e funzionalità degli agenti: Innanzitutto, è necessario articolare chiaramente l'obiettivo principale dell'agente e le operazioni specifiche e misurabili che eseguirà. Ciò comporta la definizione del suo ruolo (ad esempio, "Assistente dell'assistenza clienti"), delle sue funzioni centrali (ad esempio, "prenotazione di appuntamenti", "risposta a domande sui prodotti") e delle metriche di successo per ciascuno di essi.
- Creazione di guardrail personali ed etici: Questo passaggio prevede la progettazione della personalità dell'agente e la definizione dei suoi confini etici per garantire che sia affidabile e sicuro. Stabilisce il tono dell'agente (ad esempio, "formale", "amichevole") e implementa regole rigorose per prevenire risposte dannose, distorte o inappropriate.
- Mappatura del contesto e comprensione: È necessario determinare quali informazioni l'agente deve comprendere e ricordare per essere efficace. Ciò include la definizione dell'ambito della sua Knowledge Base e della sua memoria conversazionale, che consente di avere conversazioni coerenti e a più turni.
- Identificazione di strumenti e integrazioni di sistemi: Ciò comporta l'inventario dei sistemi esterni, delle API e delle fonti di dati con cui l'agente deve connettersi per eseguire le operazioni. Ogni strumento (ad esempio, un'API di prenotazione, un database clienti) viene identificato e la sua funzione viene mappata a una funzionalità specifica dell'agente.
- Piano per l'inoltro al livello superiore di Human-in-the-Loop: È fondamentale definire le condizioni in cui un agente passa a un essere umano. Ciò comporta la revisione dei potenziali punti di errore e dei "punti morti" della conversazione per determinare quando un agente deve passare a un operatore umano. La progettazione deve descrivere come verrà eseguito questo trasferimento per garantire che venga trasferito un contesto sufficiente, in modo che possa essere utilizzato rapidamente per garantire un'esperienza cliente senza interruzioni.
Questa è la fase di costruzione pratica in cui il modello di progettazione viene trasformato in un agente funzionale. Gli sviluppatori creano l'agente, lo collegano ai suoi strumenti e gli forniscono i dati necessari per svolgere le proprie mansioni. Questo "anello interno" iterativo di costruzione e raffinazione è il punto in cui l'agente prende veramente vita.
- Configurazione della logica e del processo decisionale dell'agente: Questo passaggio prevede la definizione del ragionamento dell'agente collegando il suo framework decisionale al contesto, agli strumenti e alle fonti di dati. Il ruolo dello sviluppatore è definire il comportamento dell'agente creando API o riutilizzando API esistenti, impostando guardrail operativi e specificando in che modo l'agente seleziona e utilizza gli strumenti disponibili per completare operazioni complesse in più fasi.
- Prompt tecnici e modelli di fine-tuning: Il profilo, le istruzioni e i vincoli dell'agente vengono codificati attraverso una meticolosa progettazione rapida. Questo processo prevede la creazione del prompt principale che guida il modello Large Language (LLM) e, per i casi d'uso più avanzati, l'ottimizzazione del modello sui dati specifici del dominio per migliorarne le prestazioni.
- Integrazione e protezione degli strumenti AI: Le funzioni e le API identificate durante la fase di progettazione sono collegate all'agente. Utilizzando un SDK, gli sviluppatori inseriscono le funzioni esistenti o ne creano di nuove, rendendole chiamabili in modo sicuro dall'agente e assicurando che dispongano dell'autenticazione e della gestione degli errori appropriate.
- Creazione di dati e opportunità in corso di realizzazione RAG: Per fornire all'agente Knowledge esterno, gli sviluppatori creano le pipeline di dati per la generazione aumentata di recupero (RAG). Ciò implica la connessione e l'indicizzazione dei dati da fonti come archivi vettoriali, database relazionali, database grafici o documenti interni, rendendo tali informazioni accessibili all'agente per fornire risposte accurate e sensibili al contesto.
Il test degli agenti AI introduce un cambiamento di paradigma rispetto alla convalida deterministica del software tradizionale. Mentre un'applicazione convenzionale viene testata per la correttezza (un input specifico deve produrre un singolo output previsto), la natura non deterministica di un agente richiede un approccio più sofisticato. L'obiettivo non è convalidare una singola risposta corretta, ma garantire che il comportamento dell'agente sia allineato allo scopo previsto, sia efficace contro input imprevisti e rimanga affidabile in una gamma di risultati accettabili.
- Test di unità: Questo livello si concentra sui componenti deterministici non AI dell'agente. Include test di unità tradizionali per confermare che ogni singolo strumento e funzione funzioni funzioni correttamente isolatamente, garantendo una base affidabile prima di applicare il ragionamento complesso dell'agente.
- Test end-to-end (E2E): Questa fase valuta la capacità dell'agente di raggiungere gli obiettivi in scenari realistici, che è fondamentale data la sua natura non deterministica. Anziché cercare un output esatto, questi test end-to-end verificano che l'agente completi correttamente le operazioni e che le sue prestazioni non peggiorino man mano che vengono apportate modifiche.
- Test del contraddittorio e della robustezza: Questa è la pratica di provare intenzionalmente a rompere l'agente per scoprire in modo proattivo i suoi punti deboli. I tester utilizzano richieste ambigue, prompt dannosi e altri casi limite per esporre le vulnerabilità e garantire che l'agente rimanga resiliente e sicuro sotto pressione.
- Valutazione Human-in-the-Loop (HITL): Poiché i test automatici non possono misurare qualità diverse come il tono o il flusso conversazionale, questa fase si basa sul feedback umano. I tester interagiscono con l'agente per calcolare il punteggio delle sue risposte in termini di utilità e di esperienza utente complessiva, fornendo dati essenziali per perfezionarne il comportamento.
- Test di prestazioni e scalabilità: Questo è un passaggio fondamentale per evitare che le strozzature delle prestazioni abbiano effetto sugli utenti. Questo processo simula scenari di picco di utilizzo realistici per garantire che agenti e applicazioni possano gestire volumi elevati in modo fluido e prevedibile. Verifica che la soluzione non sia solo corretta, ma anche scalabile.
La distribuzione di un agente AI è un processo gestito incentrato sulla garanzia che l'agente convalidato sia quello con cui gli utenti interagiscono in modo affidabile e ripetibile. Ciò richiede un approccio strutturato che sposta l'agente da un asset controllato da versione a un servizio live e monitorato.
- Confezionamento e controllo delle versioni: L'intera definizione dell'agente, inclusi i prompt e gli strumenti, viene acquisita come metadati in un file e archiviata in un sistema di controllo sorgente come Git. Questo crea un'unica fonte di dati veritieri e una cronologia controllabile di tutte le modifiche.
- Pipeline: CI/CD Il percorso verso la produzione è automatizzato per eliminare gli errori umani e garantire la coerenza. Queste opportunità in corso di realizzazione promuovono automaticamente l'agente negli ambienti di sviluppo, test e produzione, eseguendo test end-to-end in ogni fase per fungere da porta di accesso alla qualità.
- Strategie di implementazione graduale: Per ridurre al minimo il rischio, le nuove versioni degli agenti vengono rilasciate per la prima volta a un piccolo sottoinsieme di utenti utilizzando strategie come Rilasci Canary. Ciò consente il monitoraggio delle prestazioni del mondo reale prima di un'implementazione completa, con la possibilità di ripristinare rapidamente eventuali problemi.
- Attivazione e governance: Il passaggio fondamentale nell'implementazione di un agente consiste nell'attivare in modo sicuro l'agente con le autorizzazioni corrette e assicurarsi che sia connesso agli strumenti di monitoraggio. Ciò offre una visibilità immediata dello stato e delle prestazioni dell'agente appena distribuito dal momento in cui viene reso disponibile.
La distribuzione non è la fine del ciclo di vita dello sviluppo degli agenti, ma l'inizio del suo continuo "loop esterno". Gli agenti sono sistemi dinamici che operano in ambienti reali imprevedibili. Questa fase è dedicata all'osservazione delle prestazioni live dell'agente, alla raccolta di approfondimenti dalle sue interazioni e all'utilizzo di tali dati per perfezionare e migliorare sistematicamente l'efficacia, la sicurezza e l'efficienza nel tempo.
- Monitoraggio delle prestazioni in tempo reale: Si tratta della procedura di monitoraggio delle principali metriche operative dell'agente durante l'interazione con gli utenti. I cruscotti digitali vengono utilizzati per monitorare la latenza, il consumo di token (costo) e i tassi di errore API, offrendo una visione immediata e generale dello stato e dell'efficienza dell'agente.
- Analisi comportamentale e di successo: Ciò comporta l'analisi dei registri di conversazione per capire in che modo l'agente sta effettivamente eseguendo le proprie mansioni. Si concentra sul monitoraggio delle percentuali di completamento delle operazioni, sull'identificazione dei punti di errore comuni o dei "punti morti" conversazionali e sulla misurazione della soddisfazione degli utenti per determinare se l'agente sta raggiungendo con successo i propri obiettivi. Ad esempio, per gli agenti dell'assistenza, potrebbe fornire metriche sulla frequenza e sul motivo per cui un agente viene inoltrato a una persona.
- Sintonizzazione e perfezionamento intelligenti: Si tratta del processo attivo di utilizzo degli approfondimenti del monitoraggio per migliorare l'agente. Questo può andare dalla progettazione rapida all'ottimizzazione degli strumenti.
- Ottimizzazione RAG basata sui dati: La qualità della Knowledge Base dell'agente viene continuamente migliorata in base alle query del mondo reale. Il monitoraggio può rivelare che l'agente è alle prese con determinati argomenti, il che porta a un perfezionamento delle fonti di dati o del processo di recupero (perfezionamento RAG) per migliorare la precisione delle risposte.
- Apprendimento continuo e adattamento: Ciò comporta la creazione di un loop di feedback in cui i dati di produzione vengono utilizzati per rendere l'agente più intelligente. Con l'etichettatura dei registri di interazione, con supervisione umana o basata su LLM, viene creata una serie di dati curata che può essere utilizzata per perfezionare il modello sottostante e consigliare ulteriori miglioramenti
Agentforce supporta ogni fase di ADLC con strumenti integrati per progettazione, sviluppo, test, distribuzione, monitoraggio e analisi, il tutto all'interno di un'unica piattaforma unificata per creare e testare rapidamente agenti efficaci.
Agentforce ADLC si basa sui seguenti principi guida:
- Creato sia per codice basso che per codice pro: Supporto per la distribuzione basata su configurazione (low-code) e l'estendibilità a livello di programma (pro-code).
- Assistenza continua basata sull'intelligenza artificiale e loop di feedback: Acquisisce e analizza i dati conversazionali per informare gli agenti sulla messa a punto di un miglioramento continuo basato sull'intelligenza artificiale.
- Sviluppo basato su test a tutti i livelli: Test rigorosi in tutte le fasi, convalidando i componenti deterministici attraverso i test di unità tradizionali e fornendo nuovi approcci per testare il ragionamento degli agenti e il comportamento non deterministico.
- Osservabilità dei dirigenti e dei LOB: Metriche di costo, utilizzo e prestazioni per gli stakeholder operativi e dirigenti.
Questo capitolo mostra come Agentforce supporta ogni fase dell'ADLC all'interno di un'unica piattaforma unificata.
Ideazione
La fase di ideazione è la fase fondamentale dell'ADLC, in cui vengono formulati la visione iniziale e i requisiti per gli agenti. Comprende un'approfondita comprensione del problema, l'identificazione delle potenziali soluzioni e la descrizione delle funzionalità principali dell'agente.
Avviare il processo di ideazione dell'agente definendone gli attributi chiave:
- Scopo/Obiettivo: Definire chiaramente l'obiettivo principale dell'agente. Quale problema specifico si propone di risolvere, o quale compito si intende svolgere? Chi deve servire l'agente? Questa dovrebbe essere una dichiarazione concisa e misurabile che guida l'intero processo di sviluppo.
- Persona: Sviluppare un profilo dettagliato per l'agente. Ciò include la definizione dell'identità, dello stile di comunicazione e del ruolo che svolgerà nell'interazione con gli utenti o altri sistemi. Considerare il tono, il livello di formalità e le eventuali caratteristiche specifiche che lo renderanno efficace nel contesto previsto.
- Schema: Identificare e collegare gli schemi agenti e le strategie di implementazione pertinenti. Si tratta di progetti architettonici o procedure consigliate che possono influenzare la struttura e il comportamento dell'agente. "Schemi e implementazione degli agenti in Salesforce Agentforce: Un whitepaper tecnico", serve come risorsa preziosa per questo passaggio, offrendo approfondimenti sulla progettazione efficace degli agenti sulla piattaforma Salesforce e Agentforce.
Design
La fase di progettazione traduce i concetti dall'ideazione in un modello dettagliato per la costruzione dell'agente. Ciò comporta la definizione dell'architettura dell'agente, dei flussi utente, dei modelli di interazione e di specifiche tecniche come argomenti, strumenti e guardrail.
Durante la fase di progettazione, verrà creato un modello dettagliato per la costruzione dell'agente che include:
- Progettazione agente: Descrivere la struttura interna dell'agente, compresi i componenti, i moduli e il modo in cui interagiscono. Ciò potrebbe comportare la definizione della Knowledge Base, della configurazione e della logica per controllare il comportamento degli agenti, i componenti di elaborazione del linguaggio naturale (NLP) e i punti di integrazione con altri sistemi.
- Flussi utente/Progettazione interazione: Mappare il journey utente completo e le interazioni dell'agente. Definire flussi di conversazione, alberi decisionali, gestione degli errori e meccanismi di feedback per creare esperienze intuitive ed efficaci.
- Specifiche tecniche: Documentare i requisiti tecnici non funzionali per l'agente, ad esempio metriche delle prestazioni, considerazioni sulla scalabilità, protocolli di sicurezza e specifiche di integrazione.
- Prototipazione e modelli: Creare rappresentazioni visive o prototipi interattivi dell'interfaccia e delle interazioni dell'agente. Ciò consente test e feedback tempestivi, contribuendo a perfezionare la progettazione prima che inizi lo sviluppo su larga scala.
- Dati: Quando si determinano il tipo e le fonti di dati richieste da un agente, identificare le serie di dati, le API, i database e gli archivi a cui l'agente deve accedere. Per Agentforce, concentrarsi sui dati forniti come contesto, se sono strutturati o non strutturati e se sono in tempo reale o batch. La piattaforma Agentforce è basata su una profonda integrazione con Data 360, che consente di utilizzare sia dati strutturati che non strutturati provenienti da Salesforce CRM e da altre fonti. Il contenuto non strutturato può essere suddiviso e indicizzato in modo nativo per RAG. MuleSoft consente di connettersi a sistemi esterni.
- Strumenti: Identificare le azioni che l'agente deve eseguire. Utilizzare le azioni Agentforce per esporre gli strumenti che raggiungono gli obiettivi aziendali. Queste azioni sfruttano gli asset Salesforce esistenti, ad esempio Prompt tramite Generatore di prompt, MuleSoft, Apex, Flussi e API con specifiche OpenAPI. Qualsiasi azione invocabile può essere integrata in Agentforce e utilizzata dall'agente, rendendo tutti gli strumenti di sviluppo Salesforce più comuni immediatamente disponibili come azioni Agentforce.
- Dati di input per gli agenti: Nell'SDLC tradizionale, gli input sono specificati con precisione. Nell'ADLC, gli input sono spesso enunciazioni naturali, non deterministiche e in formato libero. Raccogliere un corpus rappresentativo di enunciazioni che dovrebbero produrre risposte appropriate.
La fase di sviluppo si concentra sulla traduzione dello scopo, delle capacità e dell'ambito operativo dell'agente definito determinato nella fase di ideazione e progettazione in un nuovo agente Agentforce.
Per aiutare gli sviluppatori a creare agenti, Agentforce fornisce sia Agent Builder che Agenteforce Developer Experience (AFDX). Questi strumenti di base fungono da ambienti principali per la creazione e la configurazione dell'agente.
- Agent Builder offre un'esperienza dell'interfaccia utente per definire le funzionalità principali dell'agente.
- AFDX fornisce un'interfaccia programmatica per la personalizzazione e l'integrazione con altri sistemi.
Lo sviluppo e la creazione di un agente prevede questi passaggi che possono essere eseguiti utilizzando il Generatore di agenti o AFDX:
- Definizione del profilo: Un aspetto cruciale della progettazione degli agenti è la definizione di un profilo distinto. Ciò comporta la configurazione di:
- Descrizione agente: Descrizione dettagliata del ruolo, degli obiettivi e delle operazioni specifiche dell'assistenza clienti che è progettato per gestire.
- Tono: Lo stile di comunicazione dell'agente, il livello di empatia e le eventuali linee guida specifiche del marchio a cui deve attenersi.
- Definizione di argomenti e azioni degli agenti: Per rendere un agente sofisticato e in grado di gestire una vasta gamma di operazioni è essenziale suddividere le sue capacità in argomenti distinti con azioni corrispondenti.
- Argomenti: Ogni argomento può essere concettualizzato come il proprio agente specializzato con un insieme univoco di istruzioni e strumenti.
- Architettura modulare. L'approccio modulare agli argomenti consente una maggiore organizzazione e scalabilità. Definendo più argomenti, l'agente può gestire una gamma più ampia di scenari complessi. Ad esempio, un agente potrebbe avere argomenti separati per "Gestione ordini", "Domande frequenti (FAQ), "Assistenza tecnica" e "Richieste di fatturazione".
- Istruzioni argomento (Guardrail): Ogni argomento viene fornito con istruzioni specifiche che fungono da guardrail, definendo l'ambito di ciò che l'agente può discutere o fare all'interno dell'argomento. Queste istruzioni evitano che l'agente si allontani dall'argomento o fornisca informazioni irrilevanti. Aiutano anche a mantenere coerenza e precisione nelle risposte.
- Azioni: Gli argomenti sono inoltre dotati di "strumenti", che rappresentano le azioni che l'agente può intraprendere. Questi strumenti possono essere:
- Azioni informative: Recupero di dati da una Knowledge Base o da un sistema esterno per rispondere a una query.
- Azioni transazionali: Eseguire azioni per conto dell'utente, ad esempio effettuare un ordine, aggiornare il record di un cliente o avviare un processo di rimborso. Queste azioni sono spesso integrate con altri sistemi (ad esempio CRM, ERP).
- Argomenti: Ogni argomento può essere concettualizzato come il proprio agente specializzato con un insieme univoco di istruzioni e strumenti.
Quando valutano le prestazioni e l'affidabilità degli agenti AI, i tester spesso incontrano una serie di sfide che possono compromettere l'esperienza utente. Questi problemi vanno dall'interpretazione errata dell'intento dell'utente all'esecuzione non corretta delle operazioni.
Scenari comuni di errore degli agenti
La creazione di un agente affidabile richiede di capire come e dove può fallire. La tabella seguente elenca i problemi più comuni riscontrati durante il ciclo di vita dell'agente, dal ragionamento errato al recupero Knowledge insufficiente. Utilizzare questa opzione come guida strategica durante lo sviluppo e come elenco di controllo durante i test per assicurarsi che l'agente non sia solo funzionale ma anche affidabile e intuitivo per l'utente finale. Questi scenari di errore dovrebbero aiutare a definire i casi di test.
| Categoria | Descrizione | Esempi di errore |
|---|---|---|
| Classificazione argomenti | L'agente non riesce a identificare correttamente l'intento o l'obiettivo dell'utente. |
|
| Qualità della risposta | Errori nel contenuto, nella precisione e nel formato delle risposte dell'agente. |
|
| Esecuzione di azioni | L'agente non riesce quando tenta di eseguire una funzione o un'operazione specifica. |
|
| Parapetti e istruzioni | L'agente viola regole, vincoli o limiti di conversazione predefiniti. |
|
| Recupero Knowledge | L'agente ha problemi a reperire e presentare informazioni dalla sua Knowledge Base. |
|
| Guida strutturata | L'agente fatica a guidare gli utenti nei processi a più fasi. |
|
Procedure consigliate per il test degli agenti AI
Di seguito sono descritte le procedure consigliate da tenere presenti durante il test degli agenti su Agentforce.
-
Ottimizzazione dei dati di test
La base di test efficaci sono dati di test completi e realistici. Seguire questi principi per assicurarsi di disporre di dati di test efficaci per testare gli agenti:- Copertura sufficiente: Cercare di avere dati di test sufficienti per coprire tutti gli argomenti critici e i profili utente.
- Scenari realistici: Assicurarsi che i dati di test rappresentino in modo preciso le interazioni degli utenti reali.
- Casi negativi e Edge: Includere casi di test negativi (ciò che l'agente non deve fare) e scenari edge per sfidare i limiti dell'agente.
- Test dei guardrail: Aggiungere casi di test specifici progettati per verificare che i guardrail dell'agente funzionino correttamente.
-
Ottimizzazione delle serie di test
Per sfruttare al meglio le risorse di test, ottimizzare il modo in cui si eseguono i test. Di seguito sono riportate alcune considerazioni durante il test degli agenti Agentforce:- Volume caso di prova: È possibile utilizzare fino a 1.000 casi di test.
- Esecuzione di test simultanei: È possibile eseguire fino a 10 casi di test contemporaneamente in un periodo di 10 ore.
- Gestisci risorse: Tenere presente che l'esecuzione dei test consuma crediti. Assicurarsi di essere soddisfatti dei dati di test prima di iniziare un'esecuzione per evitare costi inutili.
-
Rivedi risultati
Analizzare attentamente i risultati dei test per identificare le aree di miglioramento:- Analisi degli errori: Esaminare singolarmente ogni caso di test non riuscito. Leggere attentamente e comprendere la differenza tra i risultati previsti e quelli effettivi per individuare il problema.
- Utilizzo di un ambiente Sandbox: Gli agenti di test possono modificare i dati CRM. Per evitare modifiche indesiderate ai dati live, eseguire sempre i test in un ambiente non di produzione, ad esempio un Sandbox o un'organizzazione vuota.
-
Sintonizzazione e test
Il test è un processo iterativo che continua man mano che l'agente si evolve:- Test continuo: Eseguire test dopo ogni modifica agli argomenti o alle azioni dell'agente. Ciò convalida le modifiche e garantisce il mantenimento della qualità.
- Espandi copertura: test Gestire ed espandere continuamente la serie di dati con nuovi casi di test per migliorare la copertura complessiva e la solidità dell'agente.
Test degli approcci
Data la complessità dell'agente, non è sufficiente un singolo metodo di test. Una strategia di convalida completa deve essere stratificata, combinando approcci diversi per coprire qualsiasi aspetto, dalle azioni prevedibili e deterministiche alle sfumature del suo comportamento non deterministico e conversazionale. Questi approcci offrono un framework per valutare sistematicamente ogni componente dell'agente per garantire che sia solido, affidabile e sicuro.
-
Test manuali con simulatore di agenti e tracciatore di piani
- Scopo: Questo è il modo iniziale e spesso più semplice per testare un agente. È ideale per un piccolo insieme di casi d'uso di esempio e per ottenere una comprensione di base del comportamento dell'agente.
- Meccanismo: Un simulatore di agente offre un ambiente controllato in cui sviluppatori e amministratori possono interagire direttamente con l'agente. Questo simulatore consente di tracciare in modo dettagliato le informazioni fornite dall'amministratore/sviluppatore, offrendo approfondimenti sul modo in cui l'agente elabora gli input e genera gli output.
- Vantaggi:
- Feedback rapido
- Problemi immediati facili da identificare
- Aiuta a capire il flusso di logica dell'agente
-
Test automatici con Testing Center o AFDX Test Suite
- Scopo: Una volta che i test manuali hanno stabilito una base di riferimento per le funzionalità, i test automatici diventano cruciali per la scalabilità, l'accuratezza e i test di regressione.
- Meccanismo: Strumenti come il Centro di test o la suite di test AFDX consentono la generazione di test automatici basati su casi d'uso di esempio predefiniti. Questi test sono progettati per verificare se le istruzioni dell'agente e le classificazioni sub-agente funzionano correttamente in una gamma più ampia di scenari.
- Vantaggi:
- Garantisce prestazioni coerenti
- Identifica i bug sottili
- Supporta le pipeline di integrazione continua/distribuzione continua (CI/CD)
- Fornisce una copertura completa
-
Test di unità specifiche dell'azione con Apex e flussi
- Scopo: Convalidare la logica aziendale deterministica incapsulata nelle azioni degli agenti. Benché il comportamento generale dell'agente sia non deterministico, le azioni dell'agente sono spesso basate su tecnologie come Flussi e Apex, a cui si applicano le procedure di sviluppo standard.
- Meccanismo: Gli sviluppatori scrivono test di unità per le classi Flussi o Apex specifiche richiamate da un'azione agente. Questi test verificano i singoli componenti della logica dell'agente, assicurando che generino gli output previsti per un determinato insieme di input.
- Vantaggi:
- L'integrazione di questi test di unità in una pipeline DevOps offre una rete di sicurezza automatizzata
- Verifica che eventuali modifiche o miglioramenti alla logica di un'azione non introducano regressioni
- Garantisce l'affidabilità delle funzionalità dell'agente prima che vengano distribuite alla produzione
-
Test avversari - Sicurezza e applicazione del guardrail:
- Scopo: La creazione di vari tipi di agenti richiede una forte enfasi sulla sicurezza e la garanzia che operino entro parametri e guardrail definiti. Questo è fondamentale per prevenire azioni involontarie, violazioni dei dati o uso improprio. Pertanto, lo scopo dei test in contraddittorio è identificare e rimediare in modo proattivo a queste potenziali vulnerabilità sfidando deliberatamente l'agente con input progettati per aggirare i suoi meccanismi di sicurezza, testandone in tal modo la robustezza e la resistenza alla manipolazione.
- Meccanismo: I test in contraddittorio vengono implementati creando input impegnativi, ambigui o dannosi che superano i limiti del comportamento previsto dell'agente. Mentre gli strumenti piattaforma come la funzione "Guardrails" nel Generatore di agenti offrono approfondimenti sull'osservanza delle istruzioni, gli sviluppatori dovrebbero anche creare casi di test personalizzati che tentano attivamente di far fallire l'agente in un ambiente controllato.
- Vantaggi: Questo approccio riduce sistematicamente i rischi per la sicurezza e la conformità prima della distribuzione. Identificando potenziali punti di errore, i test in contraddittorio migliorano l'affidabilità degli agenti e garantiscono che funzionino in modo sicuro e come previsto quando interagiscono con gli utenti.
Test iterativi in organizzazioni vuote e Sandbox
Il "loop interno" è il ciclo critico iterativo in cui un agente passa dal concetto a un componente convalidato, pronto per la distribuzione. Questo processo di perfezionamento continuo richiede ambienti sia per lo sviluppo che per i test. Agentforce fornisce questo framework tramite organizzazioni vuote, che sono ambienti isolati e temporanei per la prototipazione rapida che non influisce sugli ambienti condivisi, e Sandbox, che consentono test accurati con dati realistici per accelerare il percorso verso la produzione.
- Sviluppo in organizzazioni vuote: Lo sviluppo iniziale dovrebbe avvenire in un'organizzazione vuota. Gli strumenti forniti all'interno dell'ambiente di sviluppo, come Agent Builder e AFDX, sono utilizzati completamente qui. Le organizzazioni vuote sono ottime candidate per le pipeline CI/CD per eseguire test di unità, eseguire analisi del codice e promuovere le modifiche agli ambienti superiori.
- Distribuzione a Sandbox per test dei dati reali: Una volta sviluppate le funzionalità principali dell'agente in un'organizzazione vuota, distribuirle in un Sandbox. I Sandbox sono copie di un ambiente di produzione e offrono un terreno di prova più realistico.
- Dati reali vs. Dati fittizi: Mentre alcuni sviluppatori potrebbero prendere in giro i dati nelle organizzazioni vuote per il test iniziale, la distribuzione in un Sandbox consente il test con "dati reali". Questo è fondamentale per valutare le prestazioni dell'agente in scenari che rispecchiano da vicino le interazioni effettive con i clienti. L'utilizzo di dati più rappresentativi in un Sandbox accelera in modo significativo il processo di sviluppo e perfezionamento.
- Sandbox completo o parziale per i dati CRM principali: A seconda del volume di dati e dei requisiti di test specifici, è possibile utilizzare un Sandbox completo o parziale.
- Full Sandbox: Fornisce una replica completa dell'ambiente di produzione, inclusi tutti i metadati e i dati. Ideale per test approfonditi e ottimizzazione delle prestazioni con serie di dati di grandi dimensioni.
- Sandbox parziale: Contiene un sottoinsieme di dati di produzione, spesso sufficiente per testare caratteristiche o funzionalità specifiche in cui una serie di dati completa non è strettamente necessaria.
- Knowledge e gestione RAG: Se l'agente si basa su una Knowledge Base o su un modello RAG (Retrieval-Augmented Generation), inserire tutto il contenuto pertinente nel Sandbox e reindicizzarlo. Ciò garantisce che l'agente utilizzi le informazioni aggiornate durante i test e possa recuperare e sintetizzare il contenuto in modo preciso.
Agentforce definisce gli agenti tramite i metadati, in modo che possano essere distribuiti utilizzando procedure Salesforce standard come Serie di modifiche o AFDX. Questa fase pone l'accento su un'implementazione sicura e controllata attraverso funzioni critiche come il controllo delle versioni degli agenti e una fase di attivazione separata, che garantisce la stabilità del sistema e consente un rapido ripristino dai problemi.
Eseguire i passaggi seguenti per distribuire e rilasciare il nuovo agente.
- Distribuzione tramite API serie di modifiche/metadati o AFDX: Il processo di distribuzione per gli agenti sfrutta le procedure Salesforce standard, trattando gli agenti come metadati. Questo dovrebbe essere un processo familiare per chiunque sia abituato allo sviluppo e alla distribuzione di Salesforce. L'utilizzo delle serie di modifiche o AFDX garantisce un approccio strutturato e coerente alla migrazione delle configurazioni degli agenti tra gli ambienti, ad esempio dal Sandbox alla produzione. Questo metodo facilita il controllo delle versioni e una corretta gestione delle modifiche, che sono cruciali per mantenere la stabilità e l'affidabilità del sistema.
- Attivazione degli agenti dopo la distribuzione: Dopo una distribuzione riuscita, è imperativo che un amministratore di sistema attivi attivamente l'agente. La distribuzione inserisce semplicemente il codice e i metadati dell'agente nell'ambiente di destinazione; l'attivazione è la fase che rende l'agente operativo e disponibile per l'uso. Questa separazione consente l'implementazione e il test controllati prima che un agente diventi disponibile e interagisca con gli utenti finali o altri componenti di sistema.
- Utilizzo del controllo delle versioni per la gestione sicura degli agenti: Il controllo delle versioni degli agenti è una funzione fondamentale che migliora in modo significativo la sicurezza e la flessibilità dello sviluppo e della manutenzione degli agenti.
- Creazione, test e pubblicazione di nuove versioni: La procedura consigliata prevede la creazione di una nuova versione di un agente ogni volta che sono necessarie modifiche o miglioramenti. Questa nuova versione può quindi essere testata a fondo in un ambiente Sandbox senza influire sull'agente attivato live. Una volta convalidata e ritenuta pronta, la nuova versione può essere pubblicata e successivamente attivata, sostituendo la versione operativa precedente. Questo processo iterativo consente un miglioramento continuo e l'innovazione riducendo al minimo le interruzioni.
- Ritiro alle versioni precedenti: Un vantaggio chiave del controllo delle versioni è la possibilità di ripristinare rapidamente e facilmente una versione stabile precedente se si verifica un problema con un agente appena distribuito o attivato. Se qualcosa va storto, ad esempio se un agente si comporta male o introduce un errore imprevisto, gli amministratori possono semplicemente tornare all'ultima versione valida nota e attivarla. Questa funzionalità fornisce una rete di sicurezza critica, consentendo un ripristino rapido e riducendo al minimo i tempi di inattività, garantendo così la continuità operativa e la soddisfazione degli utenti.
Monitoraggio agente
Agentforce Session Tracing è un modello aperto e ampliabile basato su Data 360 che acquisisce interazioni end-to-end tra gli agenti. Il tracciamento delle sessioni Agentforce inserisce i dati da fonti diverse (a partire dai registri del motore di ragionamento) e combina il tutto in un ID sessione.
Il modello di dati di tracciamento delle sessioni (STDM) fornisce informazioni dettagliate su ciò che è accaduto durante le sessioni degli agenti, tra cui:
- Interazioni passo per passo
- Esecuzioni del motore di ragionamento
- Azioni, input/output di prompt e gateway
- Messaggi di errore
- Risposte finali
STDM è uno strumento fondamentale per aiutare gli sviluppatori a:
- Debug dei problemi di impostazione e configurazione degli agenti durante la creazione.
- Scoprire perché alcuni casi di test non sono riusciti durante i test batch.
- Risolvere il problema per cui un agente non è in grado di gestire una serie di domande degli utenti o sta andando fuori argomento.
Gli sviluppatori devono utilizzare questi dati di traccia della sessione per osservare, monitorare, analizzare e risolvere gli eventi, gli incidenti e gli schemi di comportamento degli agenti.
STDM comprende oggetti data lake (DLO) e oggetti modello di dati (DMO) che memorizzano registri dettagliati del comportamento degli agenti. I metadati di ogni chiamata LLM effettuata dal motore di ragionamento possono essere uniti a metriche di feedback o guardrail. I dati vengono trasmessi ai DLO in Data 360 e mappati ai DMO applicabili.
Gli sviluppatori possono accedere a questi dati e ottenere approfondimenti eseguendo query e rapporti su STDM. I componenti di un STDM sono descritti di seguito.
Modello di dati di tracciamento sessione Agentforce ERD
| Oggetto data lake/oggetto modello di dati | Descrizione |
|---|---|
| AIAgentSession | Un contenitore overarching che acquisisce interazioni contigue con uno o più agenti AI. |
| AIAgentSessionParticipant | Un'entità (umana o AI) che partecipa a una sessione AIAgent. |
| AIAgentInteraction | Un segmento all'interno di una sessione. In genere inizia con la richiesta di un utente e termina quando l'agente AI fornisce una risposta a tale richiesta. |
| AIAgentInteractionStep | Un'azione o operazione discreta eseguita durante un'interazione per soddisfare la richiesta dell'utente. |
| AIAgentInteractionMessage | Una singola comunicazione fornita dall'utente o generata dall'agente AI durante una sessione. |
Ottimizzazione Agentforce
L'ottimizzazione Agentforce è una potente funzione progettata per migliorare le prestazioni degli agenti AI offrendo approfondimenti approfonditi sulle interazioni degli utenti. Basato sulle funzionalità di analisi del modello di dati di tracciamento delle sessioni (STDM), consente ad amministratori e sviluppatori di comprendere gli argomenti degli utenti, gli schemi di coinvolgimento e l'efficacia delle risoluzioni degli agenti.
Gli aspetti chiave dell'ottimizzazione Agentforce sono:
- Dati specifici momento: Ottimizzazione Agentforce estende STDM introducendo "Momenti", che rappresentano interazioni incentrate su uno specifico intento o richiesta dell'utente durante una sessione. Questi dati granulari consentono un'ispezione dettagliata di ogni aspetto di un'interazione, dalla richiesta iniziale dell'utente alla risoluzione dell'agente.
- Elaborazione automatica dei momenti: I momenti vengono generati ogni giorno e quindi raggruppati e contrassegnati ogni settimana in tutti gli agenti attivi utilizzando un modello Large Language Model (LLM) avanzato. Questa segmentazione semplifica le query e offre approfondimenti su vari aspetti delle sessioni degli agenti.
- Query e analisi: Gli utenti possono eseguire query sui momenti in base a tag, punteggi di qualità e altri criteri. Ciò consente di valutare il coinvolgimento degli utenti tramite metriche come la durata del momento e i punteggi di qualità della pertinenza, consentendo di individuare le aree da migliorare.
- Modello di dati unificato: L'ottimizzazione Agentforce sfrutta il modello di dati di tracciamento sessione (STDM) unificato, che acquisisce ogni evento registrato all'interno di una sessione, inclusi i turni delle singole conversazioni. Tutte le entità pertinenti vengono fornite quando si abilita STDM nell'impostazione.
Analizzando le interazioni degli agenti AI, l'ottimizzazione Agentforce consente agli utenti di identificare le aree da migliorare e perfezionare le configurazioni per soddisfare meglio le esigenze degli utenti.
Per ulteriori informazioni, vedere Modello di dati.
Questo capitolo è una guida pratica per gli sviluppatori pro-code. Mostra come creare, testare e distribuire gli agenti con Agentforce DX (AFDX) e Python SDK in modo rapido e sicuro. Passeremo attraverso l'intero ciclo di vita, dalla progettazione iniziale a un agente controllato da versione, utilizzando la potente combinazione di AFDX e Python SDK.
Gli esempi seguenti sfrutteranno due insiemi di strumenti chiave progettati per la creazione e la gestione degli agenti sulla piattaforma Agentforce. Si consiglia di conoscere a fondo questi strumenti per sfruttare al meglio questa guida.
1. Agentforce DX (AFDX): Per la gestione del ciclo di vita
Agentforce DX estende il noto set di strumenti SFDX (Salesforce Developer Experience), incluse le estensioni Salesforce CLI e VS Code, per supportare l'intero ciclo di vita dello sviluppo degli agenti. Viene utilizzato per gestire un agente come metadati controllati dalla versione, automatizzare i test dalla riga di comando e orchestrare le distribuzioni tra i Sandbox di sviluppo e la produzione.
Per ulteriori informazioni, vedere: Suggerimenti introduttivi sullo sviluppo Agentforce DX.
2. Agentforce Python SDK: Per la creazione dell'agente
Python SDK fornisce l'interfaccia programmatica per l'"inner loop" di sviluppo. Consente di definire la logica di ragionamento di un agente, di connetterne gli strumenti e di gestire i modelli di prompt direttamente all'interno di un ambiente Python familiare, semplificando la fase di costruzione principale dell'ADLC.
L'SDK è disponibile su PyPI: https://pypi.org/project/Agentforce-sdk/.
Il progetto completo è disponibile qui:
https://github.com/akshatasawant9699/ADLC_Whitepaper.
Questa fase fondamentale definisce lo scopo, il profilo e le funzionalità principali di un agente. Si tratta di rispondere a domande critiche per progettare il "cervello" dell'agente prima di scrivere qualsiasi codice. In questo esempio, stiamo progettando un agente per Coral Cloud Resorts.
- Missione: L'agente funge da responsabile resort, gestendo i reclami dei clienti, gestendo le pianificazioni dei dipendenti e garantendo un funzionamento senza problemi del resort.
- Persona: L'agente ha un tono disponibile, professionale e conversazionale.
- Strumenti e funzionalità: L'agente deve accedere ai sistemi di prenotazione, al software di pianificazione dei dipendenti e alle policy resort.
- Logica decisionale: L'agente utilizza gli argomenti generati dall'intelligenza artificiale per determinare l'intento degli utenti e generare le azioni appropriate.
Con Agenteforce DX, la fase di progettazione si traduce in un file di specifiche tangibile: Agenteforce DX: Generazione di una specifica agente. Il primo passo nel journey pro-code è generare un file agentSpec.yaml. Il file YAML acquisisce la progettazione di base dell'agente, incluso il suo ruolo, i dettagli della società pertinenti e un elenco di argomenti generati dall'intelligenza artificiale che definiscono i processi che può gestire.
Utilizzare Salesforce CLI per generare questa specifica tramite prompt interattivi. Per iniziare a creare l'agente con Agentforce DX, eseguire:
Sarà necessario fornire dettagli specifici definiti durante la fase di ideazione:
- Tipo di agente: Cliente
- Nome società: Guida di Coral Cloud
- Descrizione della società: Coral Cloud Resorts offre ai clienti attività di destinazione eccezionali, esperienze indimenticabili e servizi di prenotazione, il tutto supportato da un impegno a fornire un servizio clienti di prim'ordine.
- Ruolo agente: Il responsabile del resort inserisce i reclami dei clienti, gestisce le pianificazioni dei dipendenti e garantisce che tutti i processi vengano eseguiti senza problemi.
L'esecuzione di questo comando crea un file agentSpec.yaml nella directory delle specifiche del progetto DX. Il file contiene le informazioni fornite insieme a un elenco di argomenti generati dall'intelligenza artificiale che includono il nome e la descrizione di ogni argomento. Rivedere e modificare il file in base alle esigenze per perfezionare le funzionalità dell'agente.
Analogamente, l'implementazione di Python SDK utilizza la raccolta di specifiche interattiva per generare automaticamente gli argomenti degli agenti con i campi ambito appropriati richiesti per la compatibilità con SDK.
Inoltre, creerà un file JSON completo delle specifiche dell'agente che verrà utilizzato per creare un agente nella Fase 2.
La fase di sviluppo si concentra sulla costruzione dei componenti principali dell'agente: il motore di ragionamento, gli strumenti che può utilizzare e la sua Knowledge Base. Agenteforce astrae gran parte della complessità, il che consente agli sviluppatori di concentrarsi sulla logica aziendale.
Questa sezione condivide due approcci pro-code per la fase di sviluppo Agentforce. In primo luogo, utilizzando Agentforce DX e in secondo luogo utilizzando Python.
Agentforce DX: Creazione di un agente da una specifica
Quando il file agentSpec.yaml è pronto, creare l'agente nell'organizzazione Salesforce. Eseguire questo comando per creare l'agente e sincronizzare di nuovo i metadati associati con il progetto DX locale:
Quando richiesto, accettare il nome API predefinito, Resort_Manager. Il comando analizza la specifica, crea l'agente e recupera i metadati. I metadati includono un bot, BotVersion e un GenAiPlannerBundle, che aggiungono intelligenza artificiale e riferimenti agli argomenti e alle azioni dell'agente.
Visualizzare in anteprima la struttura dell'agente prima di crearla aggiungendo il flag --preview per generare un file JSON locale che dettaglia il tipo di agente che verrà creato da LLM, incluse le azioni suggerite. Ad esempio:
Per ulteriori informazioni, vedere Creazione di un agente dal progetto DX da Trailhead.
Agentforce Python SDK: Definizione di strumenti specifici
Agent SDK facilita i test degli agenti creando azioni fittizie. Queste azioni fittizie dovranno essere sostituite con azioni reali all'interno di Salesforce. Salesforce offre una serie di funzioni della piattaforma, tra cui flussi, Apex, modelli di prompt e API, che possono essere incapsulate come azioni Agentforce.
Di seguito è riportato uno snippet di codice azione fittizio che illustra l'aspetto di un'azione Agentforce.
L'implementazione stabilisce la connessione a Salesforce, crea l'istanza dell'agente e definisce gli strumenti e le azioni personalizzate che l'agente può utilizzare per interagire con i sistemi esterni ed eseguire funzioni aziendali specifiche.
Come abbiamo discusso in precedenza, il test di un agente è più complesso rispetto al test software tradizionale. Richiede la convalida del comportamento, del ragionamento e della solidità in vari scenari. Ciò include test di unità per i singoli strumenti, test end-to-end per le conversazioni e test in contraddittorio per trovare vulnerabilità.
Agenteforce DX offre un flusso di lavoro di alto livello per la creazione, la distribuzione e l'esecuzione di test oltre al Centro test e all'API Test diretti. Questa sezione illustra l'esecuzione di test con Agentforce DX.
Agentforce DX: Esecuzione di un test agente
Utilizzare Agenteforce DX per eseguire test degli agenti predefiniti direttamente dalla riga di comando. Questo è ideale per integrare i test degli agenti nei moderni processi DevOps.
Agentforce Python SDK: Simulazione di test E2E e avversari
Concettualmente, Python SDK consente alle conversazioni con script di simulare test end-to-end (E2E) e convalidare il ragionamento degli agenti.
Agentforce Python SDK con API di test Salesforce
L'implementazione di Python SDK utilizza test completi con l'API di test Salesforce e i metadati AiEvaluationDefinition, creando casi di test strutturati con aspettative per sequenze di argomenti, sequenze di azioni, corrispondenza di stringhe e metriche di qualità. Il sistema genera definizioni di metadati XML che possono essere distribuite a Salesforce per il test e la convalida automatici degli agenti.
Dopo la convalida, l'agente esegue la distribuzione in un ambiente di produzione. Durante questa fase, Agenteforce DX è fondamentale per aiutare a gestire e spostare i metadati degli agenti tra organizzazioni diverse (ad esempio, Sandbox e produzione). Le distribuzioni degli agenti creano una nuova versione dell'agente e l'agente non viene reso disponibile finché non viene attivato esplicitamente. In questo modo si ha il controllo completo su quando rilasciare la nuova versione dell'agente.
Agentforce DX: Distribuzione dei metadati degli agenti
La struttura standard del progetto Salesforce DX organizza i metadati degli agenti nella directory force-app. Utilizzare i comandi di distribuzione progetto SF standard per distribuire un agente e i test associati a un'organizzazione di destinazione.
Dopo aver creato o distribuito un agente, è possibile aprirlo direttamente nell'interfaccia utente Agentforce Builder per verificarne la configurazione eseguendo:
Dopo aver verificato che l'agente è distribuito, è possibile attivarlo. In caso di problemi imprevisti, tornare alla versione di lavoro precedente dell'agente.
Agentforce Python SDK: Distribuzione Distribuzione agente
L'implementazione prende la specifica dell'agente convalidata e la distribuisce all'organizzazione Salesforce, rendendo l'agente disponibile per l'uso. Il processo di distribuzione include la creazione degli agenti, la sincronizzazione dei metadati e la verifica della corretta distribuzione.
ADLC è un ciclo continuo; la distribuzione non è la fine. Gli agenti sono sistemi viventi che richiedono un monitoraggio costante per tenere traccia di metriche come latenza, costo e percentuali di successo. Gli approfondimenti ottenuti dal monitoraggio vengono utilizzati per ottimizzare e migliorare le prestazioni degli agenti attraverso l'ingegneria tempestiva, l'ottimizzazione degli strumenti e il perfezionamento delle Knowledge Base.
La piattaforma Agenteforce fornisce cruscotti digitali e dati analitici completi a supporto di questa fase cruciale, garantendo che gli agenti continuino a evolversi e a migliorare nel tempo.
Agentforce Analytics
Agentforce Analytics, disponibile nella cartella Agentforce (predefinita), utilizza Data 360 per fornire informazioni sulle prestazioni degli agenti. Il cruscotto digitale e i rapporti personalizzabili offrono dati sull'adozione, i commenti e l'utilizzo, consentendo di perfezionare argomenti e azioni per migliorare la soddisfazione degli utenti. È possibile visualizzare i risultati in dettaglio facendo clic sui grafici o sui rapporti collegati. Per personalizzare, clonare i rapporti esistenti e modificare i cloni per evitare di interrompere i processi di analisi.
Analisi delle enunciazioni
L'analisi delle enunciazioni mostra in che modo gli utenti Agentforce (predefiniti) utilizzano gli agenti, che cosa richiedono e se l'agente è stato in grado di gestire queste richieste. Questi rapporti personalizzabili possono aiutare a perfezionare gli argomenti e le azioni in modo che gli agenti rispondano in modo più efficace e preciso.
Agentforce Python SDK: Monitoraggio con le integrazioni di Data 360
L'implementazione di Agent SDK utilizza il monitoraggio e l'analisi avanzati con il connettore Python Data 360, stabilendo la connessione a Salesforce Data 360, eseguendo query sulle metriche delle prestazioni degli agenti e creando cruscotti digitali di monitoraggio completi.
Il sistema tiene traccia dei tempi di risposta, delle percentuali di successo, della soddisfazione degli utenti e delle metriche dei costi per fornire approfondimenti concreti per l'ottimizzazione degli agenti.
Agentforce DX: Monitoraggio agente
L'implementazione utilizza comandi AFDX standard con gestione degli agenti basata su CLI, mantenendo l'agente aggiornato con le modifiche della piattaforma e incorporando i commenti degli utenti per un miglioramento continuo.
Fare riferimento al repository GitHub qui per l'implementazione di ADLC utilizzando Agent SDK e AFDX.
Per padroneggiare il ciclo di vita dello sviluppo degli agenti è necessario attenersi a una serie di principi fondamentali che garantiscono efficienza, affidabilità e allineamento strategico. Le seguenti linee guida sintetizzano le lezioni chiave di ogni fase dell'ADLC in un quadro strategico per architetti e sviluppatori.
1. Pianificazione e ideazione
Questa fase iniziale si concentra sull'allineamento dello scopo dell'agente agli obiettivi aziendali e sulla garanzia che sia costruito su una solida base.
- Dare priorità all'impatto sul business: Iniziare mappando i potenziali casi d'uso direttamente agli obiettivi aziendali strategici. Utilizzare una matrice di priorità per calcolare il punteggio del loro impatto potenziale e iniziare con un unico caso d'uso mirato con KPI chiari.
- Coinvolgere precocemente gli stakeholder: Raccogliere approfondimenti sui punti deboli e garantire l'allineamento.
- Sfruttare Approfondimenti dati: Un agente è valido solo quanto i suoi dati. Utilizzare Data 360 per esplorare i dati strutturati e non strutturati disponibili per informare il contesto e le funzionalità dell'agente. Esaminare i rapporti e i cruscotti digitali esistenti per identificare le tendenze correnti che possono influenzare la selezione del caso d'uso.
- Utilizzo dei framework per l'ideazione: Applicare metodi di ideazione strutturati per fare brainstorming e perfezionare potenziali applicazioni, ad esempio il design thinking o l'analisi SWOT.
2. Agenti immobiliari
Questa fase descrive le procedure consigliate per la creazione di un agente efficiente e ad alte prestazioni.
- Evitare troppi argomenti: Limitare il numero di argomenti per ridurre il rischio di creare argomenti simili o sovrapposti che potrebbero confondere l'agente.
- Mantenere istruzioni e prompt concisi: Utilizzare un linguaggio diretto e semplice e fornire enunciazioni di esempio per guidare l'agente in modo efficace.
- Variabili di leva e azioni deterministiche: Utilizzare questi strumenti per guidare il comportamento dell'agente e ottimizzarne le prestazioni per risultati più prevedibili.
- Mantenere gli output delle azioni piccoli e concisi: Assicurarsi che le risposte dell'agente siano brevi e pertinenti. Gli output più lunghi utilizzano più contesto e sono più lenti da generare.
- Ottimizzazione delle azioni per la velocità: Progettare i flussi e le classi Apex in modo che restituiscano dati minimi richiesti. Cercare di avere meno azioni necessarie per generare una risposta pre-elaborando, ove possibile.
- Definizione di un ambito chiaro: Scrivere descrizioni, istruzioni e ambiti di intervento appropriati per impedire all'agente di chiamare RAG (Generazione aumentata recupero) per domande fuori ambito.
- Utilizza la ricerca ibrida con parsimonia: Utilizzare la ricerca ibrida solo se è assolutamente necessaria, poiché può influire negativamente sulla latenza.
3. Test, monitoraggio e ottimizzazione
Questa fase iterativa è fondamentale per perfezionare la precisione e le prestazioni dell'agente.
- Creazione di un flusso di test: Seguire un ciclo di test coerente:
- Esegui test batch: Eseguire una serie completa di test.
- Visualizzazione di punteggi/errori: Analizzare le metriche delle prestazioni e identificare gli errori.
- Ispezione degli errori: Esaminare ogni riga di errore per capire la discrepanza.
- Aggiorna agente: Apportare le modifiche necessarie all'agente o ai suoi dati di valutazione.
- Rivedi informazioni di tracciamento della sessione: Utilizzare il modello di dati di traccia della sessione e Agentforce Interaction Explorer per eseguire l'analisi delle cause principali quando vengono rilevati problemi o comportamenti imprevisti. Sintonizzare l'agente in base alle informazioni e continuare a ripetere l'agente.
Il ciclo di vita rappresenta un'evoluzione critica dei principi di sviluppo software tradizionali, progettati per l'era dei sistemi intelligenti e autonomi.
- Evoluzione, non sostituzione: Il Ciclo di vita dello sviluppo degli agenti estende e ottimizza la tradizionale Gestione del ciclo di vita delle applicazioni senza sostituirla.
- Dati come cittadino di prima classe: I dati svolgono un ruolo molto più dinamico e centrale nello sviluppo degli agenti.
- Attrezzature e competenze specializzate: Richiede nuovi strumenti e un insieme più ampio di competenze specialistiche in scienza dei dati, ingegneria ML e sviluppo degli agenti.
- Apprendimento continuo: Lo sviluppo degli agenti aggiunge l'apprendimento continuo e l'adattamento del sistema stesso.
- Impatto futuro: L'intelligenza artificiale agente promette di automatizzare e ottimizzare ulteriormente le operazioni IT complesse e i flussi di lavoro di sviluppo software.