El ciclo de vida de desarrollo de agentes: De la concepción a la producción | Agentforce | Fundamentos

Este texto se tradujo utilizando el sistema de traducción automatizado de Salesforce. Realice nuestra encuesta para proporcionar comentarios sobre este contenido e indicarnos qué le gustaría ver a continuación.

En el desarrollo de software tradicional, el Ciclo de vida de desarrollo de software (SDLC) proporciona un enfoque estructurado y por fases para la creación de aplicaciones. Establece la calidad, reduce el riesgo y proporciona una hoja de ruta clara desde la idea hasta la versión. El Ciclo de vida de desarrollo de agentes (ADLC) es una metodología similar que está claramente adaptada para abordar las complejidades exclusivas de la creación de agentes autónomos.

Los agentes no son aplicaciones pasivas; son sistemas que razonan, actúan y aprenden en entornos de ejecución dinámicos. Su comportamiento no determinista hace que la evaluación cualitativa tradicional sea insuficiente. El Ciclo de vida de desarrollo de agentes (ADLC), liderado por plataformas como Agentforce, aborda esto en cinco fases: Ideación y diseño, Desarrollo (el “bucle interno”), Pruebas y validación, Implementación y Monitoreo y ajuste continuos (el “bucle externo”).

Este documento sirve como una guía integral para desarrolladores y Arquitectos de compañía que ya están familiarizados con las complejidades del Ciclo de vida de desarrollo de software (SDLC) y están buscando ampliar su experiencia en sistemas basados en agentes. Nuestro objetivo principal es facilitar una comprensión rápida del Ciclo de vida de desarrollo de agentes (ADLC) resaltando sus distinciones clave de las metodologías de SDLC tradicionales y proporcionando un marco estructurado para conceptualizar todo el proceso de creación, implementación y gestión de agentes inteligentes.

El documento está organizado en tres capítulos diferentes, cada uno diseñado para desarrollar progresivamente su Knowledge y habilidades prácticas:

Capítulo 1: El Marco de trabajo de ADLC. Este capítulo presenta el Ciclo de vida de desarrollo de agentes (ADLC), detallando su divergencia con el SDLC debido a los desafíos exclusivos del desarrollo de agentes autónomos. Establece un marco para el diseño, el desarrollo, las pruebas y la implementación de agentes.
Capítulo 2: The Agentforce Platform. Este capítulo explora Agentforce, una plataforma unificada que simplifica y acelera todo el ciclo de vida de desarrollo de agentes. Agentforce ofrece herramientas para el diseño de agentes, el procesamiento de datos, la capacitación de modelos, la implementación y el monitoreo continuo, simplificando tareas complejas y mejorando la eficiencia.
Capítulo 3: Implementación de procódigo. Esta guía utiliza las herramientas de código pro de Agentforce para proporcionar instrucciones prácticas paso a paso y ejemplos reales para el desarrollo de agentes. Cubre todo el ciclo de vida de desarrollo de agentes, desde la creación de prototipos y la ingeniería de funciones hasta la implementación de modelos, el ajuste del desempeño y el mantenimiento, equipando a los desarrolladores con las habilidades para crear agentes listos para producción.

Este documento tiene como objetivo proporcionarle los Knowledge teóricos y prácticos de las herramientas de pro-código de Agentforce. Aprenderá a construir, implementar y monitorear agentes de forma eficiente, segura y confiable, obteniendo una comprensión integral del ADLC y maximizando el potencial Agentforce en el desarrollo de agentes inteligentes.

La naturaleza no determinista de los agentes de IA requiere un marco de desarrollo especializado. Este capítulo describe ese marco introduciendo el Ciclo de vida de desarrollo de agentes (ADLC). Este capítulo proporciona una descripción general integral de las cinco fases principales del ADLC, desde la Ideación y el diseño iniciales hasta el Monitoreo y ajuste continuos. Este capítulo establece el Knowledge fundamental requerido para construir agentes sólidos y confiables.

Esta sección asigna conceptos de SDLC a las cinco fases del ADLC.

Esta es la fase fundamental donde se definen el propósito estratégico y los límites operativos de un agente. Una fase de diseño bien estructurada es el paso más crítico para el éxito, ya que traduce una necesidad de negocio en un plan técnico. El proceso de diseño garantiza que el agente no solo sea funcional, sino también responsable y alineado con las expectativas del usuario. Es donde se establecen el "qué" y el "por qué" antes de redactar cualquier código.

Definir objetivos y funciones de agentes: En primer lugar, debe articular claramente el objetivo principal del agente y las tareas específicas y mensurables que realizará. Esto implica definir su función (por ejemplo, "asistente de servicio al cliente"), sus funciones principales (por ejemplo, "reservar citas", "responder a preguntas de productos") y las mediciones de éxito para cada una.
Establecer barandillas personales y éticas: Este paso implica el diseño de la personalidad del agente y la definición de sus límites éticos para garantizar su fiabilidad y seguridad. Establece el tono del agente (por ejemplo, "formal", "amistoso") e implementa reglas estrictas para evitar respuestas dañinas, sesgadas o inapropiadas.
Contexto y comprensión de mapas: Debe determinar qué información necesita comprender y recordar el agente para ser efectivo. Esto incluye definir el ámbito de su base Knowledge y su memoria conversacional, lo que le permite tener pláticas coherentes y de múltiples turnos.
Identificar herramientas e integraciones del sistema: Esto implica el inventario de los sistemas externos, las API y los orígenes de datos con los que el agente debe conectarse para ejecutar tareas. Cada herramienta (por ejemplo, una API de reserva, una base de datos de clientes) está identificada y su función está asignada a una capacidad de agente específica.
Plan para la distribución humana en bucle: Es fundamental definir las condiciones bajo las cuales un agente se distribuye a un humano. Esto implica revisar posibles puntos de fallo y "calles sin salida" conversacionales para determinar cuándo un agente debe distribuirse a un operador humano. El diseño debe describir cómo se realizará esta transferencia para garantizar que se transfiere suficiente contexto, de modo que se pueda consumir rápidamente para garantizar una experiencia de cliente transparente.

Esta es la fase de construcción práctica donde el plan de diseño se convierte en un agente funcional. Los desarrolladores crean el agente, lo conectan a sus herramientas y lo potencian con los datos que necesita para realizar sus tareas. Este "bucle interno" iterativo de construcción y refinamiento es donde el agente realmente cobra vida.

Configurar la lógica y la toma de decisiones del agente: Este paso implica dar forma al razonamiento del agente conectando su marco de trabajo de toma de decisiones con contexto, herramientas y orígenes de datos. La función del desarrollador es definir el comportamiento del agente creando API o reutilizando API existentes, estableciendo barandillas operativas y especificando cómo el agente selecciona y utiliza herramientas disponibles para completar tareas complejas de múltiples pasos.
Solicitudes de ingeniero y modelos afinados: La persona, las instrucciones y las restricciones del agente se codifican a través de una ingeniería de solicitudes meticulosa. Este proceso implica la elaboración de la solicitud principal que guía el modelo de lenguaje grande (LLM) y, para casos de uso más avanzados, ajustar el modelo en datos específicos de dominio para mejorar su desempeño.
Integrar y proteger herramientas de IA: Las funciones y las API identificadas durante la fase de diseño están conectadas al agente. Utilizando un SDK, los desarrolladores encierran funciones existentes o crean nuevas, haciéndolas llamables de forma segura por el agente y asegurándose de que tienen la autenticación y el tratamiento de errores apropiados.
Crear datos y oportunidades en curso RAG: Para potenciar al agente con Knowledge externo, los desarrolladores crean las oportunidades en curso de datos para Recuperación-Generación aumentada (RAG). Esto implica conectar e indexar datos desde orígenes como establecimientos vectoriales, bases de datos relacionales, bases de datos de gráficos o documentos internos, haciendo que esa información sea accesible para el agente para proporcionar respuestas precisas y contextuales.

La prueba de agentes de IA presenta un cambio de paradigma desde la validación determinista del software tradicional. Aunque se prueba la corrección de una aplicación convencional (una entrada específica debe producir una salida única y esperada), la naturaleza no determinista de un agente requiere un enfoque más sofisticado. El objetivo no es validar una única respuesta correcta, sino garantizar que el comportamiento del agente está alineado con su propósito previsto, es sólido frente a entradas inesperadas y permanece fiable en un espectro de resultados aceptables.

Pruebas de unidades: Esta capa se centra en los componentes deterministas no de IA del agente. Implica pruebas de unidad tradicionales para validar que cada herramienta y función individual funciona correctamente de forma aislada, garantizando una base fiable antes de que se aplique el razonamiento complejo del agente.
Pruebas de extremo a extremo (E2E): Esta etapa evalúa la capacidad del agente para alcanzar objetivos en escenarios realistas, lo que es crítico dada su naturaleza no determinista. En vez de comprobar un resultado exacto, estas pruebas integrales verifican que el agente completa tareas correctamente y que su desempeño no se degrada a medida que se realizan cambios.
Pruebas adversariales y de robustez: Esta es la práctica de intentar intencionadamente romper el agente para descubrir de forma proactiva sus debilidades. Los probadores utilizan solicitudes ambiguas, solicitudes maliciosas y otros casos extremos para exponer vulnerabilidades y garantizar que el agente permanece resistente y seguro bajo presión.
Evaluación humana en bucle (HITL): Como las pruebas automatizadas no pueden medir cualidades matizadas como el tono o el flujo conversacional, esta etapa se basa en comentarios humanos. Los probadores interactúan con el agente para puntuar sus respuestas para mayor utilidad y experiencia de usuario general, proporcionando datos esenciales para ajustar su comportamiento.
Pruebas de desempeño y escala: Este es un paso crítico para evitar cuellos de botella de desempeño antes de que afecten a los usuarios. Este proceso simula escenarios de uso máximo realistas para garantizar que los agentes y las aplicaciones puedan gestionar altos volúmenes de forma fluida y predecible. Valida que la solución no solo sea correcta, sino también ampliable.

La implementación de un agente de IA es un proceso gestionado centrado en garantizar que el agente validado es con el que interactúan los usuarios de forma fiable y repetible. Esto requiere un enfoque estructurado que mueva al agente de un activo controlado por versión a un servicio monitoreado en vivo.

Control de paquetes y versiones: Toda la definición del agente, incluyendo sus solicitudes y herramientas, se captura como metadatos en un archivo y se almacena en un sistema de control de origen como Git. Esto crea una única fuente de verdad y un historial auditable de todos los cambios.
Oportunidades en curso CI/CD: La ruta a la producción está automatizada para eliminar errores humanos y garantizar la coherencia. Estas oportunidades en curso promocionan automáticamente al agente a través de entornos de desarrollo, pruebas y producción, ejecutando pruebas de extremo a extremo en cada etapa para actuar como una puerta de calidad.
Estrategias de implantación por fases: Para minimizar el riesgo, las nuevas versiones de agentes se publican para un pequeño subconjunto de usuarios primero utilizando estrategias como Canary Releases. Esto permite el monitoreo del desempeño real antes de una implementación completa, con la capacidad de revertir rápidamente si se encuentra cualquier problema.
Activación y gobernanza: El paso crítico en la implementación de un agente implica activar el agente de forma segura con los permisos correctos y garantizar que está conectado a herramientas de monitoreo. Esto proporciona visibilidad inmediata sobre el estado y el desempeño del agente recién implementado desde el momento en que se pone en marcha.

La implementación no es el final del ciclo de vida de desarrollo de agentes; es el comienzo de su "bucle externo" continuo. Los agentes son sistemas dinámicos que operan en entornos reales impredecibles. Esta fase está dedicada a observar el desempeño en vivo del agente, recopilar perspectivas de sus interacciones y utilizar esos datos para ajustar y mejorar sistemáticamente su efectividad, seguridad y eficiencia con el tiempo.

Monitoreo de desempeño en tiempo real: Esta es la práctica de realizar un seguimiento de las mediciones operativas clave del agente cuando interactúa con usuarios. Los tableros se utilizan para monitorear la latencia, el consumo de tokens (costo) y los índices de error de API, proporcionando una vista inmediata de alto nivel del estado y la eficiencia del agente.
Comportamiento y análisis de éxito: Esto implica el análisis de registros conversacionales para comprender cómo el agente está realizando actualmente sus funciones. Se centra en el seguimiento de los índices de realización de tareas, la identificación de puntos de fallo comunes o callejones sin salida conversacionales y la medición de la satisfacción del usuario para determinar si el agente está alcanzando sus objetivos con éxito. Como ejemplo para agentes de Servicio, podría proporcionar mediciones sobre la frecuencia y el motivo por el que un agente se distribuye a un humano.
Ajuste y refinamiento inteligente: Este es el proceso activo de utilizar perspectivas de monitoreo para mejorar el agente. Esto puede ir desde la ingeniería de solicitudes a la optimización de herramientas.
Mejora de RAG dirigida por datos: La calidad de la base de Knowledge del agente se mejora continuamente basándose en consultas del mundo real. El monitoreo puede revelar que el agente tiene problemas con ciertos temas, lo que lleva a un ajuste de los orígenes de datos o el proceso de recuperación (RAG Refinement) para mejorar la precisión de sus respuestas.
Aprendizaje y adaptación continuos: Esto implica la creación de un bucle de comentarios donde los datos de producción se utilizan para hacer que el agente sea más inteligente. Al etiquetar registros de interacciones (ya sea con supervisión humana o etiquetado basado en LLM), se crea un conjunto de datos depurado, que se puede utilizar para ajustar el modelo subyacente y recomendar mejoras adicionales

Agentforce admite cada fase de ADLC con herramientas integradas para el diseño, el desarrollo, las pruebas, la implementación, el monitoreo y los análisis, todo ello dentro de una única plataforma unificada para crear y probar rápidamente agentes sólidos.

Agentforce ADLC se basa en los siguientes principios rectores:

Creado para códigos bajos y procódigo: Compatibilidad con la implementación basada en configuración (código bajo) y la capacidad de ampliación programática (código pro).
Bucles continuos de asistencia y comentarios dirigidos por IA: Captura y analiza datos conversacionales para informar al agente sobre el ajuste para una mejora continua dirigida por la IA.
Desarrollo dirigido por pruebas en todos los niveles: Pruebas rigurosas en todas las etapas, validando componentes deterministas a través de pruebas de unidades tradicionales y proporcionando nuevos enfoques para probar el razonamiento de agentes y el comportamiento no determinista.
Observabilidad ejecutiva y de LOB: Proporcionando mediciones de costo, uso y desempeño para partes interesadas operativas y ejecutivas.

Diagrama del marco de trabajo ADLC Agentforce

Este capítulo muestra cómo Agentforce apoya cada fase del ADLC en una única plataforma unificada.

Ideación

La fase de ideación es la etapa fundamental del ADLC, donde se formulan la visión inicial y los requisitos para los agentes. Implica profundizar en la comprensión del problema, identificar posibles soluciones y describir las funciones principales del agente.

Inicie el proceso de ideación de su agente definiendo sus atributos clave:

Propósito/Objetivo: Defina claramente el objetivo principal del agente. ¿Qué problema específico está diseñado para resolver, o qué tarea se pretende realizar? ¿A quién debe servir el agente? Esta debe ser una declaración concisa y mensurable que guíe todo el proceso de desarrollo.
Persona: Desarrolle una persona detallada para el agente. Esto incluye definir su identidad, estilo de comunicación y la función que desempeñará en la interacción con usuarios u otros sistemas. Considere su tono, nivel de formalidad y cualquier característica específica que lo hará efectivo en su contexto previsto.
Patrón: Identifique y vincule a patrones de agentes relevantes y estrategias de implementación. Esto implica diseños arquitectónicos o mejores prácticas que pueden informar la estructura y el comportamiento del agente. "Patrones e implementación de agencia en Salesforce Agentforce: Un documento técnico" sirve como un recurso valioso para este paso, ofreciendo perspectivas sobre el diseño de agentes efectivo en Salesforce Platform y Agentforce.

Diseño

La fase de diseño traduce los conceptos desde la ideación a un plan detallado para la construcción del agente. Esto implica definir la arquitectura del agente, los flujos de usuario, los modelos de interacción y las especificaciones técnicas como temas, herramientas y salvaguardas.

Durante la fase de diseño, creará un plan detallado para la construcción de su agente que incluye:

Diseño de agentes: Describa la estructura interna del agente, incluyendo sus componentes, módulos y cómo interactúan. Esto podría implicar definir la base de Knowledge, la configuración y la lógica para controlar el comportamiento de los agentes, los componentes de procesamiento de lenguaje natural (NLP) y los puntos de integración con otros sistemas.
Flujos de usuario/Diseño de interacciones: Asigne la trayectoria de usuario completa y las interacciones del agente. Defina flujos de plática, árboles de decisiones, gestión de errores y mecanismos de comentarios para crear experiencias intuitivas y efectivas.
Especificaciones técnicas: Documente los requisitos técnicos no funcionales para el agente, como mediciones de desempeño, consideraciones de escalabilidad, protocolos de seguridad y especificaciones de integración.
Prototipado y maquetas: Cree representaciones visuales o prototipos interactivos de la interfaz y las interacciones del agente. Esto permite pruebas tempranas y comentarios, ayudando a refinar el diseño antes de que comience el desarrollo a gran escala.
Datos: Cuando determine el tipo y los orígenes de datos que requiere un agente, identifique conjuntos de datos, API, bases de datos y repositorios a los que debe acceder el agente. Para Agentforce, céntrese en qué datos se proporcionan como contexto, si están estructurados o no y si son en tiempo real o por lotes. La plataforma Agentforce está construida con una integración profunda con Data 360, lo que le permite utilizar datos estructurados y no estructurados desde Salesforce CRM y otros orígenes. El contenido no estructurado se puede segmentar e indexar de forma nativa para RAG. MuleSoft le permite conectarse a sistemas externos.
Herramientas: Identifique las acciones que el agente debe realizar. Utilice Acciones Agentforce para exponer herramientas que alcanzan objetivos de negocio. Estas acciones aprovechan activos de Salesforce existentes como Solicitudes a través del Generador de solicitudes, MuleSoft, Apex, Flujos y API con especificaciones de OpenAPI. Cualquier acción invocable se puede integrar en Agentforce y utilizar por el agente, haciendo que todas las herramientas de desarrollo de Salesforce familiares estén disponibles como Acciones Agentforce.
Datos de entrada para agentes: En SDLC tradicional, las entradas se especifican con precisión. En el ADLC, las entradas son a menudo expresiones naturales, no deterministas y de forma libre. Recopile un corpus representativo de expresiones que se espera que produzcan respuestas apropiadas.

La fase de desarrollo se centra en traducir el propósito, las funciones y el ámbito operativo del agente definidos determinados en la fase Ideación y diseño en un nuevo agente Agentforce.

Para ayudar a los desarrolladores a crear agentes, Agentforce proporciona Agent Builder y Agentforce Developer Experience (AFDX). Estas herramientas fundamentales sirven como los entornos principales para construir y configurar el agente.

Agent Builder proporciona una experiencia de interfaz de usuario para definir las funciones principales del agente.
AFDX proporciona una interfaz programática para la personalización e integración con otros sistemas.

El desarrollo y la creación de un agente implica estos pasos que se pueden realizar utilizando Agent Builder o AFDX:

Definición de la persona: Un aspecto crucial del diseño de agentes es establecer una persona distinta. Esto implica la configuración de:
- Descripción de agente: Una descripción detallada de la función del agente, los objetivos y las tareas de servicio al cliente específicas para las que está diseñado.
- Tono: El estilo de comunicación del agente, el nivel de empatía y cualquier directriz de marca específica que necesita cumplir.
Definición de temas y acciones de agentes: Para hacer que un agente sea sofisticado y capaz de gestionar una amplia gama de tareas, es esencial desglosar sus funciones en distintos temas con las acciones correspondientes.
- Temas: Cada tema puede conceptualizarse como su propio agente especializado con un conjunto exclusivo de instrucciones y herramientas.
  - Arquitectura modular. El enfoque modular de los temas permite una mayor organización y capacidad de ampliación. Al definir múltiples temas, el agente puede gestionar una gama más amplia de escenarios complejos. Por ejemplo, un agente podría tener temas separados para "Gestión de pedidos", "Preguntas más frecuentes", "Asistencia técnica" y "Consultas de facturación".
- Instrucciones de tema (barandillas): Cada tema incluye instrucciones específicas que actúan como salvaguardas, definiendo el ámbito de lo que el agente puede debatir o hacer dentro de ese tema. Estas instrucciones evitan que el agente se desvíe del tema o proporcione información irrelevante. También ayudan a mantener la coherencia y la precisión en las respuestas.
- Acciones: Los temas también están equipados con "herramientas", que representan las acciones que el agente puede realizar. Estas herramientas pueden ser:
  - Acciones informativas: Recuperación de datos desde una base Knowledge o un sistema externo para responder a una consulta.
  - Acciones transaccionales: Realizar acciones en nombre del usuario, como realizar un pedido, actualizar un registro de cliente o iniciar un proceso de reembolso. Estas acciones a menudo se integran con otros sistemas (por ejemplo, CRM, ERP).

Al evaluar el desempeño y la fiabilidad de los agentes de IA, los probadores a menudo se encuentran con una serie de retos que pueden degradar la experiencia del usuario. Estos problemas van desde una mala interpretación de la intención del usuario hasta el fallo en la ejecución de tareas correctamente.

Escenarios de fallo de agentes comunes

Crear un agente sólido requiere comprender cómo y dónde puede fallar. La siguiente tabla categoriza los problemas comunes encontrados durante el ciclo de vida de los agentes, desde un razonamiento defectuoso hasta una mala recuperación Knowledge. Utilice esto como una guía estratégica durante el desarrollo y una lista de comprobación durante las pruebas para garantizar que su agente no solo es funcional, sino también confiable e intuitivo para el usuario final. Estos escenarios de fallo deben ayudarle a definir casos de prueba.

Categoría	Descripción	Ejemplos de fallos
Clasificación de temas	El agente no identifica correctamente la intención o el objetivo del usuario.	Desencadena temas incorrectos para consultas específicas. A menudo toma como valor predeterminado una clasificación "Fuera de tema" de forma inapropiada.
Calidad de respuesta	Fallos en el contenido, la precisión y el formato de las respuestas del agente.	Proporciona información sin fundamento que no se origina desde su base Knowledge. Genera respuestas que están fuera de su experiencia de dominio designado. Incluye información incorrecta a pesar de hacer referencia a orígenes válidos. Entrega mensajes excesivamente largos, lo que es especialmente problemático para usuarios móviles.
Ejecución de acciones	El agente falla al intentar realizar una función o tarea específica.	Invoca acciones incorrectas o acciones inesperadas. Devuelve mensajes de error en vez de completar la acción solicitada. Sugiere innecesariamente la distribución a un agente humano. Falla al recopilar correctamente las variables de entrada requeridas del usuario.
Barandillas e instrucciones	El agente infringe reglas, restricciones o límites conversacionales predefinidos.	Omite instrucciones operativas explícitas. Realiza intentos de distribución inesperados o prematuros en agentes humanos. Muestra mensajes inapropiados de "Retención por favor" durante la ejecución de la acción. Muestra mensajes de error genéricos como "No puedo ayudar con eso en este momento" o "Error del sistema".
Recuperación de Knowledge	El agente tiene problemas para obtener y presentar información desde su base Knowledge.	Recupera artículos irrelevantes de la base de Knowledge. Incluye información innecesaria o no deseada en sus respuestas.
Directrices estructuradas	El agente tiene dificultades para guiar a los usuarios por procesos de múltiples pasos.	Proporciona asesoramiento genérico y sin fundamento para la solución de problemas. Presenta demasiados pasos en un solo mensaje. Pierde contexto durante un proceso de solución de problemas en curso. Se atasca en pasos de solución de problemas individuales. Repite preguntas a pesar de que ya recibió respuestas válidas.

Mejores prácticas para probar agentes de IA

A continuación se describen las mejores prácticas a tener en cuenta al probar Agentes en Agentforce.

Mejorar datos de prueba
La base de pruebas efectivas son datos de prueba completos y realistas. Siga estos principios para asegurarse de que tiene datos de prueba efectivos para probar sus agentes:
- Cobertura suficiente: Procure tener suficientes datos de prueba para cubrir todos los temas críticos y personas de usuario.
- Escenarios realistas: Asegúrese de que sus datos de prueba representan con precisión interacciones de usuario reales.
- Casos negativos y Edge: Incluya casos de prueba negativos (lo que el agente no debe hacer) y escenarios extremos para desafiar los límites del agente.
- Pruebas de barandillas: Agregue casos de prueba específicos diseñados para verificar que las barandillas del agente funcionan correctamente.
Optimizar ejecuciones de pruebas
Para aprovechar al máximo sus recursos de prueba, optimice el modo en que ejecuta sus pruebas. Las siguientes son consideraciones al probar agentes Agentforce:
- Volumen de caso: de prueba Puede utilizar hasta 1.000 casos de prueba.
- Ejecutar pruebas simultáneas: Es posible ejecutar hasta 10 casos de prueba a la vez en un periodo de tiempo de 10 horas.
- Gestionar recursos: Tenga en cuenta que la ejecución de pruebas consume créditos. Asegúrese de que está satisfecho con sus datos de prueba antes de iniciar una ejecución para evitar costos innecesarios.
Revisar resultados
Analice cuidadosamente los resultados de las pruebas para identificar áreas de mejora:
- Analizar fallos: Inspeccione cada caso de prueba fallido individualmente. Lea y comprenda cuidadosamente la diferencia entre los resultados esperados y los reales para precisar el problema.
- Utilizar un entorno sandbox: Los agentes de pruebas pueden modificar datos de CRM. Para evitar cambios no intencionados en sus datos en vivo, realice siempre pruebas en un entorno que no sea de producción, como un sandbox o una organización borrador.
Ajustar y volver a probar
Las pruebas son un proceso iterativo que continúa a medida que evoluciona el agente:
- Prueba continuamente: Realice pruebas después de cada modificación en los temas o acciones del agente. Esto valida los cambios y garantiza que se mantiene la calidad.
- Ampliar cobertura de prueba: Depure y amplíe continuamente su conjunto de datos con nuevos casos de prueba para mejorar la cobertura general y la solidez del agente.

Enfoques de prueba

Dada la complejidad del agente, no es suficiente un único método de prueba. Una estrategia de validación integral debe estar en capas, combinando diferentes enfoques para cubrir todo, desde acciones predecibles y deterministas hasta los matices de su comportamiento conversacional no determinista. Estos enfoques proporcionan un marco para evaluar sistemáticamente cada componente del agente para garantizar que es sólido, fiable y seguro.

Pruebas manuales con Simulador de agentes y Rastreador de planes
- Objetivo: Esta es la forma inicial y a menudo más sencilla de probar un agente. Es ideal para un pequeño conjunto de casos de uso de muestra y para obtener una comprensión fundamental del comportamiento del agente.
- Mecanismo: Un simulador de agente proporciona un entorno controlado donde los desarrolladores y administradores pueden interactuar directamente con el agente. Este simulador permite el rastreo detallado de la información proporcionada por el administrador/desarrollador, ofreciendo perspectivas sobre cómo procesa el agente entradas y genera salidas.
- Beneficios:
  - Comentarios rápidos
  - Fácil de identificar problemas inmediatos
  - Ayuda a comprender el flujo de lógica del agente
Pruebas automatizadas con Centro de pruebas o AFDX Test Suite
- Objetivo: Una vez que las pruebas manuales han establecido una línea base de funciones, las pruebas automatizadas se convierten en cruciales para las pruebas de escalabilidad, minuciosidad y regresión.
- Mecanismo: Herramientas como el Centro de pruebas o el conjunto de pruebas de AFDX permiten la generación de pruebas automatizadas basadas en casos de uso de muestra predefinidos. Estas pruebas están diseñadas para validar si las instrucciones del agente y las clasificaciones de subagente están funcionando correctamente en una gama más amplia de escenarios.
- Beneficios:
  - Garantiza un desempeño coherente
  - Identifica fallos sutiles
  - Admite oportunidades en curso de integración continua/implementación continua (CI/CD)
  - Proporciona cobertura integral
Pruebas de unidades específicas de acciones utilizando Apex y flujos
- Objetivo: Para validar la lógica de negocio determinista encapsulada en acciones de agentes. Aunque el comportamiento general del agente no es determinista, las acciones del agente a menudo están impulsadas por tecnologías como Flows y Apex, a las que se aplican prácticas de desarrollo estándar.
- Mecanismo: Los desarrolladores redactan pruebas de unidad para los flujos específicos o clases Apex que invoca una acción de agente. Estas pruebas verifican los componentes individuales de la lógica del agente, garantizando que producen los resultados esperados para un conjunto de entradas concreto.
- Beneficios:
  - La integración de estas pruebas de unidad en una canalización de DevOps proporciona una red de seguridad automatizada
  - Valida que cualquier cambio o mejora en la lógica de una acción no introduzca regresiones
  - Garantiza la fiabilidad de las funciones del agente antes de su implementación en producción
Pruebas adversarias: seguridad y aplicación de la barandilla:
- Objetivo: La creación de varios tipos de agentes requiere un fuerte énfasis en la seguridad y garantizar que operan dentro de parámetros y barandillas definidos. Esto es fundamental para evitar acciones no intencionadas, brechas de datos o uso indebido. Por lo tanto, el objetivo de las pruebas contradictorias es identificar y remediar de forma proactiva estas posibles vulnerabilidades desafiando deliberadamente al agente con entradas diseñadas para eludir sus mecanismos de seguridad, probando así su robustez y resistencia a la manipulación.
- Mecanismo: Las pruebas adversarias se implementan creando entradas desafiantes, ambiguas o maliciosas que superan los límites del comportamiento previsto del agente. Aunque las herramientas de plataforma como la función "Barandillas" en Generador de agentes proporcionan perspectivas sobre la adhesión a instrucciones, los desarrolladores también deben crear casos de prueba contradictorios personalizados que intenten activamente hacer que el agente falle en un entorno controlado.
- Beneficios: Este enfoque mitiga sistemáticamente los riesgos de seguridad y cumplimiento antes de la implementación. Identificando posibles puntos de fallo, las pruebas contradictorias mejoran la fiabilidad de los agentes y garantizan que funcionarán de forma segura y según lo previsto al interactuar con usuarios.

Pruebas iterativas en organizaciones borrador y entornos sandbox

El “bucle interno” es el ciclo iterativo crítico donde un agente pasa del concepto a un componente validado, listo para su implementación. Este proceso de perfeccionamiento continuo requiere entornos tanto para el desarrollo como para las pruebas. Agentforce proporciona este marco de trabajo a través de organizaciones borrador, que son entornos temporales aislados para un prototipado rápido que no afecta a entornos compartidos, y Sandboxes, que permiten pruebas exhaustivas con datos realistas para acelerar la ruta a la producción.

Desarrollo en organizaciones borrador: El desarrollo inicial debe producirse en una organización borrador. Las herramientas proporcionadas en el entorno de desarrollo, como Agent Builder y AFDX, se utilizan completamente aquí. Las organizaciones borrador son candidatas sólidas para oportunidades en curso de CI/CD para ejecutar pruebas de unidad, realizar análisis de código y promover cambios en entornos superiores.
Implementación en Sandbox para pruebas de datos reales: Una vez desarrolladas las funciones principales del agente en una organización borrador, impleméntela en un entorno sandbox. Los entornos sandbox son copias de un entorno de producción, ofreciendo un campo de pruebas más realista.
- Datos reales frente a Datos simulados: Aunque algunos desarrolladores podrían simular datos en organizaciones borrador para pruebas iniciales, la implementación en un entorno sandbox permite realizar pruebas con "datos reales". Esto es crítico para evaluar el desempeño del agente en escenarios que reflejan de cerca las interacciones reales de los clientes. El uso de datos más representativos en un entorno sandbox acelera significativamente el proceso de desarrollo y refinamiento.
- Sandbox completo o parcial para datos principales de CRM: Dependiendo del volumen de datos y los requisitos de prueba específicos, se puede utilizar un entorno sandbox completo o parcial.
  - Sandbox completo: Proporciona una réplica completa del entorno de producción, incluyendo todos los metadatos y datos. Ideal para pruebas exhaustivas y ajuste de desempeño con grandes conjuntos de datos.
  - Sandbox parcial: Contiene un subconjunto de los datos de producción, a menudo suficiente para probar funciones o funciones específicas donde un conjunto de datos completo no es estrictamente necesario.
- Knowledge y Gestión de RAG: Si el agente se basa en un modelo de base de Knowledge o Recuperación-Generación aumentada (RAG), ingrese todo el contenido relevante en el entorno sandbox y vuelva a indexar. Esto garantiza que el agente utiliza información actual durante las pruebas y puede recuperar y sintetizar contenido con precisión.

Agentforce define agentes a través de metadatos, de modo que pueden implementarse utilizando procedimientos estándar de Salesforce como Conjuntos de cambios o AFDX. Esta fase hace hincapié en una implementación segura y controlada a través de funciones críticas como la versión de agentes y un paso de activación separado, que garantiza la estabilidad del sistema y permite una recuperación rápida de problemas.

Siga estos pasos para implementar y liberar su nuevo agente.

Implementar a través de API de metadatos/conjunto de cambios o AFDX: El proceso de implementación para agentes aprovecha los procedimientos estándar de Salesforce, tratando a los agentes como metadatos. Este debe ser un proceso familiar para cualquiera acostumbrado al desarrollo y la implementación de Salesforce. La utilización de conjuntos de cambios o AFDX garantiza un enfoque estructurado y coherente para la migración de configuraciones de agentes entre entornos, como desde sandbox a producción. Este método facilita el control de versiones y la gestión de cambios adecuada, que son cruciales para mantener la estabilidad y fiabilidad del sistema.
Activar agentes después de la implementación: Tras una implementación correcta, es imperativo que un administrador del sistema "active" activamente al agente. La implementación simplemente coloca el código y los metadatos del agente en el entorno de destino; la activación es el paso que hace que el agente esté operativo y disponible para su uso. Esta separación permite la implementación y las pruebas controladas antes de que un agente entre en funcionamiento e interactúe con usuarios finales u otros componentes del sistema.
Utilizar versionado para Gestión de agentes segura: La versión de agentes es una función clave que mejora significativamente la seguridad y la flexibilidad del desarrollo y el mantenimiento de agentes.
1. Creación, prueba y publicación de nuevas versiones: La práctica recomendada implica la creación de una nueva versión de un agente siempre que se requieran cambios o mejoras. Esta nueva versión se puede probar a fondo en un entorno sandbox sin afectar al agente activado en vivo. Una vez validada la nueva versión y considerada lista, se puede publicar y activar posteriormente, sustituyendo la versión operativa anterior. Este proceso iterativo permite la mejora continua y la innovación mientras minimiza las interrupciones.
2. Reversión a versiones anteriores: Un beneficio clave de la versión es la capacidad de revertir rápida y fácilmente a una versión anterior estable si surge un problema con un agente recién implementado o activado. Si algo falla (por ejemplo, si un agente se comporta mal o introduce un error imprevisto), los administradores pueden simplemente revertir a la última versión buena conocida y activarla. Esta función proporciona una red de seguridad crítica, permitiendo una recuperación rápida y minimizando el tiempo de inactividad, garantizando así la continuidad del negocio y la satisfacción del usuario.

Monitoreo de agentes

Rastreo de sesiones Agentforce es un modelo abierto y ampliable construido sobre Data 360 que captura interacciones de agentes de extremo a extremo. El rastreo de sesiones Agentforce ingresa datos desde diferentes orígenes (comenzando por registros del motor de razonamiento) y combina todo bajo un Id. de sesión.

El modelo de datos de rastreo de sesiones (STDM) proporciona información detallada sobre lo que sucedió durante las sesiones de agentes, incluyendo:

Interacciones paso a paso
Razonamiento de ejecuciones de motor
Acciones, solicitudes y entradas/salidas de pasarela
Mensajes de error
Respuestas finales

STDM es una herramienta clave para ayudar a los desarrolladores a:

Problemas de configuración y configuración de agentes de depuración durante el tiempo de construcción.
Aprenda por qué fallaron ciertos casos de prueba durante las pruebas por lotes.
Dirección por la que un agente no puede gestionar un conjunto de preguntas de usuario o se está saliendo del tema.

Los desarrolladores deben utilizar estos datos de rastreo de sesión para observar, monitorear, investigar y solucionar problemas de eventos, incidentes y patrones de comportamiento de agentes.

STDM comprende Objetos de lago de datos (DLO) y Objetos de modelo de datos (DMO) que almacenan registros detallados del comportamiento de los agentes. Los metadatos acerca de cada llamada LLM realizada por el motor de razonamiento se pueden unir con mediciones de comentarios o barandillas. Transmisiones de datos en DLO en Data 360 y asignaciones a DMO aplicables.

Los desarrolladores pueden acceder a estos datos y obtener perspectivas ejecutando consultas y reportes en STDM. Los componentes de un STDM se describen a continuación.

Modelo de datos de rastreo de sesiones Agentforce ERD

Un diagrama de relaciones de entidad que muestra las entidades y relaciones del modelo de datos Rastreo de sesiones de Agentforce

Objeto de lago de datos/Objeto de modelo de datos	Descripción
AIAgentSession	Un contenedor global que captura interacciones contiguas con uno o más agentes de IA.
AIAgentSessionParticipant	Entidad (humana o de IA) que participa en una AIAgentSession.
AIAgentInteraction	Un segmento dentro de una sesión. Normalmente comienza con la solicitud de un usuario y finaliza cuando el agente de IA proporciona una respuesta a esa solicitud.
AIAgentInteractionStep	Una acción u operación discreta realizada durante una interacción para satisfacer la solicitud del usuario.
AIAgentInteractionMessage	Comunicación única proporcionada por el usuario o generada por el agente de IA durante una sesión.

Optimización Agentforce

Agentforce Optimization es una potente función diseñada para mejorar el desempeño de los agentes de IA proporcionando perspectivas en profundidad sobre interacciones de usuarios. Construido sobre las funciones de análisis del modelo de datos de rastreo de sesiones (STDM), permite a los administradores y desarrolladores comprender temas de usuario, patrones de implicación y la efectividad de resoluciones de agentes.

Los aspectos clave de la optimización Agentforce incluyen:

Datos específicos de momentos: Agentforce Optimization amplía STDM introduciendo "Momentos", que representan interacciones centradas en una intención o solicitud de usuario específica durante una sesión. Estos datos granulares permiten la inspección detallada de cada aspecto de una interacción, desde la solicitud inicial del usuario hasta la resolución del agente.
Procesamiento de momentos automatizado: Los momentos se generan diariamente y luego se agrupan y etiquetan semanalmente entre todos los agentes activos utilizando un modelo de lenguaje grande (LLM) avanzado. Esta segmentación simplifica las consultas y proporciona perspectivas sobre varias facetas de sesiones de agentes.
Consulta y análisis: Los usuarios pueden consultar Momentos basándose en etiquetas, puntuajes de calidad y otros criterios. Esto permite la evaluación de la implicación de los usuarios a través de mediciones como la duración de momentos y los puntuajes de calidad de relevancia, ayudando a precisar áreas de mejora.
Modelo de datos unificado: La optimización Agentforce aprovecha el modelo de datos de rastreo de sesiones (STDM) unificado, que captura cada evento registrado en una sesión, incluyendo turnos de plática individuales. Todas las entidades relevantes se aprovisionan al activar STDM en la configuración.

Al analizar interacciones de agentes de IA, la optimización Agentforce capacita a los usuarios para identificar áreas de mejora y refinar configuraciones para cumplir mejor las necesidades de los usuarios.

Para obtener más información, consulte Modelo de datos para Agentforce Optimization.

Este capítulo es una guía práctica para desarrolladores de códigos profesionales. Muestra cómo crear, probar e implementar agentes con Agentforce DX (AFDX) y nuestro SDK de Python con velocidad y seguridad. Pasaremos por todo el ciclo de vida, desde el diseño inicial hasta un agente controlado por versión, utilizando la potente combinación de AFDX y nuestro SDK de Python.

Los siguientes ejemplos aprovecharán dos conjuntos de herramientas clave diseñados para crear y gestionar agentes en la plataforma Agentforce. Se recomienda una comprensión fundamental de estas herramientas para obtener el máximo provecho de esta guía.

1. Agentforce DX (AFDX): Para la gestión del ciclo de vida

Agentforce DX amplía el conjunto de herramientas conocido Salesforce Developer Experience (SFDX), incluyendo las extensiones Salesforce CLI y VS Code, para dar cobertura a todo el ciclo de vida de desarrollo de agentes. Se utiliza para gestionar un agente como metadatos controlados por versión, automatizar pruebas desde la línea de comandos y orquestar implementaciones entre sus entornos sandbox de desarrollo y producción.

Para obtener más información, consulte: Primeros pasos con Agentforce DX Development.

2. SDK de Python Agentforce: Para construir el agente

El SDK de Python proporciona la interfaz programática para el "bucle interno" de desarrollo. Le permite definir la lógica de razonamiento de un agente, conectar sus herramientas y gestionar plantillas de solicitudes directamente en un entorno Python familiar, simplificando la fase de construcción principal del ADLC.

El SDK está disponible en PyPI: https://pypi.org/project/Agentforce-sdk/.

El proyecto completo está disponible aquí:
https://github.com/akshatasawant9699/ADLC_Whitepaper.

Esta fase fundacional define el propósito, la persona y las funciones principales de un agente. Implica responder a preguntas críticas para diseñar el "cerebro" del agente antes de redactar cualquier código. En este ejemplo, estamos diseñando un agente para Coral Cloud Resorts.

Misión: El agente actúa como un gerente de resort, gestionando quejas de clientes, gestionando programaciones de empleados y garantizando un funcionamiento sin problemas del resort.
Persona: El agente tiene un tono útil, profesional y conversacional.
Herramientas y funciones: El agente necesita acceso a sistemas de reserva, software de programación de empleados y políticas de resort.
Lógica de decisión: El agente utiliza temas generados por IA para determinar la intención del usuario y generar acciones apropiadas.

Con Agentforce DX, la fase de diseño se traduce en un archivo de especificación tangible: Agenteforce DX: Generación de una especificación de agente. El primer paso en la trayectoria de procódigo es generar un archivo agentSpec.yaml. El archivo YAML captura el diseño principal del agente, incluyendo su función, detalles relevantes de la compañía y una lista generada por IA de temas que definen los trabajos que puede gestionar.

Utilice Salesforce CLI para generar esta especificación a través de solicitudes interactivas. Para empezar a crear su agente con Agentforce DX, ejecute:

Tendrá que proporcionar detalles específicos que se definieron durante la fase de ideación:

Tipo de agente: Cliente
Nombre de compañía: Resorts en Coral Cloud
Descripción de compañía: Coral Cloud Resorts proporciona a los clientes actividades de destino excepcionales, experiencias inolvidables y servicios de reserva, todo ello respaldado por el compromiso de proporcionar un servicio al cliente de primer nivel.
Función de agente: El gerente del complejo presenta quejas de clientes, gestiona programaciones de empleados y garantiza que todos los procesos se ejecutan sin problemas.

La ejecución de este comando crea un archivo agentSpec.yaml en el directorio de especificaciones del proyecto DX. El archivo contiene la información que se proporcionó junto con una lista de temas generados por IA que incluyen el nombre y la descripción de cada tema. Revise y modifique el archivo según sea necesario para refinar las funciones del agente.

Del mismo modo, la implementación del SDK de Python utiliza la recopilación de especificaciones interactiva para generar automáticamente temas de agentes con campos de ámbito apropiados requeridos para la compatibilidad del SDK.
Además, creará un archivo JSON de especificación de agente completo que se utilizará para crear un agente en Fase 2.

La fase de desarrollo se centra en la construcción de los componentes principales del agente: el motor de razonamiento, las herramientas que puede utilizar y su base Knowledge. Agentforce abstrae gran parte de la complejidad, lo que permite a los desarrolladores centrarse en la lógica de negocio.

Esta sección comparte dos enfoques de procódigo para la fase de desarrollo Agentforce. En primer lugar, utilizando Agentforce DX y, en segundo lugar, utilizando Python.

Agentforce DX: Crear un agente desde una especificación

Una vez que el archivo agentSpec.yaml esté listo, cree el agente en su organización de Salesforce. Ejecute este comando para crear el agente y sincronizar sus metadatos asociados con su proyecto DX local:

Cuando se le solicite, acepte el nombre de API predeterminado, Resort_Manager. El comando analiza la especificación, crea el agente y recupera los metadatos. Los metadatos incluyen un Bot, BotVersion y un GenAiPlannerBundle, que agregan inteligencia de IA y referencias a los temas y acciones del agente.

Realice una vista previa de la estructura del agente antes de crearlo agregando el indicador ---vista previa para generar un archivo JSON local que detalla el tipo de agente que el LLM va a crear, incluyendo acciones sugeridas. Por ejemplo:

Para obtener más información, consulte Crear un agente desde su proyecto DX desde Trailhead.

SDK de Python Agentforce: Definir herramientas específicas

El SDK de agente facilita las pruebas de agentes creando acciones simuladas. Estas acciones simuladas tendrán que sustituirse con acciones reales en Salesforce. Salesforce ofrece una gama de funciones de plataforma, incluyendo Flujos, Apex, Plantillas de solicitudes y API, todas las cuales se pueden encapsular como acciones Agentforce.

Este es un miniprograma de código de acción simulado para ilustrar el aspecto de una acción Agentforce.

La implementación establece la conexión con Salesforce, crea la instancia del agente y define herramientas y acciones personalizadas que el agente puede utilizar para interactuar con sistemas externos y realizar funciones de negocio específicas.

Como hemos comentado anteriormente, probar un agente es más complejo que las pruebas de software tradicionales. Requiere validar el comportamiento, el razonamiento y la solidez entre varios escenarios. Esto incluye pruebas de unidad para herramientas individuales, pruebas de extremo a extremo para pláticas y pruebas contradictorias para encontrar vulnerabilidades.

Agenteforce DX proporciona un flujo de trabajo de alto nivel para crear, implementar y ejecutar pruebas además del Centro de pruebas y la API de pruebas directa. Esta sección demuestra la ejecución de pruebas con Agentforce DX.

Agentforce DX: Ejecutar una prueba de agente

Utilice Agentforce DX para ejecutar pruebas de agentes predefinidas directamente desde la línea de comandos. Esto es ideal para integrar pruebas de agentes en procesos de DevOps modernos.

SDK de Python Agentforce: Simular pruebas E2E y adversariales

Conceptualmente, Python SDK permite pláticas con secuencias de comandos para simular pruebas de extremo a extremo (E2E) y validar el razonamiento de agentes.

SDK de Python Agentforce con API de pruebas de Salesforce

La implementación del SDK de Python utiliza pruebas integrales con metadatos de API de pruebas de Salesforce y AiEvaluationDefinition, creando casos de prueba estructurados con expectativas para secuencias de temas, secuencias de acciones, coincidencia de cadenas y mediciones de calidad. El sistema genera definiciones de metadatos XML que se pueden implementar en Salesforce para pruebas y validación automatizadas de agentes.

Una vez validado, el agente se implementa en un entorno de producción. Durante esta fase, Agentforce DX es crucial para ayudar a gestionar y mover metadatos de agentes entre diferentes organizaciones (por ejemplo, entornos sandbox y producción). Las implementaciones de agentes crean una nueva versión del Agente y el Agente no se pone en marcha hasta que lo active explícitamente. Esto le proporciona el control completo de cuándo lanzar la nueva versión del agente.

Agentforce DX: Implementar metadatos de agentes

La estructura del proyecto Salesforce DX estándar organiza metadatos de agentes bajo el directorio force-app. Utilice comandos de implementación de proyectos estándar para implementar un agente y sus pruebas asociadas en una organización de destino.

Después de crear o implementar un agente, puede abrirlo directamente en la interfaz de usuario Agentforce Builder para verificar su configuración ejecutando:

Después de validar que el agente está implementado, puede activarlo. Si encuentra cualquier problema inesperado, revierta a la versión de trabajo anterior del agente.

SDK de Python Agentforce: Implementación de implementación de agentes

La implementación toma la especificación de agente validada y la implementa en la organización de Salesforce, haciendo que el agente esté disponible para su uso. El proceso de implementación incluye la creación de agentes, la sincronización de metadatos y la verificación de la implementación correcta.

ADLC es un ciclo continuo; la implementación no es el final. Los agentes son sistemas vivos que requieren monitoreo constante para realizar un seguimiento de mediciones como latencia, costo e índices de éxito. Las perspectivas obtenidas del monitoreo se utilizan para ajustar y mejorar el desempeño de los agentes a través de ingeniería de solicitudes, optimización de herramientas y refinamiento de bases Knowledge.

La plataforma Agentforce proporciona tableros y análisis completos para apoyar esta fase crucial, garantizando que los agentes sigan evolucionando y mejorando con el tiempo.

Agentforce Analytics

Agentforce Analytics, que se encuentra en la carpeta Agentforce (Predeterminado), utiliza Data 360 para proporcionar perspectivas sobre el desempeño de los agentes. El tablero personalizable y los reportes ofrecen datos sobre la adopción, los comentarios y el uso, ayudándole a restringir temas y acciones para mejorar la satisfacción del usuario. Puede desglosar los resultados haciendo clic en gráficos o reportes vinculados. Para personalizar, duplique reportes existentes y modifique los duplicados para evitar interrumpir procesos de análisis.

Análisis de expresiones

Análisis de expresiones muestra cómo los usuarios Agentforce (Predeterminado) están utilizando agentes, qué están solicitando y si el agente pudo gestionar estas solicitudes. Estos reportes personalizables pueden ayudarle a restringir sus temas y acciones de modo que sus agentes respondan de forma más efectiva y precisa.

SDK de Python Agentforce: Monitoreo con integraciones de Data 360

La implementación del SDK de agente utiliza análisis y monitoreo avanzados con Conector Python de Data 360, estableciendo la conexión con Salesforce Data 360, consultando mediciones de desempeño de agentes y creando tableros de monitoreo integrales.
El sistema realiza un seguimiento de los tiempos de respuesta, los índices de éxito, la satisfacción del usuario y las mediciones de costos para proporcionar perspectivas sobre las que se pueden realizar acciones para la optimización de agentes.

Agentforce DX: Monitoreo de agentes

La implementación utiliza comandos de AFDX estándar con gestión de agentes basada en CLI, manteniendo al agente al día con los cambios de plataforma e incorporando comentarios de usuarios para una mejora continua.

Consulte el repositorio de GitHub aquí para la implementación de ADLC utilizando Agent SDK y AFDX.

Dominar el ciclo de vida de desarrollo de agentes requiere adherirse a un conjunto de principios principales que garantizan la eficiencia, la fiabilidad y la alineación estratégica. Las siguientes directrices sintetizan las lecciones clave de cada fase del ADLC en un marco estratégico para arquitectos y desarrolladores.

1. Planificación e ideación

Esta fase inicial se centra en alinear el propósito del agente con los objetivos de negocio y garantizar que se construye sobre una base sólida.

Priorizar para repercusión de negocio: Comience asignando casos de uso potenciales directamente a objetivos de negocio estratégicos. Utilice una matriz de priorización para puntuar su posible repercusión y comenzar con un caso de uso único y centrado con KPI claros.
Implicar a las partes interesadas pronto: Recopile perspectivas sobre puntos débiles y garantice la alineación.
Aprovechar perspectivas de datos: Un agente solo es tan bueno como sus datos. Utilice Data 360 para explorar datos estructurados y no estructurados disponibles para informar el contexto y las funciones del agente. Revise tableros y reportes existentes para identificar tendencias actuales que pueden informar su selección de casos de uso.
Utilizar marcos de trabajo para Ideación: Aplique métodos de ideación estructurados para realizar una lluvia de ideas y refinar posibles aplicaciones, como pensamiento de diseño o análisis DAFO.

2. Agentes de construcción

Esta fase cubre las mejores prácticas para construir un agente de alto desempeño y eficiente.

Evitar demasiados temas: Limite el número de temas para reducir el riesgo de crear temas similares o solapados que podrían confundir al agente.
Mantener instrucciones y solicitudes concisas: Utilice un lenguaje directo y sencillo y proporcione expresiones de ejemplo para guiar al agente de forma efectiva.
Variables de apalancamiento y acciones deterministas: Utilice estas herramientas para guiar el comportamiento del agente y optimizar su desempeño para resultados más predecibles.
Mantener los resultados de acciones pequeños y concisos: Asegúrese de que las respuestas del agente son breves y precisas. Las salidas más largas utilizan más contexto y su generación es más lenta.
Optimizar acciones para la velocidad: Diseñe flujos y clases Apex para devolver datos mínimos requeridos. Procure tener menos acciones necesarias para generar una respuesta mediante el procesamiento previo donde sea posible.
Definir un ámbito claro: Redacte descripciones, instrucciones y ámbito apropiados para acciones para evitar que el agente llame a RAG (Generación de recuperación aumentada) para preguntas fuera del ámbito.
Utilizar búsqueda híbrida con moderación: Solo utilice la búsqueda híbrida si es absolutamente necesario, ya que puede afectar negativamente a la latencia.

3. Pruebas, monitoreo y ajuste

Esta fase iterativa es crucial para refinar la precisión y el desempeño del agente.

Establecer un flujo de pruebas: Siga un ciclo de pruebas coherente:
1. Ejecutar prueba por lotes: Ejecute un conjunto completo de pruebas.
2. Ver puntuajes/errores: Analice las mediciones de desempeño e identifique fallos.
3. Inspeccionar fallos: Examine cada fila de fallo para comprender la discrepancia.
4. Actualizar agente: Realice los ajustes necesarios en el agente o sus datos de evaluación.
Revisar información de rastreo de sesiones: Utilice el Modelo de datos de rastreo de sesiones y Agentforce Interaction Explorer para realizar análisis de causa raíz cuando se identifican problemas o comportamientos inesperados. Ajuste su agente basándose en la información y continúe iterando su agente.

El Ciclo de vida de los agentes representa una evolución crítica de los principios de desarrollo de software tradicionales, diseñados para la era de los sistemas inteligentes y autónomos.

Evolución, no sustitución: Ciclo de vida de desarrollo de agentes amplía y mejora la Gestión del ciclo de vida de aplicaciones tradicional sin sustituirla.
Datos como ciudadano de primera clase: Los datos desempeñan un papel mucho más dinámico y central en el desarrollo de agentes.
Herramientas y habilidades especializadas: Requiere nuevas herramientas y un conjunto más amplio de habilidades especializadas en ciencia de datos, ingeniería de ML y desarrollo de agentes.
Aprendizaje continuo: El desarrollo de agentes agrega aprendizaje continuo y adaptación del sistema en sí.
Repercusión futura: La IA agente promete automatizar y optimizar aún más operaciones de TI complejas y flujos de trabajo de desarrollo de software.