Agentutviklingslivssyklusen: Fra konsept til produksjon | Agentforce | Grunnleggende

I tradisjonell programvareutvikling gir SDLC (Software Development Lifecycle) en strukturert, faset tilnærming til å bygge programmer. Den etablerer kvalitet, reduserer risiko og gir et tydelig veikart fra ide til utgivelse. Agentutviklingslivssyklus (ADLC) er en lignende metodikk som er tydelig skreddersydd for å løse de unike kompleksitetene ved bygging av autonome agenter.

Agenter er ikke passive programmer, de er systemer som mener, handler og lærer i dynamiske utførelsesmiljøer. Deres ikke-deterministiske virkemåte gjør tradisjonell kvalitetssikring utilstrekkelig. Agent Development Lifecycle (ADLC), som støttes av plattformer som Agentforce, tar seg av dette i fem faser: Ideer og utforming, Utvikling (den indre sløyfen), Testing og validering, Distribusjon og kontinuerlig overvåking og justering (den ytre sløyfen).

Dette dokumentet tjener som en omfattende veiledning for utviklere og bedriftsarkitekter som allerede er kjent med kompleksiteten i SDLC (Software Development Lifecycle) og ønsker å utvide sin ekspertise til agentbaserte systemer. Vårt primære mål er å lette en rask forståelse av agentutviklingslivssyklusen (ADLC) ved å fremheve dens nøkkelforskjeller fra tradisjonelle SDLC-metodologier og gi et strukturert rammeverk for å konseptualisere hele prosessen med å bygge, distribuere og behandle intelligente agenter.

Dokumentet er organisert i tre separate kapitler, hver av dem designet for å gradvis bygge opp din Knowledge og praktiske ferdigheter:

Kapittel 1: ADLC Framework. Dette kapitlet introduserer livssyklusen for agentutvikling (ADLC) med detaljer om avviket fra SDLC på grunn av de unike utfordringene med å utvikle autonome agenter. Den etablerer et rammeverk for utforming, utvikling, testing og distribusjon av agenter.
Kapittel 2: Agentforce Platform. Dette kapitlet utforsker Agentforce, en forent plattform som effektiviserer og akselererer hele livssyklusen for agentutvikling. Agentforce tilbyr verktøy for agentdesign, databehandling, modellopplæring, distribusjon og kontinuerlig overvåking for å forenkle komplekse oppgaver og forbedre effektiviteten.
Kapittel 3: Implementering av Pro-Code. Denne veiledningen bruker Agentforces kodeverktøy til å gi praktiske, trinnvise instruksjoner og eksempler for agentutvikling. Den dekker hele livssyklusen for agentutvikling, fra prototyping og funksjonsutvikling til modelldistribusjon, ytelsesjustering og vedlikehold, og gir utviklere kvalifikasjonene til å bygge produksjonsklare agenter.

Dette dokumentet tar sikte på å utstyre deg med den teoretiske og praktiske Knowledge av Agentforces pro-kodingsverktøy. Du vil lære å bygge, distribuere og overvåke agenter effektivt, sikkert og pålitelig, og få en omfattende forståelse av ADLC og maksimere Agentforces potensial innen intelligent agentutvikling.

Den ikke-deterministiske naturen til AI-agenter krever et spesialisert utviklingsrammeverk. Dette kapitlet beskriver dette rammeverket ved å introdusere livssyklusen for agentutvikling (ADLC). Dette kapitlet gir en omfattende oversikt over de fem kjernefasene i ADLC, fra første ide og utforming til kontinuerlig overvåking og justering. Dette kapitlet etablerer den grunnleggende Knowledge som kreves for å bygge robuste og pålitelige agenter.

Denne delen tilordner SDLC-konsepter til de fem fasene i ADLC.

Dette er den grunnleggende fasen der en agents strategiske formål og operasjonelle grenser er definert. En velstrukturert utformingsfase er det viktigste trinnet for å lykkes, fordi den oversetter et forretningsbehov til en teknisk blåkopi. Utformingsprosessen sikrer at agenten ikke bare er funksjonell, men også ansvarlig og i samsvar med brukerens forventninger. Det er der "hva" og "hvorfor" etableres før noen kode skrives.

Definere mål og muligheter for agenter: Først må du tydelig beskrive agentens primære mål og de spesifikke, målbare oppgavene den skal utføre. Dette innebærer å definere rollen (for eksempel "kundeassistent"), kjernefunksjonene (for eksempel "bestillingsavtaler", "svar på produktspørsmål") og suksessmålingene for hver av dem.
Opprett Persona og etiske vakter: Dette trinnet involverer utforming av agentens personlighet og definering av dets etiske grenser for å sikre at den er pålitelig og sikker. Den bestemmer agentens tone (for eksempel "formell", "vennlig") og implementerer strenge regler for å hindre skadelige, systematiske eller upassende svar.
Kartkontekst og forståelse: Du må bestemme hvilken informasjon agenten må forstå og huske for å være effektiv. Dette inkluderer å definere omfanget av Knowledge og samtaleminnet, noe som gjør det mulig å ha sammenhengende samtaler med flere omgange.
Identifisere verktøy og systemintegrasjoner: Dette innebærer en oversikt over de eksterne systemene, API-ene og datakildene som agenten må koble til for å utføre oppgaver. Hvert verktøy (for eksempel en bestillings-API, en kundedatabase) identifiseres, og funksjonen tilordnes til en bestemt agentfunksjon.
Plan for menneskelig eskalering: Det er viktig å definere betingelsene som en agent skal eskaleres til et menneske under. Dette innebærer å se gjennom potensielle feilpunkter og samtaledøpte "sluttpunkter" for å finne ut når en agent skal eskaleres til en menneskelig operator. Utformingen skal beskrive hvordan denne overføringen skal utføres for å sikre at tilstrekkelig kontekst overføres, slik at den raskt kan forbrukes for å sikre en sømløs kundeopplevelse.

Dette er den praktiske byggingsfasen der utformingsplanen blir gjort om til en funksjonell agent. Utviklere bygger agenten, kobler den til dens verktøy og gir den de dataene den trenger for å utføre sine oppgaver. Denne gjentagende "innvendige sløyfen" for bygging og forbedring er der agenten virkelig kommer til liv.

Konfigurere agentens logikk og beslutningstaking: Dette trinnet involverer å forme agentens resonnement ved å koble dets beslutningsrammeverk til kontekst, verktøy og datakilder. Utviklerens rolle er å definere agentens virkemåte ved å opprette API-er eller gjenbruke eksisterende API-er, angi operasjonelle vakthull og angi hvordan agenten velger og bruker tilgjengelige verktøy til å utføre komplekse, flertrinns oppgaver.
Ingeniørprompter og finjusterte modeller: Agentens personlighet, instruksjoner og begrensninger kodes gjennom nøye ledetekstbehandling. Denne prosessen involverer å lage den overordnede ledeteksten som veileder den store språkmodellen (LLM) og, for mer avanserte brukstilfeller, finjustere modellen på domenespesifikke data for å forbedre ytelsen.
Integrere og sikre AI-verktøy: Funksjonene og API-ene som identifiseres i utformingsfasen, kobles til agenten. Ved å bruke et SDK pakker utviklere inn eksisterende funksjoner eller oppretter nye, slik at de trygt kan kalles opp av agenten og sikre at de har riktig godkjenning og feilhåndtering.
Bygge data og RAG Pipelines: For å gi agenten ekstern Knowledge bygger utviklere data pipelines for Retrieval-Augmented Generation (RAG). Dette innebærer å koble til og indeksere data fra kilder som vektorlagre, relasjonsdatabaser, grafdatabaser eller interne dokumenter, slik at denne informasjonen blir tilgjengelig for agenten for å gi nøyaktige, kontekstvennlige svar.

Testing av AI-agenter introduserer et paradigmeskift fra den deterministiske valideringen av tradisjonell programvare. Mens et konvensjonelt program testes for riktighet – en bestemt inndata må produsere en enkelt, forventet utdata – krever en agents ikke-deterministiske natur en mer sofistikert tilnærming. Målet er ikke å validere ett enkelt riktig svar, men å sikre at agentens virkemåte er i samsvar med dets tiltenkte formål, er robust mot uventede inndata og forblir pålitelig på tvers av et spekter av akseptable utfall.

Enhetstesting: Dette laget fokuserer på de deterministiske ikke-AI-komponentene til agenten. Den involverer tradisjonell enhetstesting for å validere at hvert enkelt verktøy og hver enkelt funksjon fungerer riktig i isolasjon, og sikrer et pålitelig grunnlag før agentens komplekse resonnement brukes.
End-to-End (E2E) testing: Denne fasen evaluerer agentens evne til å oppnå mål i realistiske scenarier, noe som er avgjørende i og med at det ikke er deterministisk. I stedet for å kontrollere nøyaktige utdata kontrollerer disse ende-til-ende-testene at agenten fullfører oppgaver og at ytelsen ikke reduseres etter hvert som endringer utføres.
Adversarial og robusthetstesting: Dette er praksisen med å med vilje forsøke å bryte agenten for å proaktivt oppdage dens svakheter. Testere bruker tvetydige forespørsler, skadelige ledetekster og andre kanttilfeller til å vise sårbarheter og sikre at agenten forblir fleksibel og sikker under press.
Menneske i sløyfe (HITL) Evaluering: I og med at automatiserte tester ikke kan måle nyanserte egenskaper som tone eller samtaleflyt, er denne fasen avhengig av tilbakemeldinger fra brukere. Testere samhandler med agenten for å score svarene for hjelpsomhet og generell brukeropplevelse, og gir viktige data for å finjustere virkemåten.
Ytelse og skaleringstesting: Dette er et viktig trinn for å hindre flaskehalser før de påvirker brukerne. Denne prosessen simulerer realistiske scenarioer med høy utnyttelse for å sikre at agenter og programmer kan håndtere store volumer problemfritt og forutsigbart. Den kontrollerer at løsningen ikke bare er riktig, men også skalerbar.

Distribusjon av en AI-agent er en administrert prosess som fokuserer på å sikre at den validerte agenten er det brukerne samhandler med på en pålitelig og gjentagende måte. Dette krever en strukturert tilnærming som flytter agenten fra et versjonskontrollert aktivum til en aktiv, overvåket tjeneste.

Pakken og versjonskontroll: Agentens hele definisjon, inkludert dens ledetekster og verktøy, fanges opp som metadata i en fil og lagres i et kildekontrollsystem som Git. Dette oppretter en enkelt sannhetskilde og en reviderbar historikk for alle endringer.
CI/CD Pipelines: Banen til produksjon er automatisert for å eliminere menneskelig feil og sikre konsistens. Disse pipelinene promoterer automatisk agenten gjennom utviklings-, test- og produksjonsmiljøer, og kjører ende-til-ende-tester i hver fase for å fungere som en kvalitetsport.
Fasede utrullingsstrategier: For å redusere risikoen utgis nye agentversjoner til et lite delsett av brukere først ved bruk av strategier som Kanary-utgivelser. Dette gjør det mulig å overvåke den virkelige ytelsen før en fullstendig utrulling, med mulighet til raskt å tilbakestille eventuelle problemer.
Aktivering og styring: Det kritiske trinnet i utrulling av en agent involverer å aktivere agenten sikkert med de riktige tillatelsene og sikre at den er koblet til overvåkingsverktøy. Dette gir umiddelbar synlighet til tilstanden og ytelsen til den nylig distribuerte agenten fra det øyeblikket den legges inn på nett.

Distribusjon er ikke slutten på agentutviklingslivssyklusen, den er begynnelsen på dens kontinuerlige "ytre sløyfe". Agenter er dynamiske systemer som opererer i uforutsigbare, virkelige miljøer. Denne fasen er dedikert til å observere agentens live-ytelse, samle innsikt fra agentens interaksjoner og bruke disse dataene til å systematisk avgrense og forbedre agentens effektivitet, sikkerhet og effektivitet over tid.

Sanntids ytelsesovervåking: Dette er praksisen med å spore agentens viktige operasjonelle målinger mens den samhandler med brukere. Kontrollpaneler brukes til å overvåke latens, tokenforbruk (kostnad) og API-feilfrekvenser for å gi en umiddelbar oversikt over agentens tilstand og effektivitet.
Virkemåte og suksessanalyse: Dette innebærer å analysere samtalelogger for å forstå hvordan agenten faktisk utfører sine oppgaver. Den fokuserer på å spore fullføringsfrekvenser for oppgaver, identifisere vanlige feilpunkter eller "døde slutt" for samtaler, og måle brukertilfredshet for å finne ut om agenten oppnår sine mål. Som et eksempel for serviceagenter kan det gi målinger om hvor ofte og hvorfor en agent eskaleres til et menneske.
Intelligent justering og forbedring: Dette er den aktive prosessen med å bruke innsikt fra overvåking til å forbedre agenten. Dette kan variere fra teknikk av ledetekster til verktøyoptimalisering.
Data-drevet RAG-forbedring: Kvaliteten på agentens Knowledge forbedres kontinuerlig basert på spørringer i den virkelige verden. Overvåking kan avdekke at agenten sliter med bestemte emner, noe som fører til en forbedring av datakildene eller hentingprosessen (RAG-forbedring) for å forbedre nøyaktigheten av svarene.
Kontinuerlig læring og tilpasning: Det innebærer å opprette en tilbakemeldingsløyfe der produksjonsdata brukes til å gjøre agenten smartere. Ved å merke interaksjonslogger – enten med menneskelig oversikt eller LLM-basert etikettering – bygges det et kuratert datasett som kan brukes til å finjustere den underliggende modellen og anbefale ytterligere forbedringer

Agentforce støtter alle ADLC-faser med integrerte verktøy for design, utvikling, testing, distribusjon, overvåking og analyse – alt i en enkelt forent plattform for raskt å bygge og teste robuste agenter.

Agentforce ADLC er basert på følgende retningslinjer:

Bygd for både lavkode og pro-kode: Støtte for konfigurasjonsbasert distribusjon (low-code) og programmatisk utvidbarhet (pro-code).
Kontinuerlig AI-drevet assistanse og tilbakemeldingsløyfer: Registrerer og analyserer samtaledata for å informere agentinnstillingen om kontinuerlig AI-drevet forbedring.
Testdrevet utvikling på alle nivåer: Streng testing på tvers av alle faser, validering av deterministiske komponenter gjennom tradisjonell enhetstesting, og nye tilnærminger til testing av agentens resonnement og ikke-deterministisk virkemåte.
Executive and LOB Observability: Tilby kostnads-, bruks- og ytelsesmålinger for operasjonelle og ledende interessenter.

Dette kapitlet viser hvordan Agentforce støtter hver fase av ADLC innenfor en enkelt forent plattform.

Ideering

Idefasen er den grunnleggende fasen i ADLC, der første visjon og krav til agenter formuleres. Det innebærer en dypere innsikt i å forstå problemet, identifisere potensielle løsninger og skissere kjernefunksjonaliteten til agenten.

Start agentens ideprosess ved å definere dens nøkkelattributter:

Mål/mål: Definer tydelig agentens primære mål. Hvilket spesifikt problem er det utformet for å løse, eller hvilken oppgave er det ment å utføre? Hvem skal agenten betjene? Dette bør være en presis og målbar setning som veileder hele utviklingsprosessen.
Persona: Utvikle en detaljert personlighet for agenten. Dette inkluderer å definere identiteten, kommunikasjonsstilen og rollen den vil spille i samhandling med brukere eller andre systemer. Vurder tonen, formalitetsnivået og eventuelle spesifikke egenskaper som gjør den effektiv i den tiltenkte konteksten.
Mønster: Identifiser og koble til relevante agenter og implementeringsstrategier. Dette involverer arkitektoniske utforminger eller gode fremgangsmåter som kan informere agentens struktur og virkemåte. "Agentmønstre og implementering i Salesforce Agentforce: En teknisk hvitebok," fungerer som en verdifull ressurs for dette trinnet, og gir innsikt i effektiv agentdesign på Salesforce-plattformen og Agentforce.

Design

Utformingsfasen oversetter konseptene fra ideer til en detaljert blåkopi for agentens konstruksjon. Det innebærer å definere agentens arkitektur, brukerflyter, interaksjonsmodeller og tekniske spesifikasjoner som emner, verktøy og vakthull.

Under utformingsfasen oppretter du en detaljert blåkopi for agentens konstruksjon som inkluderer følgende:

Agentdesign: Skiss den interne strukturen til agenten, inkludert dens komponenter, moduler og hvordan de samhandler. Dette kan innebære å definere Knowledge, konfigurasjonen og logikken for å kontrollere agentvirkemåten, NLP-komponenter (naturlig språkbehandling) og integreringspunkter med andre systemer.
Brukerflyter/interaksjonsdesign: Tilordne hele brukerreisen og agentens interaksjoner. Definer samtaleflyter, beslutningstre, feilhåndtering og tilbakemeldingsmekanismer for å opprette intuitive og effektive opplevelser.
Tekniske spesifikasjoner: Dokumenter de tekniske ikke-funksjonelle kravene til agenten, som ytelsesmålinger, viktige punkter om skalerbarhet, sikkerhetsprotokoller og integrasjonsspesifikasjoner.
Prototyping & Mockups: Opprett visuelle representasjoner eller interaktive prototyper av agentens grensesnitt og interaksjoner. Dette tillater tidlig testing og tilbakemeldinger, noe som bidrar til å begrense utformingen før fullskalautvikling begynner.
Data: Når du bestemmer typen og kildene til data en agent trenger, identifiserer du datasett, API-er, databaser og oppbevaringssteder som agenten må ha tilgang til. For Agentforce fokuserer du på hvilke data som leveres som kontekst, om de er strukturerte eller ustrukturerte, og om de er sanntids eller gruppedata. Agentforce er bygd med dyp integrasjon med Data 360, slik at du kan bruke både strukturerte og ustrukturerte data fra Salesforce CRM og andre kilder. Ustrukturert innhold kan deles og indekseres som standard for RAG. Med MuleSoft kan du koble til eksterne systemer.
Verktøy: Identifiser handlingene som agenten må utføre. Bruk Agentforce til å vise verktøy som oppnår forretningsmål. Disse handlingene benytter eksisterende Salesforce-aktiva som Prompts via Ledetekstbygger, MuleSoft, Apex, Flyter og API-er med OpenAPI-spesifikasjoner. Alle kallbare handlinger kan integreres i Agentforce og brukes av agenten, slik at alle kjente Salesforce-utviklingsverktøy lett blir tilgjengelig som Agentforce.
Inndata for agenter: I tradisjonell SDLC angis inndata nøyaktig. I ADLC er inndata ofte naturlige, ikke-deterministiske, frie ytringer. Samle inn et representativt sammendrag av ytringer som forventes å produsere riktige svar.

Utviklingsfasen fokuserer på å oversette den definerte agentens formål, funksjoner og operasjonelle omfang bestemt i ide- og designfasen til en ny Agentforce Agent.

For å hjelpe utviklere med å opprette agenter tilbyr Agentforce både Agent Builder og Agentforce Developer Experience (AFDX). Disse grunnleggende verktøyene tjener som de primære miljøene for å konstruere og konfigurere agenten.

Agent Builder gir en brukergrensesnittopplevelse for å definere agentens kjernefunksjonalitet.
AFDX gir et programmatisk grensesnitt for tilpassing og integrasjon med andre systemer.

Utvikling og bygging av en agent involverer disse trinnene som kan utføres med Agentbygger eller AFDX:

Definere personligheten: En viktig del av agentutformingen er å etablere en distinkt personlighet. Det innebærer å konfigurere følgende:
- Agentbeskrivelse: En detaljert beskrivelse av agentens rolle, mål og de spesifikke kundeserviceoppgavene den er utformet for å håndtere.
- Tone: Agentens kommunikasjonsstil, empatinivå og eventuelle spesifikke merkeprofileringsretningslinjer den må overholde.
Definere agentemner og -handlinger: For å gjøre en agent sofistikert og i stand til å håndtere et mangfoldig utvalg av oppgaver er det viktig å dele opp funksjonaliteten i forskjellige emner med tilsvarende handlinger.
- :Emner Hvert emne kan konseptualiseres som sin egen spesialiserte agent med et unikt sett instruksjoner og verktøy.
  - Modulær arkitektur. Den modulære tilnærmingen til emner gir bedre organisering og skalerbarhet. Ved å definere flere emner kan agenten håndtere en større rekke komplekse scenarier. En agent kan for eksempel ha separate emner for Bestillingsbehandling, Vanlige spørsmål, Teknisk kundestøtte og Faktureringsspørringer.
- Emneinstruksjoner (Guardrails): Hvert emne leveres med spesifikke instruksjoner som fungerer som vakthylder, og som definerer omfanget av hva agenten kan diskutere eller gjøre i det emnet. Disse instruksjonene hindrer agenten i å se bort fra emnet eller gi irrelevant informasjon. De bidrar også til å opprettholde konsistens og nøyaktighet i svar.
- Handlinger: Emner er også utstyrt med "verktøy", som representerer handlingene agenten kan utføre. Disse verktøyene kan være:
  - Informasjonshandlinger: Hente data fra en Knowledge eller et eksternt system for å svare på en spørring.
  - Transaksjonshandlinger: Utføre handlinger på vegne av brukeren, som å legge inn en bestilling, oppdatere en kundepost eller starte en refusjonsprosess. Disse handlingene er ofte integrert med andre systemer (for eksempel CRM, ERP).

Når testere evaluerer ytelsen og påliteligheten til AI-agenter, støter de ofte på en rekke utfordringer som kan redusere brukeropplevelsen. Disse problemene går fra å feiltolke brukerhensikt til å ikke utføre oppgaver riktig.

Vanlige agentfeilscenarier

Å bygge en robust agent krever å forstå hvordan og hvor den kan mislykkes. Tabellen nedenfor kategoriserer vanlige problemer som oppstår i løpet av agentlivssyklusen, fra feilaktig resonnement til dårlig Knowledge henting. Bruk dette som en strategisk veiledning under utvikling og en sjekkliste under testing for å sikre at agenten ikke bare er funksjonell, men også pålitelig og intuitiv for sluttbrukeren. Disse mislykket-scenariene bør hjelpe deg å definere testtilfeller.

Kategori	Beskrivelse	Feileksempler
Emneklassifisering	Agenten kan ikke identifisere brukerens hensikt eller mål riktig.	Utløser feil emner for gitte spørringer. Vanligvis brukes som standard en "Ikke emne"-klassifisering på feil måte.
Svarkvalitet	Feil i innholdet, nøyaktigheten og formatet på agentens svar.	Gir ikke-grunnlagt informasjon som ikke kommer fra Knowledge. Genererer svar som er utenfor den utpekte domenekunnskapen. Inkluderer feil informasjon selv om det refereres til gyldige kilder. Leverer for lange meldinger, noe som er spesielt problematisk for mobilbrukere.
Handlingsutføring	Agenten mislykkes ved forsøk på å utføre en bestemt funksjon eller oppgave.	Kaller opp feil handlinger eller uventede handlinger. Returnerer feilmeldinger i stedet for å fullføre den forespurte handlingen. Unødvendig foreslår eskalering til en human agent. Mislykkes i å innhente de nødvendige inndatavariablene riktig fra brukeren.
Vakter og instruksjoner	Agenten bryter forhåndsdefinerte regler, begrensninger eller samtalegrenser.	ignorerer eksplisitte driftsinstruksjoner Utfører uventede eller for tidlige eskaleringsforsøk på agenter. Viser upassende "Please Hold"-meldinger under utføring av handlinger. Viser generelle feilmeldinger som "Kan ikke hjelpe med det akkurat nå" eller "Systemfeil".
Knowledge Retrieval	Agenten har problemer med å hente og presentere informasjon fra Knowledge sin.	Henter irrelevante artikler fra Knowledge. Inkluderer unødvendig eller uønsket informasjon i svarene.
Strukturert veiledning	Agenten sliter med å lede brukere gjennom prosesser med flere trinn.	Gir generell, ubegrunnet feilsøkingsrådgivning. Viser for mange trinn i én enkelt melding. Mister kontekst under en pågående feilsøkingsproces. Blir fast i individuelle feilsøkingstrinn. Gjenta spørsmål selv om du allerede har mottatt gyldige svar.

Gode fremgangsmåter for testing av AI-agenter

Følgende beskriver anbefalte fremgangsmåter du bør være oppmerksom på når du tester Agenter på Agentforce.

Forbedre testdata
Grunnlaget for effektiv testing er omfattende og realistiske testdata. Følg disse prinsippene for å sikre at du har effektive testdata for å teste agentene:
- Tilstrekkelig dekning: Mål å ha nok testdata til å dekke alle viktige emner og brukerpersoner.
- Realistiske scenarier: Forsikre deg om at testdataene nøyaktig representerer interaksjoner med virkelige brukere.
- Negative og Edge Cases: Inkluder negative testtilfeller (hva agenten ikke skal gjøre) og kantscenarier for å utfordre agentens grenser.
- Guardrails testing: Legg til spesifikke testtilfeller utformet for å bekrefte at agentens vakthager fungerer riktig.
Optimalisere testkjøringer
For å få mest mulig ut av testressursene optimaliserer du hvordan du kjører testene. Følgende er viktige punkter når du tester Agentforce:
- Test Case Volume: Du kan bruke opptil 1000 testtilfeller.
- Kjør samtidige tester: Det er mulig å kjøre opptil 10 testtilfeller samtidig i en tidsperiode på 10 timer.
- Behandle ressurser: Vær oppmerksom på at kjøring av tester bruker kreditter. Forsikre deg om at du er fornøyd med testdataene før du starter en kjøring for å unngå unødvendige kostnader.
Se gjennom resultater
Analyser testresultatene nøye for å identifisere forbedringsområder:
- Analyse failures: Inspiser hvert mislykkede testtilfelle individuelt. Les nøye gjennom og forstå forskjellen mellom forventede og faktiske resultater for å finne ut problemet.
- Bruk et Sandbox-miljø: Testing agenter kan endre CRM-data. For å unngå utilsiktede endringer i direktedataene må du alltid utføre testing i et ikke-produksjonsmiljø, som en Sandbox-organisasjon eller en midlertidig organisasjon.
Tune og Retest
Testing er en gjentagende prosess som fortsetter etter hvert som agenten utvikler seg:
- Test kontinuerlig: Utfør testing etter hver endring i agentens emner eller handlinger. Dette validerer endringene og sikrer at kvaliteten opprettholdes.
- Utvid testdekning: Organiser og utvid datasettet kontinuerlig med nye testtilfeller for å forbedre den generelle dekningen og robusten til agenten.

Teste tilnærminger

Gitt agentens kompleksitet er ingen enkelt testmetode tilstrekkelig. En omfattende valideringsstrategi må være lagdelt, som kombinerer forskjellige tilnærminger for å dekke alt fra forutsigbare, deterministiske handlinger til nyansene i dens ikke-deterministiske, samtalevirkemåte. Disse løsningene gir et rammeverk for systematisk evaluering av hver komponent i agenten for å sikre at den er robust, pålitelig og sikker.

Manuell testing med Agent Simulator og Plan Tracer
- Formål: Dette er den første og ofte enkleste måten å teste en agent på. Den er ideell for et lite sett eksempelsaker og for å få en grunnleggende forståelse av agentens virkemåte.
- Mekanisme: En agentsimulator sørger for et kontrollert miljø der utviklere og administratorer kan samhandle direkte med agenten. Denne simulatoren tillater detaljert sporing av informasjonen som leveres av administratoren/utvikleren, og gir innsikt i hvordan agenten behandler inndata og genererer utdata.
- Fordeler:
  - Hurtigtilbakemelding
  - Enkel å identifisere umiddelbare problemer
  - Hjelper med å forstå agentens logikkflyt
Automatisk testing med Testing Center eller AFDX Test Suite
- Formål: Når manuell testing har etablert en basisfunksjonalitet, blir automatisert testing avgjørende for skalerbarhet, nøyaktighet og regresjonstesting.
- Mekanisme: Verktøy som Testing Center eller AFDX-testpakken aktiverer generering av automatiserte tester basert på forhåndsdefinerte eksempelfelt. Disse testene er utformet for å validere om agentens instruksjoner og underagentklassifiseringer fungerer riktig på tvers av et bredere område av scenarier.
- Fordeler:
  - Sikrer konsistent ytelse
  - Identifiserer subtile feil
  - Støtter kontinuerlig integrering / kontinuerlig distribusjon (CI/CD) under behandling
  - Gir omfattende dekning
Handlingsspesifikk enhetstesting med Apex og flyter
- Formål: For å validere den deterministiske forretningslogikken innkapslet i agenthandlinger. Selv om agentens generelle virkemåte ikke er deterministisk, drives agenthandlinger ofte av teknologier som Flyter og Apex, som standard utviklingsrutiner gjelder for.
- Mekanisme: Utviklere skriver enhetstester for de spesifikke flytene eller Apex som en agenthandling kaller opp. Disse testene kontrollerer de individuelle komponentene i agentens logikk og sikrer at de produserer de forventede utdataene for et gitt sett inndata.
- Fordeler:
  - Integrering av disse enhetstestene i en DevOps pipeline gir et automatisert sikkerhetsnett
  - Validerer om eventuelle endringer eller forbedringer i en handlings logikk ikke innfører regresjoner
  - Sikrer påliteligheten til agentens funksjoner før de distribueres til produksjon
Adversarial Testing - Security and Guardrail Enforcement:
- Formål: Opbygning af forskellige typer agenter kræver en stærk vægt på sikkerhed og på at sikre, at de fungerer inden for definerede parametre og vagter. Dette er avgjørende for å hindre utilsiktede handlinger, datainnbrudd eller misbruk. Formålet med motstandstesting er derfor å proaktivt identifisere og rette opp disse potensielle sårbarhetene ved å med vilje utfordre agenten med inndata som er utformet for å omgå sikkerhetsmekanismene, og derved teste robustheten og motstanden mot manipulering.
- Mekanisme: Motstandstesting implementeres ved å lage utfordrende, tvetydige eller skadelige inndata som overfører grensene for agentens tiltenkte virkemåte. Plattformverktøy som "Guardrails"-funksjonen i Agentbygger gir innsikt i instruksjonsoverholdelse, men utviklere bør også opprette tilpassede motstandersaker som aktivt forsøker å få agenten til å mislykkes i et kontrollert miljø.
- Fordeler: Denne løsningen reduserer sikkerhets- og samsvarsrisikoer systematisk før distribusjon. Ved å identifisere potensielle feilpunkter forbedrer motstandstesting agentens pålitelighet og sikrer at den fungerer sikkert og som den skal når den samhandler med brukere.

Gjentagende testing i midlertidige organisasjoner og Sandbox-organisasjoner

Den indre sløyfen er den kritiske, gjentagende syklusen der en agent går fra konsept til en validert komponent, klar for distribusjon. Denne prosessen med kontinuerlig forbedring krever miljøer for både utvikling og testing. Agentforce tilbyr dette rammeverket gjennom midlertidige organisasjoner, som er isolerte, midlertidige miljøer for rask prototyping som ikke påvirker felles miljøer, og Sandbox-organisasjoner, som muliggjør grundig testing med realistiske data for å akselerere veien til produksjon.

Utvikling i midlertidige organisasjoner: Første utvikling skal skje i en midlertidig organisasjon. Verktøyene som tilbys i utviklingsmiljøet, som Agentbygger og AFDX, brukes fullt ut her. Midlertidige organisasjoner er gode kandidater for CI/CD pipelines for å kjøre enhetstester, utføre kodeanalyse og promotere endringer til høyere miljøer.
Distribusjon til Sandbox for testing av virkelige data: Når agentens kjernefunksjonalitet er utviklet i en midlertidig organisasjon, distribuerer du den til en Sandbox-organisasjon. Sandbox-organisasjoner er kopier av et produksjonsmiljø og tilbyr et mer realistisk testområde.
- Real Data vs. Mock-data: Enkelte utviklere kan mock data i midlertidige organisasjoner for første test, mens distribusjon til en Sandbox tillater testing med "virkelige data". Dette er avgjørende for evaluering av agentens ytelse i scenarier som nøye gjenspeiler faktiske kundeinteraksjoner. Bruk av mer representative data i en Sandbox-organisasjon øker utviklings- og forbedringsprosessen betydelig.
- Full eller delvis Sandbox for Core CRM-data: Avhengig av datavolumet og spesifikke testkrav kan en fullstendig eller delvis Sandbox brukes.
  - Fullstendig Sandbox: Gir en fullstendig kopi av produksjonsmiljøet, inkludert alle metadata og data. Ideelt for omfattende testing og ytelsesjustering med store datasett.
  - Delvis Sandbox: Inneholder et delsett av produksjonsdataene, ofte tilstrekkelig til testing av bestemte funksjoner eller funksjonalitet der et fullstendig datasett ikke er strengt nødvendig.
- Knowledge og RAG Management: Hvis agenten er avhengig av en Knowledge eller en RAG-modell (Retrieval-Augmented Generation), henter du inn alt relevant innhold i Sandbox-organisasjonen og indekserer på nytt. Dette sikrer at agenten bruker aktuell informasjon under testing og kan hente og syntetisere innhold nøyaktig.

Agentforce definerer agenter via metadata slik at de kan distribueres med standard Salesforce-prosedyrer som endringssett eller AFDX. Denne fasen legger vekt på en sikker og kontrollert utrulling gjennom viktige funksjoner som agentversjonsbehandling og et separat aktiveringstrinn, som sikrer systemstabilitet og muliggjør rask gjenoppretting fra problemer.

Følg denne fremgangsmåten for å distribuere og frigjøre den nye agenten.

Distribuere via Endringssett/Metadata API eller AFDX: Distribusjonsprosessen for agenter bruker standard Salesforce-prosedyrer og behandler agenter som metadata. Dette bør være en kjent prosess for alle som er vant til Salesforce-utvikling og distribusjon. Bruk av endringssett eller AFDX sikrer en strukturert og konsistent tilnærming til overføring av agentkonfigurasjoner mellom miljøer, som fra Sandbox til produksjon. Denne metoden letter versjonskontroll og riktig endringsbehandling, som er avgjørende for å opprettholde systemets stabilitet og pålitelighet.
Aktiver agenter etter distribusjon: Etter en vellykket distribusjon er det viktig at en systemadministrator aktivt "aktiverer" agenten. Distribusjon plasserer bare agentens kode og metadata i målmiljøet. Aktivering er trinnet som gjør agenten operativ og tilgjengelig for bruk. Denne separasjonen tillater kontrollert utrulling og testing før en agent blir aktiv og samhandler med sluttbrukere eller andre systemkomponenter.
Bruk versjonsbehandling for sikker agentbehandling: Agentversjoner er en viktig funksjon som forbedrer sikkerheten og fleksibiliteten i agentutvikling og -vedlikehold betydelig.
1. Opprette, teste og publisere nye versjoner: Den anbefalte fremgangsmåten innebærer å opprette en ny versjon av en agent når endringer eller forbedringer kreves. Denne nye versjonen kan så testes grundig i et Sandbox-miljø uten å påvirke den aktive, aktive agenten. Når den nye versjonen er validert og anses som klar, kan den publiseres og deretter aktiveres for å erstatte den tidligere operative versjonen. Denne gjentagende prosessen muliggjør kontinuerlig forbedring og innovasjon samtidig som avbrudd minimeres.
2. Tilbake til tidligere versjoner: En viktig fordel med versjonsbehandling er muligheten til raskt og enkelt å gå tilbake til en tidligere, stabil versjon hvis det oppstår et problem med en nylig distribuert eller aktivert agent. Hvis noe går galt, for eksempel hvis en agent oppfører seg feil eller introduserer en uforutsett feil, kan administratorer bare rulle tilbake til den siste kjente gode versjonen og aktivere den. Denne funksjonen gir et kritisk sikkerhetsnett som tillater rask gjenoppretting og minimerer nedetid, slik at forretningskontinuitet og brukertilfredshet sikres.

Agentovervåking

Agentforce øktsporing er en åpen, utvidbar modell bygd på Data 360 som fanger opp ende-til-ende agentinteraksjoner. Agentforce øktsporing henter inn data fra forskjellige kilder (startende med argumentasjonsmotorlogger) og kombinerer alt under en økt-ID.

Datamodellen for øktsporing (STDM) gir detaljert informasjon om hva som skjedde under agentøkter, inkludert:

Omvendt-interaksjoner
Justere motorutførelser
Handlinger, ledetekster og gatewayinndata/utdata
Feilmeldinger
Siste svar

STDM er et viktig verktøy for å hjelpe utviklere med å

Feilsøkingsagentoppsett og konfigurasjonsproblemer under byggetid.
Finn ut hvorfor enkelte testtilfeller mislyktes under gruppetesting.
Angi hvorfor en agent ikke kan håndtere et sett brukerspørsmål eller ikke er emnet.

Utviklere bør bruke disse øktsporingsdataene til å observere, overvåke, undersøke og feilsøke agenthendelser, hendelser og atferdsmønstre.

STDM består av DLO-er (Data Lake Objects) og DMO-er (Data Model Objects) som lagrer detaljerte logger over agentvirkemåte. Metadata om hvert LLM-kall som gjøres av vurderingsmotoren, kan slås sammen med tilbakemeldinger eller guardrail-målinger. Data strømmer til DLO-er i Data 360 og tilordnes til aktuelle DMO-er.

Utviklere kan få tilgang til disse dataene og få innsikt ved å kjøre spørringer og rapporter mot STDM. Komponentene i et STDM er beskrevet nedenfor.

Agentforce øktsporingsdatamodell ERD

Datasjøobjekt / Datamodellobjekt	Beskrivelse
AIAgentSession	En overordnet beholder som fanger opp sammenhengende interaksjoner med én eller flere AI-agenter.
AIAgentSessionParticipant	En enhet (menneske eller AI) som deltar i en AIAgentSession.
AIAgentInteraction	Et segment i en økt. Den starter vanligvis med en brukers forespørsel og slutter når AI-agenten gir et svar på denne forespørselen.
AIAgentInteractionStep	En diskret handling eller operasjon som utføres under en interaksjon for å innfri brukerens forespørsel.
AIAgentInteractionMessage	En enkelt kommunikasjon levert av brukeren eller generert av AI-agenten under en økt.

Agentforce

Agentforce Optimization er en kraftig funksjon som er utviklet for å forbedre ytelsen til AI-agenter ved å gi dyptgående innsikt i brukerinteraksjoner. Den bygger på analysefunksjonaliteten til datamodellen for øktsporing (STDM), og lar administratorer og utviklere forstå brukeremner, engasjementsmønstre og effektiviteten av agentoppløsninger.

Viktige aspekter ved Agentforce optimalisering inkluderer:

Momentspesifikke data: Agentforce Optimization utvider STDM ved å introdusere "Moments", som representerer interaksjoner fokusert på en bestemt brukerhensikt eller forespørsel under en økt. Disse detaljerte dataene tillater detaljert inspeksjon av alle aspekter ved en interaksjon, fra den første brukerforespørselen til agentens løsning.
Automatisk momentbehandling: Momenter genereres daglig, og deretter grupperes og kodes ukentlig på tvers av alle aktive agenter ved bruk av en avansert stor språkmodell (LLM). Denne segmenteringen forenkler spørring og gir innsikt i ulike fasetter av agentøkter.
Spørring og analyse: Brukere kan spørre Moments basert på koder, kvalitetsscore og andre kriterier. Dette aktiverer vurderingen av brukerengasjement gjennom målinger som Moment varighet og relevanskvalitetsscore, som bidrar til å finne områder for forbedring.
Unified Data Model: Agentforce benytter den forente datamodellen for øktsporing (STDM), som fanger opp alle loggede hendelser i en økt, inkludert individuelle samtaleomganger. Alle relevante enheter klargjøres ved aktivering av STDM i oppsettet.

Ved å analysere AI-agentinteraksjoner gir Agentforce brukere mulighet til å identifisere områder for forbedring og begrense konfigurasjoner for å oppfylle brukerbehov bedre.

Hvis du vil ha mer informasjon, kan du se Datamodellen for Agentforce Optimization.

Dette kapitlet er en praktisk veiledning for pro-kode-utviklere. Den viser hvordan du bygger, tester og distribuerer agenter med Agentforce DX (AFDX) og vår Python SDK med hastighet og sikkerhet. Vi vil gå gjennom hele livssyklusen, fra første utforming til en versjonskontrollert agent, ved å bruke den kraftige kombinasjonen av AFDX og Python SDK.

De følgende eksemplene vil bruke to viktige verktøysett utformet for å bygge og administrere agenter på Agentforce plattformen. En grunnleggende forståelse av disse verktøyene anbefales for å få best mulig utbytte av denne veiledningen.

1. Agentforce DX (AFDX): For å administrere livssyklusen

Agentforce DX utvider det kjente Salesforce Developer Experience (SFDX)-verktøysettet – inkludert Salesforce CLI og VS Code-utvidelsene – for å støtte hele livssyklusen for agentutvikling. Den brukes til å behandle en agent som versjonskontrollerte metadata, automatisere testing fra kommandolinjen og orkestrere distribusjoner mellom utviklings-Sandbox-organisasjonene og produksjonsorganisasjonen.

Hvis du vil vite mer, kan du se: Komme i gang med Agentforce DX Development.

2. Agentforce Python SDK: For å bygge agenten

Python SDK tilbyr det programmatiske grensesnittet for "innvendig sløyfe" for utvikling. Med den kan du definere en agents resonanslogikk, koble til agentens verktøy og behandle ledetekstmaler direkte i et kjent Python-miljø, og effektivisere kjernebyggingsfasen i ADLC.

SDK er tilgjengelig på PyPI: https://pypi.org/project/Agentforce-sdk/.

Det fullstendige prosjektet er tilgjengelig her:
https://github.com/akshatasawant9699/ADLC_Whitepaper.

Denne grunnleggende fasen definerer formålet, personligheten og kjernefunksjonaliteten til en agent. Det innebærer å svare på viktige spørsmål for å arkitektere agentens "hjerne" før noen kode skrives. I dette eksemplet utformer vi en agent for Coral Cloud Resorts.

Oppgave: Agenten fungerer som en feriestedsleder, håndterer kundeklager, administrerer ansattes tidsplaner og sikrer problemfri drift av feriestedet.
Persona: Agenten har en hjelpsom, profesjonell og samtalelig tone.
Verktøy og funksjoner: Agenten trenger tilgang til reservasjonssystemer, programvare for planlegging av ansatte og reisemålspolicyer.
Beslutningslogikk: Agenten bruker AI-genererte emner til å bestemme brukerhensikt og generere riktige handlinger.

Med Agentforce DX oversettes utformingsfasen til en konkret spesifikasjonsfil: Agentforce DX: Genererer en agentspesifikasjon. Det første trinnet i pro-kodereisen er å generere en agentSpec.yaml-fil. YAML-filen fanger opp agentens kjerneutforming, inkludert agentens rolle, relevante firmadetaljer og en AI-generert liste over emner som definerer jobbene den kan håndtere.

Bruk Salesforce CLI til å generere denne spesifikasjonen via interaktive ledetekster. Kjør følgende for å begynne å opprette agenten med Agentforce DX:

Du må oppgi spesifikke detaljer som ble definert i idefasen:

Type agent: Kunde
Firma: Coral Cloud Resorts
Firmabeskrivelse: Coral Cloud Resorts gir kunder eksepsjonelle reisemålsaktiviteter, uforglemmelige opplevelser og reservasjonstjenester, som alle støttes av en forpliktelse til å tilby førsteklasses kundeservice.
Agentrolle: Feriehuslederen tar hånd om kundeklager, behandler ansattes tidsplaner og sikrer at alle prosesser utføres problemfritt.

Kjøring av denne kommandoen oppretter en agentSpec.yaml-fil i DX-prosjektets specs-katalog. Filen inneholder informasjonen som ble gitt, sammen med en liste over AI-genererte emner som inkluderer navnet på og beskrivelsen av hvert emne. Se gjennom og rediger filen etter behov for å begrense agentens funksjoner.

På samme måte bruker Python SDK-implementasjonen interaktiv spesifikasjonssamling til å automatisk generere agentemner med riktige omfangsfelt som kreves for SDK-kompatibilitet.
Videre opprettes det en fullstendig JSON-fil med agentspesifikasjon som brukes til å opprette en agent i fase 2.

Utviklingsfasen fokuserer på å konstruere agentens kjernekomponenter: vurderingsmotoren, verktøyene den kan bruke, og Knowledge. Agentforce abstrakterer mye av kompleksiteten, noe som gjør det mulig for utviklere å fokusere på forretningslogikk.

Denne delen deler to pro-kode-tilnærminger for Agentforce utviklingsfasen. Først med Agentforce DX og deretter med Python.

Agentforce DX: Opprette en agent fra en spesifikasjon

Når agentSpec.yaml-filen er klar, oppretter du agenten i Salesforce-organisasjonen. Kjør denne kommandoen for å opprette agenten og synkronisere dens tilknyttede metadata tilbake til det lokale DX-prosjektet:

Når du blir bedt om det, godtar du standard API-navn, Resort_Manager. Kommandoen tolker spesifikasjonen, oppretter agenten og henter metadataene. Metadataene inkluderer en Bot, BotVersion og en GenAiPlannerBundle, som legger til AI-intelligens og referanser til agentens emner og handlinger.

Forhåndsvis agentens struktur før du oppretter den ved å legge til --forhåndsvisningsflagget for å generere en lokal JSON-fil som beskriver hvilken type agent LLM skal opprette, inkludert foreslåtte handlinger. For eksempel:

Se Opprette en agent fra DX-prosjektet fra Trailhead for å få mer informasjon.

Agentforce Python SDK: Definere spesifikke verktøy

Agent SDK letter agent testing ved å opprette mock-handlinger. Disse mock-handlingene må til slutt erstattes med ekte handlinger i Salesforce. Salesforce tilbyr en rekke plattformfunksjoner, inkludert Flyter, Apex, ledetekstmaler og API-er, som alle kan innkapsles som Agentforce.

Her er en mock-kodesnutt for å illustrere hvordan en Agentforce kan se ut.

Implementasjonen etablerer tilkoblingen til Salesforce, oppretter agentforekomsten og definerer tilpassede verktøy og handlinger som agenten kan bruke til å samhandle med eksterne systemer og utføre spesifikke forretningsfunksjoner.

Som vi har diskutert ovenfor, er testing av en agent mer kompleks enn tradisjonell programvaretesting. Det krever validering av virkemåte, årsaker og robusthet på tvers av ulike scenarier. Dette inkluderer enhetstesting for individuelle verktøy, ende-til-ende-testing for samtaler og motstandstesting for å finne sårbarheter.

Agentforce DX tilbyr en arbeidsflyt på høyt nivå for å opprette, distribuere og kjøre tester i tillegg til Testing Center og den direkte Testing API. Denne delen viser hvordan du utfører tester med Agentforce DX.

Agentforce DX: Kjøre en agenttest

Bruk Agentforce DX til å kjøre forhåndsdefinerte agenttester direkte fra kommandolinjen. Dette er ideelt for å integrere agent testing i moderne DevOps-prosesser.

Agentforce Python SDK: Simulere E2E-tester og motstandstester

Konseptmessig tillater Python SDK skriptet samtaler for å simulere ende-til-ende (E2E) tester og validere agentens resonnement.

Agentforce Python SDK med Salesforce Testing API

Python SDK-implementasjonen bruker omfattende testing med Salesforce Testing API- og AiEvaluationDefinition-metadata, og oppretter strukturerte testtilfeller med forventninger for emnesekvenser, handlingssekvenser, strengsamsvar og kvalitetsmålinger. Systemet genererer XML-metadatadefinisjoner som kan distribueres til Salesforce for automatisert agenttesting og -validering.

Når den er validert, distribueres agenten til et produksjonsmiljø. I denne fasen er Agentforce DX avgjørende for å hjelpe til med å behandle og flytte agentmetadata mellom ulike organisasjoner (for eksempel Sandbox-organisasjoner og produksjonsorganisasjoner). Agentdistribusjoner oppretter en ny versjon av agenten, og agenten kommer ikke online før du eksplisitt aktiverer den. Dette gir deg full kontroll over når den nye versjonen av agenten skal utgis.

Agentforce DX: Deploy Agent Metadata

Standardprosjektstrukturen Salesforce DX organiserer agentmetadata under mappen force-app. Bruk standard sf project deploy-kommandoer til å distribuere en agent og tilhørende tester til en målorganisasjon.

Når en agent er opprettet eller distribuert, kan du åpne den direkte i Agentforce Builder-grensesnittet for å bekrefte konfigurasjonen ved å kjøre:

Når du har kontrollert at agenten er distribuert, kan du aktivere den. Hvis du støter på uventede problemer, ruller du tilbake til den tidligere arbeidsversjonen av agenten.

Agentforce Python SDK: Distribuere agentdistribusjon

Implementasjonen tar den validerte agentspesifikasjonen og distribuerer den til Salesforce-organisasjonen slik at agenten blir tilgjengelig for bruk. Distribusjonsprosessen inkluderer agentoppretting, metadatasynkronisering og bekreftelse av vellykket distribusjon.

ADLC er en kontinuerlig syklus, distribusjon er ikke slutten. Agenter er levende systemer som krever konstant overvåking for å spore målinger som latens, kostnad og suksessfrekvenser. Innsikten som innhentes fra overvåking, brukes til å justere og forbedre agentytelsen gjennom ledetekstutvikling, verktøyoptimalisering og forbedring av Knowledge.

Plattformen Agentforce tilbyr omfattende kontrollpaneler og analyser for å støtte denne viktige fasen, og sikre at agenter fortsetter å utvikle seg og forbedre seg over tid.

Agentforce Analytics

Agentforce Analytics, som finnes i mappen Agentforce (Standard), bruker Data 360 til å gi innsikt i agentytelsen. De tilpassbare kontrollpanelene og rapportene tilbyr data om tilpassing, tilbakemeldinger og bruk, som hjelper deg å avgrense emner og handlinger for å forbedre brukertilfredsheten. Du kan se nærmere på resultatene ved å klikke på diagrammer eller lenkede rapporter. Hvis du vil tilpasse, kloner du eksisterende rapporter og endrer klonene for å unngå å avbryte analyseprosesser.

Ytringsanalyse

Ytringsanalyse viser hvordan Agentforce (standard) bruker agenter, hva de ber om, og om agenten kunne håndtere disse forespørslene. Disse tilpassbare rapportene kan hjelpe deg med å begrense emnene og handlingene slik at agentene svarer mer effektivt og nøyaktig.

Agentforce Python SDK: Overvåking med Data 360-integrasjoner

Agent SDK-implementasjonen bruker avansert overvåking og analyse med Data 360 Python-kobling, etablerer tilkobling til Salesforce Data 360, spør agentytelsesmålinger og oppretter omfattende overvåkingskontrollpaneler.
Systemet sporer responstider, suksessfrekvenser, brukertilfredshet og kostnadsmålinger for å gi handlingsorienterte innsikter for agentoptimalisering.

Agentforce DX: Agentovervåking

Implementasjonen bruker standard AFDX-kommandoer med CLI-basert agentbehandling, holder agenten oppdatert med plattformendringer og inkluderer tilbakemeldinger fra brukere for kontinuerlig forbedring.

Se GitHub repositoriet heri for ADLC-implementering ved bruk av Agent SDK og AFDX.

Mastering av agentutviklingslivssyklusen krever overholdelse av et sett med kjerneprinsipper som sikrer effektivitet, pålitelighet og strategisk justering. Følgende retningslinjer sammensetter viktige lærdommer fra hver fase av ADLC til et strategisk rammeverk for arkitekter og utviklere.

1. Planlegging og ideer

Denne første fasen fokuserer på å justere agentens formål med forretningsmålene og sikre at det bygger på et solid grunnlag.

Prioriter for forretningsinnvirkning: Start med å tilordne potensielle brukstilfeller direkte til strategiske forretningsmål. Bruk en prioritiseringsmatrise til å score deres potensielle innvirkning og starte med et enkelt, fokusert bruksområde med tydelige KPI-er.
Involver interessenter tidlig: Samle innsikt om smertepunkter og sørg for justering.
Leverage Data Insights: En agent er bare så god som dens data. Bruk Data 360 til å utforske tilgjengelige strukturerte og ustrukturerte data for å informere agentens kontekst og funksjoner. Se gjennom eksisterende rapporter og kontrollpaneler for å identifisere gjeldende trender som kan informere valg av bruksområde.
Bruk rammeverk for ideer: Bruk strukturerte ideeringsmetoder til å brainstorm og begrense potensielle programmer, som designtenkning eller SWOT-analyse.

2. Byggeagenter

Denne fasen dekker de beste fremgangsmåtene for å bygge en agent med høy ytelse og effektivitet.

Unngå for mange emner: Begrens antall emner for å redusere risikoen for å opprette lignende eller overlappende emner som kan forvirre agenten.
Hold instruksjoner og ledetekster presise: Bruk direkte, enkelt språk og gi eksempler på ytringer for å veilede agenten effektivt.
Hevelsesvariabler og deterministiske handlinger: Bruk disse verktøyene til å veilede agentens virkemåte og optimalisere ytelsen for å få mer forutsigbare utfall.
Hold handlingsutdata små og presise: Forsikre deg om at agentens svar er korte og aktuelle. Lengre utdata bruker mer kontekst og genereres tregere.
Optimalisere handlinger for hastighet: Utform flyter og Apex for å returnere minimum nødvendig data. Mål å ha færre handlinger som er nødvendige for å generere et svar, ved å forhåndsbehandling der det er mulig.
Definere et fjernet omfang: Skriv de riktige beskrivelsene, instruksjonene og omfanget for handlinger for å hindre at agenten kaller opp RAG (Return-Augmented Generation) for spørsmål som er utenfor omfanget.
Bruk Hybrid Søk Sparingly: Bruk hybridsøk bare hvis det er absolutt nødvendig, da det kan påvirke latens negativt.

3. Teste, overvåke og justere

Denne gjentagende fasen er avgjørende for å avgrense agentens nøyaktighet og ytelse.

Opprette en testflyt: Følg en konsistent testsyklus:
1. Kjør gruppetest: Utfør et omfattende sett tester.
2. Vise score/feil: Analyser ytelsesmålingene og identifiser feil.
3. Inspekteringsfeil: Undersøk hver feilrad for å forstå avviket.
4. Oppdater agent: Gjør de nødvendige endringene i agenten eller dens evalueringsdata.
Se gjennom øktsporingsinformasjon: Bruk datamodellen Øktsporing og Agentforce Interaction Explorer til å utføre rotårsaksanalyse når problemer eller uventede virkemåter identifiseres. Juster agenten basert på informasjonen, og fortsett å gjenta agenten.

Agentutviklingslivssyklusen representerer en kritisk utvikling av tradisjonelle programvareutviklingsprinsipper, designet for tidsalderen av intelligente, autonome systemer.

Evolution, ikke erstatning: Agentutviklingslivssyklus utvider og forbedrer tradisjonell programlivssyklusbehandling uten å erstatte den.
Data som førsteklasses borger: Data spiller en langt mer dynamisk og sentral rolle i agentutvikling.
Spesielle verktøy og ferdigheter: Krever nye verktøy og et bredere sett med spesialiserte kvalifikasjoner på tvers av datavitenskap, ML-teknologi og agentutvikling.
Kontinuerlig læring: Agentutvikling legger til kontinuerlig læring og tilpasning av selve systemet.
Fremtidig innvirkning: Agentisk AI lover å ytterligere automatisere og optimalisere komplekse IT-operasjoner og arbeidsflyter for programvareutvikling.