I traditionel softwareudvikling leverer Software Development Lifecycle (SDLC) en struktureret, faseinddelt tilgang til opbygning af applikationer. Det etablerer kvalitet, reducerer risiko og leverer en tydelig oversigt fra ide til version. ADLC (Agent Development Lifecycle) er en lignende metodologi, der er tydeligt skræddersyet til at håndtere de unikke kompleksiteter ved opbygning af autonome agenter.
Agenter er ikke passive applikationer. De er systemer, der forårsager, handler og lærer i dynamiske kørselsmiljøer. Deres ikke-deterministiske adfærd gør traditionel QA utilstrækkelig. Agentudviklingslivscyklussen (ADLC), der støttes af platforme som Agentforce, håndterer dette på tværs af fem faser: Ideer og design, udvikling (den "indvendige løkke"), test og validering, implementering og kontinuerlig overvågning og justering (den "udvendige løkke").
Dette dokument fungerer som en omfattende vejledning for udviklere og virksomhedsarkitekter, der allerede er bekendt med kompleksiteten af Software Development Lifecycle (SDLC) og ønsker at udvide deres ekspertise til agentbaserede systemer. Vores primære mål er at lette en hurtig forståelse af agentudviklingslivscyklussen (ADLC) ved at fremhæve dets nøgleforskelle fra traditionelle SDLC-metodologier og levere en struktureret rammestruktur til at konceptualisere hele processen med opbygning, implementering og administration af intelligente agenter.
Dokumentet er organiseret i tre forskellige kapitler, der hver især er designet til gradvist at opbygge din Knowledge og praktiske færdigheder:
- Kapitel 1: ADLC Framework. Dette kapitel introducerer ADLC (Agent Development Lifecycle), der detaljerer dets afvigelse fra SDLC på grund af de unikke udfordringer ved at udvikle autonome agenter. Den etablerer en struktur til at designe, udvikle, teste og implementere agenter.
- Kapitel 2: Agentforce Platform. Dette kapitel undersøger Agentforce, en forenet platform, der strømliner og fremskynder hele agentudviklingslivscyklussen. Agentforce tilbyder værktøjer til agentdesign, databehandling, modeluddannelse, implementering og kontinuerlig overvågning, hvilket forenkler komplekse opgaver og forbedrer effektiviteten.
- Kapitel 3: Pro-Code Implementation. Denne vejledning bruger Agentforces pro-code-værktøjer til at give praktiske, trinvise instruktioner og eksempler fra den virkelige verden til agentudvikling. Den dækker hele livscyklussen for agentudvikling, fra prototyping og funktionsteknik til modelimplementering, ydeevnetuning og vedligeholdelse, og udstyrer udviklere med færdigheder til at opbygge produktionsklar agenter.
Dette dokument har til formål at udstyre dig med den teoretiske og praktiske Knowledge af Agentforces pro-code-værktøjer. Du vil lære at opbygge, implementere og overvåge agenter effektivt, sikkert og pålideligt, få en omfattende forståelse af ADLC og maksimere Agentforces potentiale i intelligent agentudvikling.
Den ikke-deterministiske karakter af AI-agenter kræver en specialiseret udviklingsstruktur. Dette kapitel skitserer denne rammestruktur ved at introducere ADLC (Agent Development Lifecycle). Dette kapitel giver en omfattende oversigt over de fem kernefaser i ADLC, fra indledende ideering og design til kontinuerlig overvågning og justering. Dette kapitel fastlægger den grundlæggende Knowledge, der kræves for at opbygge robuste og pålidelige agenter.
Dette afsnit knytter SDLC-koncepter til de fem faser af ADLC.
Dette er den grundlæggende fase, hvor en agents strategiske formål og driftsmæssige grænser er defineret. En velstruktureret designfase er det mest kritiske trin til succes, da det oversætter et forretningsbehov til et teknisk udgangspunkt. Designprocessen sikrer, at agenten ikke kun er funktionel, men også ansvarlig og i overensstemmelse med brugerens forventninger. Det er der, hvor "hvad" og "hvorfor" etableres, før der skrives en kode.
- Definer agentmål og kapaciteter: Først skal du tydeligt angive agentens primære målsætning og de specifikke, målbare opgaver, den skal udføre. Dette involverer definition af dens rolle (f.eks. "kundeassistent"), dens kernefunktioner (f.eks. "reservation af aftaler", "besvarelse af produktspørgsmål") og succesmetrikker for hver.
- Oprettelse af Persona og etiske vagter: Dette trin involverer design af agentens personlighed og definition af dets etiske grænser for at sikre, at den er pålidelig og sikker. Den etablerer agentens tone (f.eks. "formel", "venlig") og implementerer strenge regler for at forhindre skadelige, partiske eller upassende svar.
- Kortkontekst og forståelse: Du skal bestemme, hvilke oplysninger agenten skal forstå og huske for at være effektive. Dette inkluderer definition af omfanget af dens Knowledge og dens samtaleminded, hvilket giver den mulighed for at have sammenhængende samtaler med flere vagter.
- Identificer værktøjer og systemintegrationer: Dette involverer lagring af de eksterne systemer, API'er og datakilder, som agenten skal oprette forbindelse til for at udføre opgaver. Hvert værktøj (f.eks. en reservations-API, en kundedatabase) identificeres, og dets funktion tilknyttes en specifik agentfunktion.
- Plan for menneskelig eskalering: Det er vigtigt at definere de betingelser, hvorunder en agent eskaleres til et menneske. Dette involverer gennemgang af potentielle fejlpunkter og konverserende "døde slutninger" for at bestemme, hvornår en agent skal eskalere til en menneskelig operator. Designet skal beskrive, hvordan denne overførsel skal udføres for at sikre, at der overføres tilstrækkelig kontekst, så den hurtigt kan forbruges for at sikre en problemfri kundeoplevelse.
Dette er den praktiske opbygningsfase, hvor designplanen omdannes til en funktionel agent. Udviklere opbygger agenten, tilslutter den til dens værktøjer og sætter den i stand med de data, den har brug for for at udføre sine opgaver. Denne gentagne "indvendige løkke" af opbygning og justering er det sted, hvor agenten virkelig kommer til live.
- Konfigurer agentens logik og beslutningstagning: Dette trin involverer formatering af agentens argumentation ved at forbinde dens beslutningsstruktur til kontekst, værktøjer og datakilder. Udviklerens rolle er at definere agentens adfærd ved at oprette API'er eller genbruge eksisterende API'er, angive driftsmæssige guardrails og angive, hvordan agenten vælger og bruger tilgængelige værktøjer til at udføre komplekse, flertrinsopgaver.
- Ingeniørmeddelelser og finjusterede modeller: Agentens persona, instruktioner og begrænsninger kodes gennem omhyggelig meddelelsesteknik. Denne proces involverer udarbejdelse af den overordnede meddelelse, der guider Large Language Model (LLM), og finjustering af modellen på domænespecifikke data for at forbedre dens ydeevne for mere avancerede anvendelsessituationer.
- Integrer og sikr AI-værktøjer: De funktioner og API'er, der er identificeret under designfasen, er tilsluttet agenten. Ved at bruge et SDK ombryder udviklere eksisterende funktioner eller opretter nye, hvilket gør dem sikkert kaldbare af agenten og sikrer, at de har den korrekte godkendelse og fejlhåndtering.
- Opbyg data- og RAG-rørledninger: For at styrke agenten med ekstern Knowledge opbygger udviklere datapipelines for Retrieval-Augmented Generation (RAG). Dette involverer tilslutning til og indeksering af data fra kilder som vektorlagre, relationsdatabaser, diagramdatabaser eller interne dokumenter, hvilket gør disse oplysninger tilgængelige for agenten for at levere nøjagtige, kontekstbevidste svar.
Test af AI-agenter introducerer et paradigmeskift fra den deterministiske validering af traditionel software. Mens en konventionel applikation testes for korrekthed – et specifikt input skal producere et enkelt, forventet output – kræver en agents ikke-deterministiske karakter en mere sofistikeret tilgang. Målet er ikke at validere et enkelt højre svar, men at sikre, at agentens adfærd er i overensstemmelse med dets tilsigtede formål, er robust mod uventede input og forbliver pålidelig på tværs af en række acceptable resultater.
- Enhedstest: Dette lag fokuserer på agentens deterministiske, ikke-AI-komponenter. Det involverer traditionel enhedstest for at validere, at hvert individuelt værktøj og hver enkelt funktion fungerer korrekt i isolation, hvilket sikrer et pålideligt grundlag, før agentens komplekse argumentation anvendes.
- End-to-End (E2E) Test: Denne fase evaluerer agentens evne til at opnå mål i realistiske scenarier, hvilket er vigtigt i betragtning af dets ikke-deterministiske karakter. I stedet for at kontrollere for et nøjagtigt output, bekræfter disse end-to-end-tests, at agenten fuldfører opgaver, og at dens ydeevne ikke nedsættes, når der foretages ændringer.
- Adversarial og robusthedstest: Dette er praksis med bevidst at forsøge at bryde agenten for proaktivt at finde dens svagheder. Testere bruger tvetydige anmodninger, ondsindede meddelelser og andre sidesager til at vise sårbarheder og sikre, at agenten forbliver fleksibel og sikker under pres.
- Human-in-the-Loop (HITL) Evaluering: Da automatiserede test ikke kan måle nuancerede kvaliteter som tone eller samtaleforløb, er denne fase afhængig af brugerfeedback. Testere interagerer med agenten for at score dens svar for hjælpsomhed og den generelle brugeroplevelse og leverer vigtige data til finjustering af dens adfærd.
- Ydeevne og skaleringstest: Dette er et kritisk trin for at forhindre flaskehalse i ydeevnen, før de påvirker brugere. Denne proces simulerer realistiske spidsanvendelsesscenarier for at sikre, at agenter og applikationer kan håndtere høje mængder uden problemer og forudsigeligt. Den validerer, at løsningen ikke kun er korrekt, men også skalerbar.
Implementering af en AI-agent er en administreret proces, der fokuserer på at sikre, at den validerede agent er det, som brugerne interagerer med på en pålidelig og gentagelig måde. Dette kræver en struktureret tilgang, der flytter agenten fra et versionskontrolleret aktiv til en live, overvåget tjeneste.
- Pakning og versionskontrol: Agentens hele definition, herunder dens meddelelser og værktøjer, registreres som metadata i en fil og lagres i et kildekontrolsystem som Git. Dette opretter en enkelt kilde til sandheden og en reviderbar historik over alle ændringer.
- CI/CD Pipelines: Stien til produktion automatiseres for at eliminere den menneskelige fejl og sikre ensartethed. Disse pipelines promoverer automatisk agenten gennem udviklings-, test- og produktionsmiljøer og kører end-to-end-test ved hver fase for at fungere som en kvalitetsportal.
- Fasede udrulningsstrategier: For at minimere risikoen frigives nye agentversioner til et lille undersæt af brugere først ved brug af strategier som Canary Releases. Dette tillader overvågning af ydeevne i den virkelige verden før en fuld udrulning med mulighed for hurtigt at vende tilbage, hvis der findes problemer.
- Aktivering og styring: Det kritiske trin i udrulning af en agent involverer sikker aktivering af agenten med de korrekte tilladelser og sikring af, at den er tilsluttet overvågningsværktøjer. Dette giver øjeblikkelig indsigt i tilstanden og ydeevnen for den netop implementerede agent fra det øjeblik, den går live.
Implementering er ikke slutningen af livscyklussen for agentudvikling. Det er starten på dens kontinuerlige "udvendige løkke". Agenter er dynamiske systemer, der fungerer i uforudsigelige miljøer i den virkelige verden. Denne fase er dedikeret til at observere agentens live-ydeevne, indsamle indsigter fra dens interaktioner og bruge disse data til systematisk at justere og forbedre dets effektivitet, sikkerhed og effektivitet over tid.
- Overvågning af ydeevne i realtid: Dette er praksissen med at spore agentens nøgleoperative metrikker, når den interagerer med brugere. Dashboards bruges til at overvåge forsinkelse, tokenforbrug (omkostninger) og API-fejlsatser, hvilket giver en øjeblikkelig visning af agentens tilstand og effektivitet på højt niveau.
- Adfærdsmæssige og succesanalyser: Dette omfatter analyse af samtalelogfiler for at forstå, hvordan agenten faktisk udfører sine opgaver. Det fokuserer på sporing af opgavefuldførelsesfrekvenser, identificering af almindelige fejlpunkter eller konverserende "dead ends", og måling af brugertilfredshed for at bestemme, om agenten når sine mål. Som et eksempel for serviceagenter kan det angive metrikker om, hvor ofte og hvorfor en agent eskaleres til et menneske.
- Intelligent indstilling og justering: Dette er den aktive proces med at bruge indsigter fra overvågning til at forbedre agenten. Dette kan strække sig fra meddelelsesteknik til værktøjsoptimering.
- Data-drevet RAG-forbedring: Kvaliteten af agentens Knowledge forbedres kontinuerligt baseret på forespørgsler i den virkelige verden. Overvågning kan afsløre, at agenten har problemer med bestemte emner, hvilket fører til en justering af datakilderne eller hentningsprocessen (RAG-justering) for at forbedre nøjagtigheden af dets svar.
- Fortsat læring og tilpasning: Dette involverer oprettelse af en feedbackløb, hvor produktionsdata bruges til at gøre agenten smartere. Ved at betegne interaktionslogfiler – enten med human supervision eller LLM-baseret betegnelse – opbygges der et arrangeret datasæt, som kan bruges til at finjustere den underliggende model og anbefale yderligere forbedringer
Agentforce understøtter alle ADLC-faser med integrerede værktøjer til design, udvikling, test, implementering, overvågning og analyse – alt sammen inden for en enkelt forenet platform til hurtigt at opbygge og teste robuste agenter.
Agentforce ADLC er baseret på følgende vejledende principper:
- Bygget til både low-code og pro-code: Understøttelse af konfigurationsbaseret implementering (lav kode) og programmeringsmæssig udvidelighed (pro-code).
- Konstant AI-styret assistance og feedback: Registrerer og analyserer samtaledata for at informere agenttuning for kontinuerlig AI-styret forbedring.
- Teststyret udvikling på alle niveauer: Rigtig test på tværs af alle faser, validering af deterministiske komponenter gennem traditionel enhedstest og levering af nye tilgange til test af agentarrangementer og ikke-deterministisk adfærd.
- Executive og LOB Observability: Levering af omkostnings-, anvendelses- og ydeevnemetrikker for driftsmæssige og ledelsesmæssige interessenter.
Dette kapitel viser, hvordan Agentforce understøtter alle faser af ADLC inden for en samlet platform.
Ide
Ideeringsfasen er den grundlæggende fase af ADLC, hvor der formuleres en indledende vision og krav til agenter. Det involverer en dybdegående forståelse af problemet, identificering af potentielle løsninger og skitsering af agentens kernefunktioner.
Start din agents ideeringsproces ved at definere dens nøgleattributter:
- Mål/mål: Definer tydeligt agentens primære målsætning. Hvilket specifikt problem er det designet til at løse, eller hvilken opgave er det beregnet til at udføre? Hvem skal agenten betjene? Dette skal være en præcis og målbar erklæring, der guider hele udviklingsprocessen.
- Persona: Udvikl en detaljeret persona for agenten. Dette inkluderer definition af dens identitet, kommunikationstypografi og den rolle, den skal spille i interaktion med brugere eller andre systemer. Overvej dens tone, formalitetsniveau og eventuelle specifikke egenskaber, der gør den effektiv i dens tiltænkte kontekst.
- Mønster: Identificer og link til relevante agentmønstre og implementeringsstrategier. Dette involverer arkitektoniske designs eller bedste fremgangsmåder, der kan informere agentens struktur og adfærd. "Agentmønstre og implementering på Salesforce Agentforce: En teknisk hvidbog" er en værdifuld ressource til dette trin, der giver indsigt i effektiv agentdesign på Salesforce-platformen og Agentforce.
Design
Designfasen oversætter begreberne fra ideer til et detaljeret udgangspunkt for agentens konstruktion. Dette involverer definition af agentens arkitektur, brugerforløb, interaktionsmodeller og tekniske specifikationer som emner, værktøjer og guardrails.
Under designfasen skal du oprette en detaljeret oprettelsesplan for din agents konstruktion, der inkluderer:
- Agentdesign: Skitser agentens interne struktur, herunder dets komponenter, moduler, og hvordan de interagerer. Dette kan involvere definition af Knowledge, konfiguration og logik til at kontrollere agentadfærd, naturlige sprogbehandlingskomponenter (NLP) og integrationspunkter med andre systemer.
- Brugerforløb/interaktionsdesign: Tilknyt den komplette brugerrejse og agentens interaktioner. Definer samtaleforløb, beslutningstræer, fejlhåndtering og feedbackmekanismer for at oprette intuitive, effektive oplevelser.
- Tekniske specifikationer: Dokumenter de tekniske ikke-funktionelle krav til agenten, f.eks. ydeevnemetrikker, skalerbarhedsovervejelser, sikkerhedsprotokoller og integrationsspecifikationer.
- Prototyping & Mockups: Opret visuelle repræsentationer eller interaktive prototyper af agentens grænseflade og interaktioner. Dette giver mulighed for tidlig test og feedback, hvilket hjælper med at justere designet, før fuldskalaudvikling begynder.
- Data: Når du bestemmer typen og kilderne for data, som en agent har brug for, skal du identificere datasæt, API'er, databaser og lagre, som agenten skal have adgang til. For Agentforce skal du fokusere på, hvilke data der leveres som kontekst, om det er struktureret eller ustruktureret, og om det er real-time eller batch. Agentforce Platform er bygget med dyb integration med Data 360, så du kan bruge både strukturerede og ustrukturerede data fra Salesforce CRM og andre kilder. Ustruktureret indhold kan oprindeligt segmenteres og indekseres for RAG. MuleSoft giver dig mulighed for at oprette forbindelse til eksterne systemer.
- Værktøjer: Identificer de handlinger, som agenten skal udføre. Brug Agentforce til at vise værktøjer, der opnår forretningsmål. Disse handlinger anvender eksisterende Salesforce-aktiver, f.eks. Meddelelser via Promptkonstruktør, MuleSoft, Apex, Forløb og API'er med OpenAPI-specifikationer. Enhver handling, der kan kaldes, kan integreres i Agentforce og bruges af agenten, hvilket gør alle velkendte Salesforce-udviklingsværktøjer tilgængelige som Agentforce.
- Inputdata for agenter: I traditionel SDLC er input præcist angivet. I ADLC er input ofte naturlige, ikke-deterministiske erklæringer i frit format. Indsaml et repræsentativt korpus af erklæringer, der forventes at oprette relevante svar.
Udviklingsfasen fokuserer på at oversætte den definerede agents formål, kapaciteter og driftsområde, der er fastlagt i ideerings- og designfasen, til en ny Agentforce Agent.
For at hjælpe udviklere med at oprette agenter tilbyder Agentforce både Agent Builder og Agentforce Developer Experience (AFDX). Disse grundlæggende værktøjer tjener som det primære miljø til opbygning og konfiguration af agenten.
- Agentkonstruktør giver en brugergrænsefladeoplevelse til definition af agentens kernefunktionalitet.
- AFDX giver en programmeringsmæssig grænseflade til tilpasning og integration med andre systemer.
Udvikling og opbygning af en agent involverer disse trin, der kan udføres ved brug af enten Agentkonstruktør eller AFDX:
- Definering af personaen: Et vigtigt aspekt af agentdesign er etablering af en særskilt persona. Dette involverer konfiguration af:
- Agentbeskrivelse: En detaljeret beskrivelse af agentens rolle, målsætninger og de specifikke kundeserviceopgaver, den er designet til at håndtere.
- Tone: Agentens kommunikationstypografi, niveau af empati og eventuelle specifikke brandretningslinjer, den skal overholde.
- Definition af agentemner og -handlinger: Hvis du vil gøre en agent sofistikeret og i stand til at håndtere en række forskellige opgaver, er det vigtigt at opdele dens funktioner i særskilte emner med tilsvarende handlinger.
- :Emner Hvert emne kan konceptualiseres som sin egen specialiserede agent med et entydigt sæt instruktioner og værktøjer.
- Modular Architecture. Den modulære tilgang til emner giver mulighed for større organisation og skalerbarhed. Ved at definere flere emner kan agenten håndtere en bredere række komplekse scenarier. En agent kan f.eks. have særskilte emner for "Bestillingsstyring", "Ofte stillede spørgsmål", "Teknisk support" og "Faktureringsforespørgsler".
- Emneinstruktioner (Guardrails): Hvert emne leveres med specifikke instruktioner, der fungerer som guardrails, der definerer omfanget af, hvad agenten kan diskutere eller gøre i det pågældende emne. Disse instruktioner forhindrer agenten i at gå væk fra emnet eller i at angive irrelevante oplysninger. De hjælper også med at bevare ensartethed og nøjagtighed i svar.
- Handlinger: Emner er også udstyret med "værktøjer", som repræsenterer de handlinger, som agenten kan udføre. Disse værktøjer kan være:
- Informationsforanstaltninger: Hentning af data fra en Knowledge eller et eksternt system for at besvare en forespørgsel.
- Transaktionshandlinger: Udførelse af handlinger på vegne af brugeren, f.eks. afgivelse af en bestilling, opdatering af en kunderegistrering eller initiering af en refusionsproces. Disse handlinger er ofte integreret med andre systemer (f.eks. CRM, ERP).
- :Emner Hvert emne kan konceptualiseres som sin egen specialiserede agent med et entydigt sæt instruktioner og værktøjer.
Ved evaluering af AI-agenters ydeevne og pålidelighed støder testere ofte på en række udfordringer, der kan nedsætte brugeroplevelsen. Disse problemer strækker sig fra forkert fortolkning af brugerhensigt til ikke at udføre opgaver korrekt.
Almindelige scenarier for agentfejl
Opbygning af en robust agent kræver, at du forstår, hvordan og hvor den kan mislykkes. Følgende tabel kategoriserer almindelige problemer, der opstår under agentlivscyklussen, fra fejlretning til dårlig Knowledge hentning. Brug dette som en strategisk vejledning under udvikling og en tjekliste under test for at sikre, at din agent ikke kun er funktionel, men også pålidelig og intuitiv for slutbrugeren. Disse fejlscenarier skal hjælpe dig med at definere testsituationer.
| Kategori | Beskrivelse | Eksempler på fejl |
|---|---|---|
| Emneklassificering | Agenten kan ikke identificere brugerens hensigt eller mål korrekt. |
|
| Svarkvalitet | Fejl i indhold, nøjagtighed og format på agentens svar. |
|
| Handlingsudførelse | Agenten mislykkes, når vedkommende forsøger at udføre en bestemt funktion eller opgave. |
|
| Guardrails og instruktioner | Agenten overtræder foruddefinerede regler, begrænsninger eller konverserende grænser. |
|
| Knowledge Retrieval | Agenten har problemer med at hente og præsentere oplysninger fra sin Knowledge. |
|
| Struktureret vejledning | Agenten har problemer med at guide brugere gennem processer med flere trin. |
|
Bedste fremgangsmåder for test af AI-agenter
Følgende beskriver de bedste fremgangsmåder, du skal huske på, når du tester Agenter på Agentforce.
-
Forbedr testdata
Grundlaget for effektiv test er omfattende og realistiske testdata. Følg disse principper for at sikre, at du har effektive testdata til test af dine agenter:- Tilstrækkelig dækning: Sørg for at have nok testdata til at dække alle vigtige emner og brugerpersonaer.
- Realistiske scenarier: Sørg for, at dine testdata nøjagtigt repræsenterer brugerinteraktioner i den virkelige verden.
- Negative og Edge-tilfælde: Inkluder negative testtilfælde (hvad agenten ikke skal gøre) og kant-scenarier for at udfordre agentens grænser.
- Guardrails Test: Tilføj specifikke testsager, der er designet til at bekræfte, at agentens guardrails fungerer korrekt.
-
Optimer testkørsler
Hvis du vil have mest muligt ud af dine testressourcer, skal du optimere, hvordan du kører dine test. Følgende er overvejelser, når du tester Agentforce:- Test Case Volume: Du kan bruge op til 1.000 testsager.
- Kør samtidige test: Det er muligt at køre op til 10 testsager på en gang inden for en 10-timers tidsperiode.
- Administrer ressourcer: Husk på, at kørsel af test forbruger kreditter. Sørg for, at du er tilfreds med dine testdata, før du starter en kørsel for at undgå unødvendige omkostninger.
-
Vurderingsresultater
Analyser omhyggeligt testresultater for at identificere områder, der kan forbedres:- Analyser fejl: Undersøg hver mislykket testsag individuelt. Læs omhyggeligt, og forstå forskellen mellem de forventede og de faktiske resultater for at finde problemet.
- Brug et sandbox-miljø: Testagenter kan redigere CRM-data. For at forhindre utilsigtede ændringer af dine live data skal du altid udføre test i et ikke-produktionsmiljø, f.eks. en sandbox eller en scratchorganisation.
-
Tune og Retest
Test er en gentagende proces, der fortsætter, efterhånden som agenten udvikler sig:- Test kontinuerligt: Udfør test efter hver redigering af agentens emner eller handlinger. Dette validerer ændringerne og sikrer, at kvaliteten bevares.
- Udvid testdækning: Organiser og udvid dit datasæt kontinuerligt med nye testsager for at forbedre agentens generelle dækning og robusthed.
Test af tilgange
I betragtning af agentens kompleksitet er ingen enkelt testmetode tilstrækkelig. En omfattende valideringsstrategi skal være lagret, der kombinerer forskellige tilgange til at dække alt fra forudsigelige, deterministiske handlinger til nuancerne af dens ikke-deterministiske, konverserende adfærd. Disse tilgange giver en struktur til systematisk evaluering af hver komponent i agenten for at sikre, at den er robust, pålidelig og sikker.
-
Manuel test med Agent Simulator og Plan Tracer
- Formål: Dette er den indledende og ofte enkleste måde at teste en agent på. Den er ideel til et lille sæt eksempelanvendelsessituationer og til at få en grundlæggende forståelse af agentens adfærd.
- Mekanisme: En agentsimulator leverer et kontrolleret miljø, hvor udviklere og administratorer kan interagere direkte med agenten. Denne simulator tillader detaljeret sporing af de oplysninger, der leveres af administratoren/udvikleren, og tilbyder indsigter i, hvordan agenten behandler input og genererer output.
- Fordele:
- Hurtig feedback
- Nem at identificere øjeblikkelige problemer
- Hjælper med at forstå agentens logikforløb
-
Automatisk test med testcenter eller AFDX Test Suite
- Formål: Når manuel test har etableret en basislinje for funktionalitet, bliver automatiseret test vigtig for skalerbarhed, grundighed og regressionstest.
- Mekanisme: Værktøjer som Testcenter eller AFDX-testsuiten aktiverer generering af automatiserede test baseret på foruddefinerede eksempelanvendelsessituationer. Disse test er designet til at validere, om agentens instruktioner og underagentklassificeringer fungerer korrekt på tværs af en bredere række scenarier.
- Fordele:
- Sikrer ensartet ydeevne
- Identificerer subtile fejl
- Understøtter kontinuerlig integration/kontinuerlig implementering (CI/CD) pipelines
- Giver omfattende dækning
-
Aktionsspecifik enhedstest ved brug af Apex og forløb
- Formål: Hvis du vil validere den deterministiske forretningslogik, der er indbygget i agenthandlinger. Selvom agentens generelle adfærd ikke er deterministisk, er agenthandlinger ofte drevet af teknologier som forløb og Apex, som gælder standardudviklingspraksis.
- Mekanisme: Udviklere skriver enhedstest for de specifikke forløb eller Apex, som en agenthandling kalder. Disse test bekræfter de individuelle komponenter i agentens logik og sikrer, at de opretter de forventede resultater for et givent sæt af input.
- Fordele:
- Integration af disse enhedstest i en DevOps-pipeline giver et automatiseret sikkerhedsnet
- Validerer, at ændringer eller forbedringer af en handlings logik ikke introducerer regressioner
- Sikrer pålideligheden af agentens funktioner, før de implementeres i produktion
-
Adversarial Testing - Sikkerhed og Guardrail håndhævelse:
- Formål: Opbygning af forskellige typer agenter kræver en stærk vægt på sikkerhed og sikring af, at de fungerer inden for definerede parametre og guardrails. Dette er vigtigt for at forhindre utilsigtede handlinger, databrud eller misbrug. Formålet med modstanderstest er derfor proaktivt at identificere og afhjælpe disse potentielle sårbarheder ved bevidst at udfordre agenten med input, der er designet til at omgå dets sikkerhedsmekanismer og dermed teste dets robusthed og modstandsdygtighed over for manipulation.
- Mekanisme: Negativ test implementeres ved at udarbejde udfordrende, tvetydige eller ondsindede input, der skubber grænserne for agentens tilsigtede adfærd. Mens platformsværktøjer som funktionen "Guardrails" i Agentkonstruktør giver indsigt i instruktionsoverholdelse, bør udviklere også oprette tilpassede modsatte testsager, der aktivt forsøger at få agenten til at mislykkes i et kontrolleret miljø.
- Fordele: Denne tilgang reducerer sikkerheds- og compliancerisikoer systematisk før implementering. Ved at identificere potentielle fejlpunkter forbedrer modstandstest agenttillid og sikrer, at den fungerer sikkert og som tiltænkt, når den interagerer med brugere.
Iterativ test i scratch-organisationer og sandboxes
Den "indvendige løkke" er den kritiske, gentagne cyklus, hvor en agent flytter fra et koncept til en valideret komponent, klar til implementering. Denne proces med kontinuerlig justering kræver miljøer til både udvikling og test. Agentforce leverer denne ramme gennem scratch-organisationer, der er isolerede, midlertidige miljøer til hurtig prototyping, der ikke påvirker fælles miljøer, og sandboxes, der muliggør grundig test med realistiske data for at fremskynde vejen til produktion.
- Udvikling i Scratch-organisationer: Indledende udvikling skal forekomme i en scratchorganisation. De værktøjer, der leveres i udviklingsmiljøet, f.eks. Agentkonstruktør og AFDX, bruges fuldt ud her. Scratch-organisationer er stærke kandidater til CI/CD-pipelines til at køre enhedstest, udføre kodeanalyser og fremme ændringer til højere miljøer.
- Implementering til sandbox til real data test: Når agentens kernefunktioner er udviklet i en scratchorganisation, skal du implementere dem i en sandbox. Sandboxes er kopier af et produktionsmiljø og tilbyder en mere realistisk testplads.
- Real Data vs. Skjul data: Mens nogle udviklere kan narre data i scratch-organisationer til indledende test, tillader implementering på en sandbox test med "virkelige data". Dette er vigtigt for at evaluere agentens ydeevne i scenarier, der afspejler faktiske kundeinteraktioner. Brug af mere repræsentative data i en sandbox fremskynder udviklings- og justeringsprocessen markant.
- Fuld eller delvis sandbox til Core CRM Data: Afhængig af datamængden og specifikke testkrav kan enten en fuld eller delvis sandbox bruges.
- Fuld sandbox: Leverer en komplet replika af produktionsmiljøet, herunder alle metadata og data. Ideel til omfattende test og ydeevnetuning med store datasæt.
- Delvis sandbox: Indeholder et undersæt af produktionsdata, ofte tilstrækkeligt til at teste specifikke funktioner eller funktionaliteter, hvor et fuldt datasæt ikke er strengt nødvendigt.
- Knowledge og RAG Management: Hvis agenten er afhængig af en Knowledge eller en RAG-model, skal du overføre alt relevant indhold til sandboxen og indeksere igen. Dette sikrer, at agenten bruger aktuelle oplysninger under test og kan hente og syntetisere indhold nøjagtigt.
Agentforce definerer agenter gennem metadata, så de kan implementeres ved hjælp af Salesforce-standardprocedurer som ændringssæt eller AFDX. Denne fase fremhæver en sikker og kontrolleret udrulning gennem vigtige funktioner som agentversionering og et separat aktiveringstrin, som sikrer systemets stabilitet og tillader hurtig gendannelse fra problemer.
Følg disse trin for at implementere og frigive din nye agent.
- Implementer via ændringssæt/metadata-API eller AFDX: Implementeringsprocessen for agenter anvender Salesforce-standardprocedurer og behandler agenter som metadata. Dette bør være en velkendt proces for alle, der er vant til Salesforce-udvikling og -implementering. Brug af ændringssæt eller AFDX sikrer en struktureret og ensartet tilgang til migrering af agentkonfigurationer mellem miljøer, f.eks. fra sandbox til produktion. Denne metode gør versionskontrol og korrekt ændringsstyring nemmere, hvilket er vigtigt for at vedligeholde systemets stabilitet og pålidelighed.
- Aktiver agenter efter implementering: Efter en vellykket implementering er det vigtigt, at en systemadministrator aktivt "aktiverer" agenten. Implementering placerer blot agentens kode og metadata i målmiljøet. Aktivering er det trin, der gør agenten operativ og tilgængelig for brug. Denne adskillelse tillader kontrolleret udrulning og test, før en agent bliver live og interagerer med slutbrugere eller andre systemkomponenter.
- Brug versionering til sikker agentstyring: Agentversionering er en vigtig funktion, der i væsentlig grad forbedrer sikkerheden og fleksibiliteten af agentudvikling og vedligeholdelse.
- Oprettelse, test og udgivelse af nye versioner: Den anbefalede fremgangsmåde involverer oprettelse af en ny version af en agent, når der kræves ændringer eller forbedringer. Denne nye version kan derefter testes grundigt i et sandbox-miljø uden at påvirke den live, aktiverede agent. Når den nye version er blevet valideret og betragtes som klar, kan den udgives og efterfølgende aktiveres og erstatte den tidligere operationelle version. Denne gentagne proces tillader kontinuerlig forbedring og innovation, mens afbrydelse minimeres.
- Tilbage til tidligere versioner: En vigtig fordel ved versionering er muligheden for hurtigt og nemt at vende tilbage til en tidligere, stabil version, hvis der opstår et problem med en netop implementeret eller aktiveret agent. Hvis noget går galt – f.eks. hvis en agent optræder forkert eller introducerer en uventet fejl – kan administratorer ganske enkelt rulle tilbage til den sidst kendte gode version og aktivere den. Denne funktion giver et kritisk sikkerhedsnet, der tillader hurtig gendannelse og minimerer nedetid, hvilket sikrer forretningskontinuitet og brugertilfredshed.
Agentovervågning
Agentforce Sessionssporing er en åben, udvidelig model, der bygger på Data 360, der registrerer end-to-end agentinteraktioner. Agentforce overfører data fra forskellige kilder (startende med logfiler for grundlæggende system) og kombinerer alt under et sessions-id.
Sessionssporingsdatamodel (STDM) giver detaljerede oplysninger om, hvad der skete under agentsessioner, herunder:
- Omdrejningsinteraktioner
- Årsagssammenhæng af kørsler af motor
- Handlinger, meddelelses- og gatewayinput/output
- Fejlmeddelelser
- Endelige svar
STDM er et vigtigt værktøj til at hjælpe udviklere med at:
- Fejlfind agentopsætnings- og konfigurationsproblemer på opbygningstidspunktet.
- Find ud af, hvorfor visse testsager mislykkedes under batchtest.
- Find ud af, hvorfor en agent ikke kan håndtere et sæt af brugerspørgsmål eller er ude af emnet.
Udviklere bør bruge disse sessionssporingsdata til at observere, overvåge, undersøge og fejlfinde agentbegivenheder, hændelser og adfærdsmønstre.
STDM består af DLO'er (Data Lake Objects) og DMO'er (Data Model Objects), der lagrer detaljerede logfiler over agentadfærd. Metadata om hvert LLM-kald, der foretages af argumenteringssystemet, kan sammenføjes med feedback eller guardrails-metrikker. Data streams til DLO'er i Data 360 og tilknyttes til gældende DMO'er.
Udviklere kan få adgang til disse data og få indsigter ved at køre forespørgsler og rapporter op mod STDM. Komponenterne i et STDM beskrives nedenfor.
Agentforce-sessionssporingsdatamodel ERD
| Data Lake-objekt/datamodelobjekt | Beskrivelse |
|---|---|
| AIAgentSession | En overarching-beholder, der registrerer sammenhængende interaktioner med en eller flere AI-agenter. |
| AIAgentSessionParticipant | En enhed (menneske eller AI), der deltager i en AIAgentSession. |
| AIAgentInteraction | Et segment i en session. Det starter typisk med en brugers anmodning og slutter, når AI-agenten leverer et svar på den pågældende anmodning. |
| AIAgentInteractionStep | En særskilt handling eller handling, der udføres under en interaktion for at fuldføre brugerens anmodning. |
| AIAgentInteractionMessage | En enkelt kommunikation, der leveres af brugeren eller genereres af AI-agenten under en session. |
Agentforce
Agentforce Optimization er en effektiv funktion, der er designet til at forbedre AI-agenters ydeevne ved at give dybdegående indsigt i brugerinteraktioner. Bygget på analysefunktionerne i STDM (Session Tracing Data Model), giver det administratorer og udviklere mulighed for at forstå brugeremner, engagementmønstre og effektiviteten af agentløsninger.
Nøgleaspekter af Agentforce omfatter:
- Momentspecifikke data: Agentforce Optimization udvider STDM ved at introducere "Moments", som repræsenterer interaktioner, der er fokuseret på en bestemt brugerhensigt eller anmodning under en session. Disse detaljerede data giver mulighed for detaljeret inspektion af hvert aspekt af en interaktion, fra den indledende brugeranmodning til agentens løsning.
- Automatisk momentbehandling: Øjeblikke genereres dagligt og derefter klynger og tagges ugentligt på tværs af alle aktive agenter ved brug af en avanceret stor sprogmodel (LLM). Denne segmentering forenkler forespørgsel og giver indsigt i forskellige facetter af agentsessioner.
- Forespørgsel og analyse: Brugere kan forespørge på øjeblikke baseret på tags, kvalitetsscores og andre kriterier. Dette aktiverer vurderingen af brugerengagement gennem metrikker som Momentvarighed og relevanskvalitetsscores, der hjælper med at finde områder til forbedring.
- Forenet datamodel: Agentforce optimering bruger den forenede Sessionssporingsdatamodel (STDM), som registrerer hver logførte begivenhed i en session, herunder individuelle samtaleomgange. Alle relevante enheder klargøres ved aktivering af STDM i opsætningen.
Ved at analysere AI-agentinteraktioner giver Agentforce optimering brugerne mulighed for at identificere områder til forbedring og justere konfigurationer, så de bedre opfylder brugerbehovene.
Hvis du ønsker yderligere oplysninger, kan du se datamodel til Agentforce-optimering.
Dette kapitel er en praktisk vejledning til pro-code-udviklere. Den viser, hvordan du opbygger, tester og implementerer agenter med Agentforce DX (AFDX) og vores Python SDK med fart og sikkerhed. Vi gennemgår hele livscyklussen fra det indledende design til en versionskontrolleret agent ved brug af den effektive kombination af AFDX og vores Python SDK.
Følgende eksempler bruger to nøgleværktøjssæt, der er designet til opbygning og administration af agenter på Agentforce. En grundlæggende forståelse af disse værktøjer anbefales for at få mest muligt ud af denne vejledning.
1. Agentforce DX (AFDX): Til administration af livscyklussen
Agentforce DX udvider det velkendte Salesforce Developer Experience-værktøjssæt (SFDX) – herunder Salesforce CLI og VS Code-udvidelser – til at understøtte hele agentudviklingslivscyklussen. Den bruges til at administrere en agent som versionskontrollerede metadata, automatisere test fra kommandolinjen og orkestrere implementeringer mellem dine udviklings-sandboxes og produktion.
Hvis du vil vide mere, kan du se: Kom i gang med Agentforce DX Development.
2. Agentforce Python SDK: Til opbygning af agenten
Python SDK leverer den programmeringsmæssige grænseflade for udviklingens "indvendige løkke". Den giver dig mulighed for at definere en agents argumenteringslogik, tilslutte dens værktøjer og administrere meddelelsesskabeloner direkte i et velkendt Python-miljø og strømline kerneopbygningsfasen i ADLC.
SDK er tilgængelig på PyPI: https://pypi.org/project/Agentforce-sdk/.
Det komplette projekt er tilgængeligt her:
https://github.com/akshatasawant9699/ADLC_Whitepaper.
Denne grundlæggende fase definerer en agents formål, persona og kernefunktioner. Det involverer besvarelse af kritiske spørgsmål for at arkitektere agentens "hjerne", før der skrives kode. I dette eksempel designer vi en agent til Coral Cloud Resorts.
- Mission: Agenten fungerer som resortmanager, håndterer kundeklager, administrerer medarbejdertidsplaner og sikrer problemfri resortdrift.
- Persona: Agenten har en nyttig, professionel og konverserende tone.
- Værktøjer og funktioner: Agenten skal have adgang til reservationssystemer, medarbejderplanlægningssoftware og resortpolitikker.
- Beslutningslogik: Agenten bruger AI-genererede emner til at bestemme brugerhensigt og generere relevante handlinger.
Med Agentforce DX oversættes designfasen til en konkret specifikationsfil: Agentforce DX: Generering af en agentspecifikation. Det første trin i pro-code-rejsen er at generere en agentSpec.yaml fil. YAML-filen registrerer agentens kernesign, herunder dens rolle, relevante firmaoplysninger og en AI-genereret liste over emner, der definerer de job, den kan håndtere.
Brug Salesforce CLI til at generere denne specifikation via interaktive meddelelser. Hvis du vil begynde at oprette din agent med Agentforce DX, skal du køre:
Du skal angive specifikke detaljer, der blev defineret under ideeringsfasen:
- Agenttype: Kunde
- Firmanavn: Coral Cloud-resorter
- Firmabeskrivelse: Coral Cloud Resorts giver kunder exceptionelle destinationsaktiviteter, uforglemmelige oplevelser og reservationstjenester, alt sammen understøttet af en forpligtelse til at levere topklasses kundeservice.
- Agentrolle: Resortmanageren udfylder kundeklager, administrerer medarbejdertidsplaner og sikrer, at alle processer kører uden problemer.
Kørsel af denne kommando opretter en agentSpec.yaml-fil i DX-projektets specs-mappe. Filen indeholder de oplysninger, der blev leveret sammen med en liste over AI-genererede emner, der inkluderer navnet og beskrivelsen af hvert emne. Gennemse og rediger filen efter behov for at justere agentens funktioner.
På samme måde bruger Python SDK-implementeringen interaktiv specifikationssamling til automatisk at generere agentemner med de rette omfangsfelter, der er påkrævet for SDK-kompatibilitet.
Desuden opretter den en komplet JSON-fil for agentspecifikation, som vil blive brugt til at oprette en agent i fase 2.
Udviklingsfasen fokuserer på at konstruere agentens kernekomponenter: argumentationssystemet, værktøjer, det kan bruge, og dets Knowledge base. Agentforce abstrakterer meget af kompleksiteten, hvilket gør det muligt for udviklere at fokusere på forretningslogik.
Dette afsnit deler to pro-code-tilgange for Agentforce. For det første ved hjælp af Agentforce DX og for det andet ved hjælp af Python.
Agentforce DX: Opret en agent fra en specifikation
Når filen agentSpec.yaml er klar, skal du oprette agenten i din Salesforce-organisation. Kør denne kommando for at oprette agenten og synkronisere dens tilknyttede metadata tilbage til dit lokale DX-projekt:
Når du bliver bedt om det, skal du acceptere standard-API-navnet, Resort_Manager. Kommandoen parser specifikationen, opretter agenten og henter metadataene. Metadataene omfatter en bot, BotVersion og en GenAiPlannerBundle, som tilføjer AI-intelligens og referencer til agentens emner og handlinger.
Se eksempel på agentens struktur, før du opretter den ved at tilføje --eksempelvisningsflaget for at generere en lokal JSON-fil, der beskriver den type agent, som LLM skal oprette, herunder foreslåede handlinger. F.eks.:
Hvis du ønsker flere oplysninger, kan du se Opret en agent fra dit DX-projekt fra Trailhead.
Agentforce Python SDK: Definer specifikke værktøjer
Agent-SDK gør agenttest nemmere ved at oprette mock-handlinger. Disse mock-handlinger skal til sidst erstattes med virkelige handlinger i Salesforce. Salesforce tilbyder en række platformsfunktioner, herunder forløb, Apex, meddelelsesskabeloner og API'er, som alle kan indkapsles som Agentforce.
Her er et afbildet handlingskodestykke til at illustrere, hvordan en Agentforce kan se ud.
Implementeringen etablerer forbindelsen til Salesforce, opretter agentforekomsten og definerer tilpassede værktøjer og handlinger, som agenten kan bruge til at interagere med eksterne systemer og udføre specifikke forretningsfunktioner.
Som vi har diskuteret ovenfor, er test af en agent mere kompleks end traditionel softwaretest. Det kræver validering af adfærd, argumentation og robusthed på tværs af forskellige scenarier. Dette inkluderer enhedstest for individuelle værktøjer, end-to-end-test for samtaler og modstandertest for at finde sårbarheder.
Agentforce DX leverer et arbejdsflow på højt niveau til oprettelse, implementering og kørsel af test ud over testcenteret og den direkte test-API. Dette afsnit viser kørsel af test med Agentforce DX.
Agentforce DX: Kør en agenttest
Brug Agentforce DX til at køre foruddefinerede agenttest direkte fra kommandolinjen. Dette er ideelt til integration af agenttest i moderne DevOps-processer.
Agentforce Python SDK: Simuler E2E og negative test
Konceptuelt gør Python SDK det muligt for scriptede samtaler at simulere end-to-end (E2E) test og validere agentarrangement.
Agentforce Python SDK med Salesforce Testing API
Python SDK-implementeringen bruger omfattende test med Salesforce Testing API og AiEvaluationDefinition-metadata, der opretter strukturerede testsager med forventninger til emnesekvenser, handlingssekvenser, strengmatchning og kvalitetsmetrikker. Systemet genererer XML-metadatadefinitioner, der kan implementeres i Salesforce til automatiseret agenttest og validering.
Når det er valideret, implementeres agenten i et produktionsmiljø. I denne fase er Agentforce DX afgørende for at hjælpe med at administrere og flytte agentmetadata mellem forskellige organisationer (f.eks. sandboxes og produktion). Agentimplementeringer opretter en ny version af agenten, og agenten går ikke live, før du eksplicit aktiverer den. Dette giver dig fuld kontrol over, hvornår den nye version af agenten skal frigives.
Agentforce DX: Implementer agentmetadata
Standardprojektstrukturen Salesforce DX organiserer agentmetadata under mappen force-app. Brug standardkommandoerne sf project deploy til at implementere en agent og dens tilknyttede test i en målorganisation.
Når en agent er oprettet eller implementeret, kan du åbne den direkte i brugergrænsefladen i Agentforce Builder for at bekræfte dens konfiguration ved at køre:
Når du har valideret, at agenten er implementeret, kan du aktivere den. Hvis du støder på nogen uventede problemer, skal du rulle tilbage til den tidligere arbejdsversion af agenten.
Agentforce Python SDK: Implementering af agentimplementering
Implementeringen tager den validerede agentspecifikation og implementerer den i Salesforce-organisationen, så agenten er tilgængelig for brug. Implementeringsprocessen inkluderer agentoprettelse, metasynkronisering og bekræftelse af vellykket implementering.
ADLC er en kontinuerlig cyklus. Implementering er ikke slutningen. Agenter er levende systemer, der kræver konstant overvågning for at spore metrikker som forsinkelse, omkostninger og succesfrekvenser. De indsigter, der er opnået fra overvågning, bruges til at justere og forbedre agentydeevnen gennem prompt engineering, værktøjsoptimering og justering af Knowledge.
Agentforce platform giver omfattende dashboards og analyser til at understøtte denne afgørende fase, der sikrer, at agenter fortsætter med at udvikle sig og forbedre sig over tid.
Agentforce Analytics
Agentforce Analytics, der findes i mappen Agentforce (standard), bruger Data 360 til at give indsigt i agentydeevne. Dashboardet og rapporterne, der kan tilpasses, tilbyder data om ibrugtagning, feedback og anvendelse, hvilket hjælper dig med at justere emner og handlinger for at forbedre brugertilfredsheden. Du kan gå i detaljer med resultaterne ved at klikke på diagrammer eller linkede rapporter. Hvis du vil tilpasse, skal du duplikere eksisterende rapporter og redigere dubletterne for at undgå at afbryde analyseprocesser.
Erklæringsanalyse
Erklæringsanalyse viser, hvordan Agentforce (standard) bruger agenter, hvad de anmoder om, og om agenten kunne håndtere disse anmodninger. Disse rapporter, der kan tilpasses, kan hjælpe dig med at justere dine emner og handlinger, så dine agenter svarer mere effektivt og nøjagtigt.
Agentforce Python SDK: Overvågning med Data 360-integrationer
Agent SDK-implementeringen bruger avanceret overvågning og analyser med Data 360 Python-forbindelsen, etablerer forbindelse til Salesforce Data 360, forespørger på agentydeevnemetrikker og opretter omfattende overvågningsdashboards.
Systemet sporer svartider, succesfrekvenser, brugertilfredshed og omkostningsmetrikker for at levere indsigter, der kan handles på, til agentoptimering.
Agentforce DX: Agentovervågning
Implementeringen bruger AFDX-standardkommandoer med CLI-baseret agentstyring, holder agenten opdateret med platformsændringer og indarbejder brugerfeedback til kontinuerlig forbedring.
Se GitHub-lageret heri for ADLC-implementering ved brug af Agent SDK og AFDX.
Overvågning af agentudviklingslivscyklussen kræver overholdelse af et sæt kerneprincipper, der sikrer effektivitet, pålidelighed og strategisk justering. Følgende retningslinjer syntetiserer nøgleundervisningerne fra hver fase af ADLC i en strategisk struktur for arkitekter og udviklere.
1. Planlægning og ideer
Denne indledende fase fokuserer på at justere agentens formål med forretningsmål og sikre, at det bygger på et solidt fundament.
- Prioriter for forretningseffekt: Start med at tilknytte potentielle anvendelsessituationer direkte til strategiske forretningsmål. Brug en prioriteringsmatrix til at score deres potentielle påvirkning, og start med en enkelt, fokuseret anvendelsessituation med tydelige KPI'er.
- Involver interessenter tidligt: Indsaml indsigter om smertepunkter, og sørg for justering.
- Sæt skub i dataindsigter: En agent er kun så god som dens data. Brug Data 360 til at udforske tilgængelige strukturerede og ustrukturerede data for at informere agentens kontekst og funktioner. Gennemse eksisterende rapporter og dashboards for at identificere aktuelle tendenser, der kan informere dit valg af anvendelsessituation.
- Brug Frameworks for Ideation: Anvend strukturerede idemetoder til brainstorming og justere potentielle applikationer, f.eks. designtænkning eller SWOT-analyse.
2. Byggeagenter
Denne fase dækker de bedste fremgangsmåder for opbygning af en effektiv agent.
- Undgå for mange emner: Begræns antallet af emner for at reducere risikoen for at oprette lignende eller overlappende emner, der kan forvirre agenten.
- Bevar instruktioner og meddelelser præcise: Brug direkte, enkelt sprog, og angiv eksempelerklæringer for at guide agenten effektivt.
- Leverage Variables og deterministiske handlinger: Brug disse værktøjer til at guide agentens adfærd og optimere dens ydeevne for mere forudsigelige resultater.
- Behold handlingsresultaterne små og præcise: Sørg for, at agentens svar er korte og til pointen. Længere output bruger mere kontekst og er langsommere at generere.
- Optimer handlinger for hastighed: Design forløb og Apex for at returnere minimalt antal påkrævede data. Sørg for at have færre handlinger, der er nødvendige for at generere et svar, ved at forhåndsbehandling, hvor det er muligt.
- Definer et tydeligt omfang: Skriv korrekte beskrivelser, instruktioner og omfang for handlinger for at forhindre agenten i at kalde RAG (Return-Augmented Generation) for spørgsmål uden for omfanget.
- Brug Hybrid Søgning sparsomt: Brug kun hybrid søgning, hvis det er absolut nødvendigt, da det kan påvirke forsinkelsen negativt.
3. Test, overvågning og justering
Denne gentagne fase er vigtig for at justere agentens nøjagtighed og ydeevne.
- Opret et testforløb: Følg en ensartet testcyklus:
- Kør batchtest: Udfør et omfattende sæt af test.
- Vis scores/fejl: Analyser ydeevnemetrikker, og identificer fejl.
- Kontrolfejl: Undersøg hver fejlrække for at forstå uoverensstemmelsen.
- Opdater agent: Foretag de nødvendige justeringer af agenten eller dens evalueringsdata.
- Gennemse Sessionssporingsoplysninger: Brug datamodellen Sessionssporing og Agentforce Interaction Explorer til at udføre grundlæggende årsagsanalyser, når der identificeres problemer eller uventet adfærd. Tilpas din agent baseret på oplysningerne, og fortsæt med at gentage din agent.
Agentudviklingslivscyklussen repræsenterer en kritisk udvikling af traditionelle softwareudviklingsprincipper, der er designet til æraen af intelligente, autonome systemer.
- Evolution, ikke erstatning: Agentudviklingslivscyklus udvider og forbedrer traditionel administration af applikationslivscyklus uden at erstatte den.
- Data som førsteklasses borger: Data spiller en meget mere dynamisk og central rolle i agentudvikling.
- Specialized Tooling & Skills: Kræver nye værktøjer og et bredere sæt af specialiserede færdigheder på tværs af datavidenskab, ML-teknik og agentudvikling.
- Fortsat læring: Agentudvikling tilføjer løbende læring og tilpasning af selve systemet.
- Future Impact: Agentisk AI lover at automatisere og optimere komplekse it-handlinger og softwareudviklingsarbejdsflows yderligere.