Yritystietojen arkkitehtuuri on käännekohdassa. Organisaatioiden täytyy tukea reaaliaikaisia tekoälysjärjestelmiä, noudattaa yhä tiukempia tietoturvaa koskevia säännöksiä ja tehdä yhteistyötä ulkoisten kumppaneiden kanssa, jotka eivät voi jakaa raakadataa. Nämä vaatimukset muuttavat datalustojen suunnittelutapaa.

ETL-putkille ja keskitetyille datan varastoille rakennettujen perinteisten arkkitehtuurien on vaikea vastata näitä vaatimuksia. Datan replikointi järjestelmissä lisää viiveitä, kustannuksia ja hallinnan monimutkaisuutta. Jokaisesta kopiosta tulee uusi vaatimustenmukaisuusvelvoite, mikä monimutkaistaa suostumusten hallintaa, poistopyyntöjä ja käytäntöjen noudattamista eri jakautuneissa ympäristöissä.

Toimiala siirtyy näiden haasteiden ratkaisemiseksi nollakopioituihin ja käytäntöjä noudattaviin yhteistyömalleihin. Datan puhdistamat tilat ovat kehittyneet tärkeäksi arkkitehtoniseksi ominaisuudeksi, jonka avulla useat organisaatiot voivat analysoida jaettuja signaaleja paljastamatta tai siirtämättä raakadataa. Sen sijaan, että tiedot siirrettäisiin keskitetyille ympäristöille, laskutoimet suoritetaan kunkin osallistujan hallitsemassa toimialueessa, ja vain yksityisyyttä suojaavat tulokset palautetaan.

Tämä arkkitehtuurin muutos näkyy yhä enemmän eri toimialoissa. Esimerkiksi WPP:n, joka on markkinoinnin ja mainonnan suurin yhtiö, hankkima InfoSum heijastaa puhtaiden huoneiden kasvavaa merkitystä infrastruktuurina yksityisyyden suojaamiseksi. Rahoituslaitokset käyttävät niitä havaitakseen petoksia eri laitoksissa, jälleenmyyjät koordinoidakseen tarjouksia kuluttajamerkkien kanssa ja terveydenhuollon organisaatiot analysoidakseen ristipalveluntarjoajien potilasjoukkoja jakamatta luottamuksellisia tietueita.

Salesforce Data 360 toteuttaa tämän mallin käyttämällä Hyperforceen perustuvaa nollakopioarkkitehtuuria. Data säilyy sen lähdejärjestelmissä, kun taas yhdistetyt kyselyt noudattavat yksityisyys-, suostumus- ja asuntokäytäntöjä suorituksen aikana. Tämä lähestymistapa sallii reaaliaikaisten havaintojen, pilvipalveluiden välisen yhteistyön ja tekoälyn perustuvan päätöksenteon laajentamatta datan replikoinnin aiheuttamaa riskiä.

Tämä asiakirja tutkii, miten datan puhdistustilat toimivat nykyaikaisen yrityksen perustavana arkkitehtuurikuvakkeena, joka tukee tekoälyn innovaatioita, säännösten noudattamista ja turvallista toimialueiden välistä yhteistyötä samanaikaisesti ja laajalti.

Yritysarkkitehtien täytyy ensin kohdata vanhojen integraatiomallien rakenteellinen virhe ymmärtääkseen, miksi datan puhdistustilat ovat välttämättömiä. Toimiala on siirtymässä ratkaisevasti monoliittisista, keskitetyistä datasäilöistä hajautettuihin, yhdistettyihin ekosysteemeihin. Tässä tapauksessa dataa käytetään, hallitaan ja lasketaan paikallaan fyysisen siirron sijaan. Tämä työvuoro ei ole asteittainen. Se on suora vastaus järjestelmäkysymyksiin, jotka liittyvät skaalaan, yksityisyyteen ja joustavuuteen, joita perinteiset arkkitehtuurit eivät voi enää omaksua.

Yritykset ovat luottaneet ETL:ään perustuviin arkkitehtuureihin, jotka kopioivat dataa CRM-, ERP- ja digitaalisista järjestelmistä keskitetyiksi varastoiksi raportointia ja analyysiä varten. Tämä lähestymistapa osoittautui tehokkaaksi historiallisille analyyseille, mutta se suunniteltiin hitaammalle ja eräpohjaiselle maailmalle.

Kun digitaaliset vuorovaikutukset kiihtyivät ja tekoälykäyttöön perustuvat järjestelmät tulivat esiin, tämän mallin rajoitukset tulivat näkyviin. ETL-putket ovat luonnostaan asynkronisia, eli havainnot saapuvat usein tunteja tai päiviä tapahtumien jälkeen. Tämä viive ei ole yhä yhteensopiva nykyaikaisten käyttötapausten kanssa, kuten reaaliaikaisen personalisoinnin, mukautetun päätöksenteon ja tekoälyjärjestelmien kanssa, jotka vaativat välittömästi asiayhteydestä riippuvaisia tietoja.

Replikointi tuo esiin myös kasvavan hallinnan ja tietoturvan monimutkaisuuden. Jokainen uusi kopio vaatii lisäkäytäntöjä, valvontaa ja vaatimustenmukaisuuden hallintaa. Säännellyissä ympäristöissä järjestelmät, kuten yleinen tietosuoja-asetus (GDPR), vaativat, että organisaatiot hallitsevat tietojen poistamis-, suostumus- ja käyttörajoituksia kaikkialla, missä tietoja on, mikä on toiminnallinen haaste, kun datajoukkoja kopioidaan useissa järjestelmissä.

Tämä identtisyys yhdistää kustannukset ja toiminnalliset kustannukset. Organisaatiot maksavat useita kertoja tuonnista, tallennuksesta, tietoturvasta ja käsittelystä useilla sovellusalustoilla, kun taas lisäkopioiden marginaaliarvo laskee.

Tästä syystä nykyaikaiset datan arkkitehtuurit siirtyvät malleihin, jotka minimoivat datan liikkuvuuden ja pakottavat hallinnan suoraan lähteelle. Nollakopiointegraation ja yhdistetyn datan käyttöoikeuden avulla organisaatiot voivat luoda havaintoja replikoimatta luottamuksellisia datajoukkoja, mikä tarjoaa skaalattavamman, turvallisemman ja käytännön mukaisemman lähestymistavan yritystietojen yhteistyöhön.

Vastauksena näihin paineisiin toimiala on yhdistetty kahden täydentävän arkkitehtuurin paradigman ympärille: Datasäiliö ja Data Fabric. Yhdessä ne edustavat siirtymistä pois keskitetystä hallinnasta yhdistettyihin toimialueisiin perustuviin datan arkkitehtuureihin.

Data Mesh hajauttaa tietojen omistajuuden toimialueisiin kohdistetuille tiimeille, kuten Myynti, Markkinointi tai Toimitusketju. Jokainen toimialue käsittelee tietojaan tuotteena, jossa on selkeästi määritettyjä sopimuksia, laatun standardeja ja palvelutason tavoitteita. Tämä malli parantaa vastuuvelvollisuutta ja liiketoiminnan tasaamista, mutta yrityksen laajuisesti se tarjoaa uusia haasteita koordinoinnille, yhteentoimivuudelle ja yhdenmukaiselle toimialueiden hallinnalle.

Data Fabric ratkaisee nämä haasteet tarjoamalla yhteyskerroksen, joka sitoo hajautetut toimialueet yhdenmukaiseen järjestelmään. Se tarjoaa jaettua metadataa, yleisiä semantteja, automatisoitua käytäntöjen noudattamista, sukupolvea ja hallintaa, jolloin dataa voidaan löytää, käyttää ja hallita yhdenmukaisesti ilman, että fyysistä yhdistämistä pakotettaisiin yhdelle säiliölle.

Yhdessä Data Mesh ja Data Fabric luovat perustan yhdistetyn datan käyttämiseen. Ne eivät kuitenkaan ratkaise kriittistä toissijaista ongelmaa: sallivat turvallisen ja hallitun yhteistyön toimialueiden ja organisaation rajojen välillä, joissa dataa täytyy analysoida yhdessä kopioimatta tai paljastamatta.

Kun yritystiedot jaetaan ja yksityisyyttä koskevat säännökset tiukentuvat, organisaatiot kohtaavat ydinarkkitehtuurin haasteen. Miten he voivat tehdä yhteistyötä tiimien, kumppanien ja sovellusalustojen välillä jakamatta raakadataa? Perinteisiä datan integrointimenetelmiä ei suunniteltu tälle jakelun tai lakisääteisen valvonnan tasolle, mikä loi jännitystä yhteistyön ja vaatimustenmukaisuuden välillä.

Tämä haaste on johtanut siirtymiseen datan puhdistustiloihin perusrakenteellisena ominaisuutena. Clean rooms siirtää yhteistyön pois datan siirrosta ja hallitun laskennan suuntaan. Datajoukkojen kopioimisen tai vaihtamisen sijaan analyysit ja tekoälyn työkuormat suoritetaan siellä, missä data on jo olemassa, jakamalla metadata. Kyselyt arvioidaan reaaliajassa tietoturvaa, suostumuksia ja käyttöä koskevien sääntöjen perusteella, ja vain hyväksytyt, aggregoidut tulokset palautetaan.

puhdista huoneen perusta

Tässä mallissa datan puhdistamat tilat toimivat modernin datan arkkitehtuurin Trust rajana. Ne sallivat organisaatioiden työskennellä kumppaneiden ja tytäryhtiöiden kanssa menettämättä tietojensa hallintaa, noudattavat yksityisyyttä ja suostumuksia järjestelmän ohjaimien sijaan, eikä pelkkien käytäntöjen sijaan, ja toimivat pilvipalvelimella noudattaen datan sijaintia ja sopimusten rajoituksia.

Puhtaat tilat tarjoavat turvallisen tavan luoda havaintoja ulkoisesta datasta paljastamatta luottamuksellisia tietoja aktivointi-, analyysi- ja tekoälyn käyttötarkoituksissa. Ne sallivat siirtymisen datan jakamisesta luotettuun yhteistyöhön. Aktivoinnin käyttötapauksissa puhtaat huoneet tarjoavat turvallisen tavan luoda kohdeyleisöjä, jotka voidaan aktivoida suoraan sallittuun kohteeseen. Kaikki tämä saavutetaan paljastamatta henkilötietoja kummalle tahansa osapuolelle.Tämä on käännekohta yritystietojen arkkitehtuurissa. Datan puhdistamat huoneet eivät ole enää niche-työkaluja. Niistä tulee ydininfrastruktuuria yhdistetyille, yksityisyyden suojaaville ja tekoälyvalmiille datalustoille.

Onnistunut datan puhdistustilan arkkitehtuuri on usean käyttöliittymän järjestelmä, joka on suunniteltu ratkaisemaan datan apukohteiden, tietoturvan ja nopeuden kilpailuvaatimukset. On kolme ensisijaista henkilökuvaa, joiden erilliset jännityspisteet täytyy ratkaista teknisellä suunnittelulla.

Yksityisyyden ja vaatimustenmukaisuuden asiantuntijat käyttävät datan puhdistustilaa hallintatyökaluna. Heidän ensisijainen huolenaiheensa on vaatimustenmukaisuuden lasku, eli riski, että ulkoiset yhteistyöympäristöt eivät noudata samoja tiukkoja standardeja kuin sisäiset järjestelmät.

  • Rajoituspisteet: Sääntelyaltistukset (GDPR, CCPA, DMA) ja "tietojen kalastelu" -hyökkäykset, joissa kumppani yrittää trianguloida käyttäjän identiteettiä toistuvien tarkkojen kyselyiden avulla.

Datatieteilijät näkevät datan puhdistustilan turvapaikkana edistyneelle mallinnukselle. Heidän ensisijainen huolenaiheensa on apukohteiden säilyttäminen, jotta yksityisyysasetukset eivät tee tiedoista tilastollisesti tarpeettomia.

  • Rajoituspisteet: Suuri viive ja rajoitettu pääsy tarkkoihin attribuutteihin, joita tarvitaan koneoppimiseen (ML), lookalike-mallinnukseen ja churn-ennusteeseen.

Tämä henkilökuva keskittyy vain aikaan arvoon (TTV). He ovat huolissaan siitä, että datan puhdistustilan projektit muuttuvat usein teknisiksi pullonkauliksi, jotka vaativat viikkoja datan tekniikan tukea.

  • Rajoituspisteet: Monimutkaiset määritysprosessit, datan manuaalinen puhdistaminen ja ”tyhjä sivu” -ongelma, jonka vuoksi sinun täytyy kirjoittaa koodia saadaksesi yksinkertaisia päällekkäisiä tuloksia.

Vaikka perinteiset arkkitehtuurit keskittyvät rakentamaan datakerros ennen käyttäjäkerrosta, strateginen lähestymistapamme, joka noudattaa ”Business First” -metodologiaa, kääntää tämän mallin. Priorisoimme koodittoman lähestymistavan vain muutamaan napsautukseen, joka sallii yrityskäyttäjien luoda havaintoja ja ryhtyä välittömiin toimiin.

"Insight-to-Action"-työnkulku: Arkkitehtuuri on suunniteltu aktiiviseksi työtilaksi passiivisena säiliön sijaan. Tarjoamme käyttöskenaarioiden malleja (esimerkiksi päällekkäisiä segmenttejä, aktivointeja ja kampanjoiden suorituskykyä) salliaksemme yrityskäyttäjien tehdä havaintoja itse. Tämä varmistaa, että havainto, kuten optimoitu lookalike-segmentti, on välittömästi käytettävissä aktivointia varten markkinointiympäristössä ilman, että datan insinööri tarvitsee siirtää tiedostoja manuaalisesti.

Zero-Copy-liitos strategisena omaisuutena: TTV:n maksimoimiseksi arkkitehtuuri käyttää nollakopiologiikkaa. Tavallisen ETL-prosessin sijaan, joka sisältää viive- ja tietoturvariskejä, arkkitehtuurimme yhdistää kyselyt suoraan datan sijaintiin (esimerkiksi Snowflake, BigQuery tai Amazon S3). Tämä muuttaa organisaation olemassa olevan datan investoinnin strategiseksi omaisuudeksi, jonka avulla yrityskäyttäjät voivat reagoida ajankohtaisiin tietoihin reaaliajassa, samalla kun hallinta on tiukkaa ja datan tarpeettomuuden kustannukset poistetaan.

Datan puhdistamat tilat ovat kehittyneet mainonnassa vastauksena evästeiden vanhentumiseen ja yksityisyyssäännöksiin, mutta ne ovat kehittyneet mittaamisen ulkopuolelle asiakasanalyyseihin, kohdeyleisöjen segmentointiin ja aktivoinnin käyttötarkoituksiin eri toimialoilla. Vähittäismyymälöiden tilan raportin 2025 mukaan 66 prosenttia organisaatioista käyttää nyt puhtaita huoneita tietyssä kapasiteetissa, mikä johtuu yksityisyyden suojaamista koskevan yhteistyön tarpeesta, joka tarjoaa mitattavissa olevia liiketoimintatuloksia. Kuvio on yhdenmukainen eri toimialoilla: data pysyy omistajansa kanssa, laskutoimi on hallittavissa ja vain yksityisyyttä suojaavia havaintoja jaetaan.

Haaste: Markkinoijien täytyy mitata kampanjoiden tehokkuutta, välttyä identtisiltä mainoskuvauksilta ja optimoida vaikutusalue/yleisyys — mutta he eivät voi enää luottaa kolmansien osapuolten evästeisiin tai laitetunnisteisiin.

Clean Room -ratkaisu:

  • Mainostajat lisäävät tiivistettyjä asiakkaan tai kampanjan näyttötietoja
  • Julkaisijat lisäävät vaikuttamisen ja osallistumisen signaaleja
  • Clean Room laskee vaikutusalueen, yleisyyden, määrityksen ja noston
  • Aktivointi tapahtuu hyväksyttyjen sovellusalustojen kautta ilman raakadatan vientejä

Liiketoiminnan lopputulos: Puhtaat tilat tarjoavat suljetun silmukan attribuutin, joka linkittää mainoskuvaukset todellisiin transaktioihin, asteittaisen analyysin, joka eristää todelliset kampanjat, ja yhtenäistettyä mittausta eri kanavissa — ominaisuuksia, joita perinteinen digitaalinen mainonta ei voi tarjota.

Toimialan todisteet: Mittaus on nykyään vakiomuotoisin puhtaiden huoneiden käyttötapa, ja suuret mediat, kuten Pinterest, Disney ja Paramount, luovat omat puhtaat huoneensa.

Haaste: CPG-brändit käyttävät paljon vähittäismyymälöitä, mutta heillä ei ole näkyvyyttä ostosten lopputuloksiin. Vähittäismyyjät omistavat muotoiltua myyntipisteen dataa, mutta he eivät voi paljastaa sitä rikkomatta yksityisyyttä koskevia sitoumuksia.

Clean Room -ratkaisu:

  • Vähittäismyyjät ja CPG-yritykset yhdistävät vähittäismyyntipisteiden dataa markkinointitietoihin optimoidakseen tarjoustoiminnot
  • Brändit lisäävät tiivistettyjä CRM- tai kanta-asiakas-tunnisteita
  • Clean Room -linkit, jotka näyttävät mainoksen myymälän sisäisille ostoksille/verkkokaupoille
  • Aktivointi pysyy jälleenmyyjän median ekosysteemissä

Liiketoiminnan lopputulos:

  • Vähittäismyyjät monetisoivat ensimmäisen osapuolen tietoja myymättä raaka-asiakastietoja
  • Brändit saavat suljetun silmukan attribuutin, joka näyttää, mitkä kampanjat ovat edistäneet ostoksia
  • Vähittäismedian verkostojen skaalautuminen ilman yksityisyyttä Toimialan todisteet: Retail Media Networks, kuten Walmartin Luminate ja Kroger Precision Marketing, tarjoavat puhtaita huoneita, jotka auttavat CPG-brändejä analysoimaan asiakastoimintaa ja optimoimaan markkinointistrategioita vähittäismyymälädatan avulla.

Haaste: Petosten verkostot toimivat eri laitoksissa, mutta pankit eivät voi jakaa asiakastietoja tai maksutapahtumien tietoja avoimesti, koska säännökset, kuten GLBA, ja uudet tietosuojalakit.

Clean Room -ratkaisu:

  • Useat pankit keräävät anonyymejä tietoja tunnistaakseen huijauskuviot, kuten epätavallisen pankkien välisen toiminnan
  • Yhdistetyt analyysit tai mallit suoritetaan jaetuille petosignaaleille
  • Mikään laitos ei näe toisen asiakastason tietoja

Liiketoiminnan lopputulos:

  • Toimielinten välisten petosten aiempi havaitseminen
  • Vähemmän vääriä positiivisia muotoillun signaalin avulla
  • Säännösten noudattaminen ilman luottamuksellisten tietojen keskittämistä

Toimialan todisteet: Experianin ja TransUnionin rahoituspalveluiden ratkaisut tarjoavat puhtaan huoneen teknologioita, joiden avulla pankit ja vakuutusyhtiöt voivat tehdä yhteistyötä petosten havaitsemisen ja riskien arvioinnin parissa ja ylläpitää tiukkoja tietoturvatarkastuksia.

Haaste: Lääkeyritykset tarvitsevat todellisia potilaiden lopputuloksia lääkitysten kehittämiseen, mutta tiedot sijaitsevat sairaaloiden EHR-järjestelmissä, jotka on suojattu HIPAA:lla ja vastaavilla säännöksillä.

Clean Room -ratkaisu:

  • Lääkärit ja lääketieteelliset tutkijat jakavat tietoja puhtaassa huoneessa nähdäkseen, miten potilaat reagoivat hoitoihin.
  • Potilastiedot säilyvät tarjontaympäristöissä.
  • Tutkijat suorittavat hyväksyttyjä tilastoanalyysejä puhtaan huoneen kautta.
  • Eriarvoinen yksityisyys estää uudelleen tunnistamisen.

Liiketoiminnan lopputulos:

  • Tilastollisesti käypä todellinen näyttö mittakaavassa
  • Virtaviivaista potilasrekrytointia kliinisiin kokeisiin täsmäämällä anonyymit potilastiedot kokeiluehtoihin, löytämällä sopivia ehdokkaita rikkomatta terveydenhuollon yksityisyyttä koskevia lakeja
  • Vähennetty riippuvuus rajoitetuista kliinisten kokeiden populaatioista

Toimialan todisteet: Terveydenhuoltoon keskittyvät puhtaat huoneet, kuten Datavant, tarjoavat tutkijoille ja terveydenhuollon organisaatioille HIPAA-yhteensopivia ympäristöjä, joiden avulla he voivat analysoida potilastietoja turvallisesti kliinisissä tutkimuksissa ja lääkkeen kehittämisessä.

Puhtaat tilat sallivat näiden ensisijaisten käyttötarkoitusten lisäksi:

  • Toimitusketjun optimointi: Valmistajat ja toimittajat jakavat inventaariotietoja, tuotantoaikatauluja ja kysynnän ennusteita yhdessä, mikä mahdollistaa paremman koordinoinnin ja suojaa omistamia tietoja.
  • M&A-tarkkailu: Kun yksi yhtiö ostaa toisen, due diligence vaatii talousennusteiden ja asiakastietokantojen tutkimista jakamatta luottamuksellisia tietoja suoraan. Puhtaat huoneet paljastavat havaintoja, kuten asiakassegmentin tasaus ja vaatimustenmukaisuusriskit.
  • Media ja viihde: Julkaisijat todistavat kohdeyleisöjen arvon mainostajille samalla, kun he suojaavat tilaajien henkilöllisyyksiä ja ottavat käyttöön luotettujen mittojen tukemat premium CPM:t todennäköisyyksiin perustuvan kohdentamisen sijaan. Data Clean Roomsista on tullut perustavanlaatuinen Trust AdTechissa, vähittäismyymälässä, rahoituspalveluissa, terveydenhuollossa ja mediassa. Ne sallivat arvokkaan yhteistyön, joka oli aiemmin estetty yksityisyyttä, sääntelyä tai kilpailua koskevien rajoitusten vuoksi. Puhtaat huoneet ovat ydinrakenteellisia komponentteja, jotka mahdollistavat turvallisen ja hallitun yhteistyön – avaamalla havaintoja ja monetisointia luopumatta datan hallinnasta tai vaatimustenmukaisuudesta.

Datan puhdistustila on turvallinen ja hallittu ympäristö, jonka avulla useat osapuolet voivat luoda yhteisiä havaintoja paljastamatta tai vaihtamatta raakadataa. Datajoukkojen replikoinnin sijaan hyväksytyt analyysit, tekoälyn ja aktivoinnin työkuormat suoritetaan paikallaan, ja vain käytäntöjä noudattavat tulokset palautetaan. Kun aktivointi vaatii yksittäisiä tietueita, tiedot toimitetaan suoraan haluamaasi kohteeseen ilman, että niitä näytettäisiin yhteistyöhön osallistuville osapuolille.

Tyhjät tilat siirtävät yhteistyön arkkitehtuurisesti datan jakamisesta hallittuun laskentaan. Jokainen osallistuja säilyttää tietonsa, kun taas suorituksen aikainen noudattaminen hallitsee kyselyiden toimintatapaa, tulosrajoituksia, suostumuksia ja käyttökäytäntöjä.

Yhteistyö on edelleen mahdollista yksityisyyttä suojaavien tunnisteiden kohdistusmekanismien avulla, joiden avulla eri osapuolten datajoukot voidaan korreloida paljastamatta niiden perustana olevia tunnisteita — ominaisuus selitetään yksityiskohtaisemmin myöhemmin tässä asiakirjassa. Tästä syystä datan puhdistustilat toimivat perusinfrastruktuurina yksityisyyttä sääteleville, monipilvi- ja tekoälypohjaisille yrityksille, jotka käyttävät nollakopioituja, yhdistettyjä datastrategioita.

puhtaan huoneen yleiskatsaus

Varhaiset tietojen puhdistustilat noudattivat keskitetyn ”bunkkerin” mallia. Kaikkien osallistujien piti kopioida dataa neutraaliin kolmansien osapuolten ympäristöön analyysiä varten. Vaikka tämä lähestymistapa on käsitteellisesti yksinkertainen, se aiheutti merkittävää jännitystä. Datan siirto kasvatti viiveitä ja kustannuksia, monimutkaisia lakisääteisiä ja vaatimustenmukaisuussopimuksia ja pakotti organisaatiot luopumaan luottamuksellisten tietojen suoran hallinnan hallinnasta. Säännellyillä toimialoilla nämä kompromissit tekevät yhteistyöstä usein epäkäytännöllistä.

Modernit datan puhdistustilat ovat kehittyneet jaettuun ja yhdistettyyn malliin. Data säilyy omistajan ympäristössä ja analyysit suoritetaan paikallaan yhdistettyjen kyselyiden kautta. Itse puhdas huone toimii hallintakerroksena, joka sieppaa kunkin kyselyn, käyttää yksityisyys- ja käytäntöjen hallintaa suorituksen aikana ja palauttaa vain hyväksyttyjä, aggregoituja tuloksia.

Ulottuvuus Perinteinen puhdas huone (”Bunker” -malli) Moderni puhdas huone (jaettu/yhdistetty malli)
Datan sijainti Data kopioidaan keskitetyn kolmannen osapuolen ympäristöön Tiedot säilyvät omistajan ympäristössä
Datan liikkuvuus Vaatii datajoukkojen fyysisen siirron ja kopioinnin Ei raakadatan liikkuvuutta, kyselyt suoritetaan paikallaan
Ohjaus ja säilyttäminen Tallennustila osittain luovutettu kolmannen osapuolen sovellusalustalle Kunkin osapuolen säilyttämä raakadatan omistajuus ja säilyttäminen
Arkkitehtuurimalli Keskitetty aggregointi Jakattu, yhdistetty laskenta
Hallinnan noudattaminen Käytännöt, joita käytetään datan siirtämisen jälkeen Kyselyn suorituksen aikana pakotetut käytännöt
Yksityisyyden malli Riippuu vahvasti sopimusten ja menettelyjen valvonnasta Tehostetaan teknisesti suorituksen aikaisilla ohjaimilla ja aggregoinnin kynnysarvoilla
Viive Suuri viive syöttämisen ja synkronoinnin takia Matalampi viive, yhdistetyt kyselyt lähes reaaliajassa
Kustannusten rakenne Korkeammat tallennus-, siirto- ja kopiointikustannukset Identtisyyden vähentäminen, ascompute tapahtuu missä data sijaitsee
Yhteensopivuuden monimutkaisuus Monimutkaiset lakisääteiset sopimukset, joita aiheuttaa rajat ylittävä datan siirto Yksinkertaistettu vaatimustenmukaisuus, koska data ei poistu lähdekentästä
Skaalattavuus Skaalaaminen vaatii enemmän tallennustilaa ja datan replikointia Skaalaa hajautetun laskennan läpi identtistä dataa käyttämättä
Säädetty toimiala soveltuu Usein epäkäytännöllinen säilöönotto- ja asumisongelmien vuoksi Soveltuu paremmin suvereniteetin, suostumuksen ja lakisääteisten rajoitusten kanssa

Salesforce Data 360 on esimerkki tästä yhdistämismallista. Julkaisijat ja mainostajat voivat tehdä yhteistyötä ja suorittaa analyysejä pilvialustojen välillä ilman, että raakadata poistuu koskaan sovellusalustan suojausrajoista. Tietojen säilyttäminen säilyy, riski vähenee ja yhteistyö on nopeampaa ja helpompi skaalata.

Tämä siirto jaetusta datasta jaettuun laskentaan määrittää Enterprise-yhteistyön Trustin uudelleen. Puhtaat huoneet eivät ole enää kohteita, joihin tietoja säilytetään, vaan järjestelmiä, jotka hallitsevat havaintojen turvallista tuotantotapaa.

Yritystason datan puhdistustilan täytyy täyttää pieni joukko ei-neuvoteltavissa olevia vaatimuksia, jotta se toimisi ydinarkkitehtuurin ominaisuutena.

Datan puhdistettavien huoneiden perusedellytys on nollakopioarkkitehtuuri. Perinteinen datayhteistyö perustuu ETL-putkeihin, jotka kopioivat dataa jaettuihin ympäristöihin. Tämä parantaa viiveitä, kustannuksia, tietoturvaa ja lakisääteisiä riskejä ja luo samalla useita ei-hallittuja kopioita luottamuksellisista tiedoista.

Tämä ongelma ratkaistaan nykyaikaisella datan puhdistustilalla. Data säilyy sen alkuperäisessä tietuejärjestelmässä riippumatta siitä, onko se pilvitallennus, käyttöympäristö vai SaaS-sovellus. Clean Room käyttää yhdistettyjä kyselyitä näistä jaetuista lähteistä ja palauttaa vain hyväksyttyjä ja yksityisyyttä suojaavia tuloksia.

Nollakopioidut puhtaat huoneet vähentävät hyökkäyspinta-alaa, säilyttävät datan sijainnin ja omistajuuden sekä vastaavat luonnollisesti datan tekstiä ja yhdistettyjen tietojen arkkitehtuurin periaatteita.

Moderni datastrategia perustuu kykyyn tehdä yhteistyötä siirtämättä dataa. Salesforce Data 360 tarjoaa joustavan kehyksen, joka yhdistää yrityksesi globaaliin datan ekosysteemiin kahden ensisijaisen mallin kautta:

Natiivi Salesforce to Salesforce -yhteys : Tässä mallissa yhteistyö tapahtuu suoraan kahden Salesforce-asiakkaan välillä. Jaettu metadatakerros sallii tarjoajien ja kuluttajien muodostaa yhteyden välittömästi yksinkertaisen kokoonpanon avulla. Tämä sallii tiimien luoda yhteisiä havaintoja ilman viiveitä tai riskiä datan replikoinnista, mikä varmistaa, että tiedot pysyvät turvassa alkuperäisessä sijainnissaan.

Ulkoinen Salesforce to Cloud -integraatio (AWS ja Snowflake): Tässä mallissa yhteistyö tapahtuu Salesforcen ja ulkoisten pilviympäristöjen välillä. Nollan kopion liittäminen sallii organisaatioiden yhdistää eri infrastruktuureja ilman datan siirron kustannuksia tai riskejä. Tämä sallii tiimien ratkaista identiteetin hajanaisuuden ja laajentaa vaikutusaluetta säilyttämällä dataa sen residenssin pilvipalvelimessa, ylläpitämällä keskitetyn hallinnan ja poistamalla poistumismaksut.

Nollakopiot ja yhdistetyt arkkitehtuurit estävät raakadatan siirtämisen tai kopioinnin, mutta ne eivät itse takaa yksityisyyttä. Näissä malleissa ensisijainen riski siirtyy datan tallennuksesta datan laskentaan.

Luottamukselliset tiedot voivat edelleen vuotaa analyysituotteiden läpi, vaikka vain aggregoituja tuloksia palautettaisiin. Yleisimpiä hyökkäysten vektoreita ovat toistuvat tai päällekkäiset kyselyt (hyökkäysten erottaminen toisistaan), hyvin pienien väestöryhmien analyysi ja johtopäätös käyttämällä ulkoista Knowledgea. Tästä syystä yksityisyyden huolenaiheet siirtyvät käyttöoikeuksien hallinnan ulkopuolelle kyselyiden suorituksen dynaamiseen vaatimukseen.

Enterprise Data -tyyppisten huoneiden täytyy käsitellä Privacy-Enhancing Technologies (PET) -ominaisuutta pakollisina järjestelmätason asetuksina, eikä valinnaisina analyysitoimintoina tai käytännön ohjeina. Arkkitehtuurisesta näkökulmasta tämä tarkoittaa, että:

  • Tietoturvaa noudattaa sovellusalusta, ei analyytikot
  • Ohjaimet ovat yhdenmukaisia käyttäjien, kumppanien ja työkuormien välillä
  • Yksityisyyden suojaukset ovat deterministisiä, toistettavissa ja tarkastettavissa
  • Järjestelmä määrittää, mitkä laskutoimet ovat sallittuja, miten tulokset muodostuvat ja milloin kyselyt täytyy estää
PET-ydintoiminnot

Erillinen yksityisyys: Eriarvoinen yksityisyys (DP) tarjoaa matemaattisen varmuuden siitä, että yksittäisten henkilöiden läsnäolo tai poissaolo ei vaikuta kyselyn tuloksiin merkittävästi. Käytännössä tämä tarkoittaa, että siistihuone syöttää automaattisesti kalibroidun tilastollisen melun tuloksiin ja seuraa määritettyä tietoturvasopimusta jokaiselle datajoukolle. Jokainen kysely kuluttaa osan tästä budjetista, ja kun se on tyhjennetty, muut kyselyt estetään. Arkkitehtien DP-arvo perustuu todennettavuuteen. Yksityisyysriskit on rajoitettu määrällisesti, mikä mahdollistaa puolustettavan vaatimustenmukaisuuden ja vähentää riippuvuutta subjektiivisten käytäntöjen tulkinnasta.

Suojatun tunnisteen tasaus: Monet yhteistyöskenaariot vaativat päällekkäisten datajoukkojen, kuten jaettujen asiakkaiden tai tilien, tunnistamista. Raakkatunnusten paljastaminen rikkoisi datan minimointiperiaatteita. Sen sijaan tyhjän tilan arkkitehtuuri perustuu deterministiseen tiivistämiseen tai tokenisointiin, joka suoritetaan tyhjän tilan rajoissa. Vertailut tapahtuvat paljastamatta raakoja tunnisteita kenellekään osapuolelle, mikä mahdollistaa yhdistämiseen perustuvan toimintatavan ilman tietojen paljastamista.

Aggregoinnin kynnysarvot ja tulosten vähentäminen: Jopa täysin anonyymit tulokset voivat vaarantua, kun tulokset saadaan hyvin pienistä populaatioista. Tämän estämiseksi yritystietojen puhdistustilan täytyy noudattaa aggregoinnin vähimmäisrajoituksia ja estää automaattisesti tulokset, jotka ovat niiden alapuolella. Näiden kynnysarvojen täytyy olla ylittämättömiä, jotta ne suojautuvat jatkuvasti pienien segmenttien vuotoilta.

Ilman Privacy-Enhancing Technologies (PET) -ratkaisua suorituskerroksessa, Data Clean -huoneista voi tulla Trust perustuvia ympäristöjä, jotka perustuvat ihmisten harkintaan ja sopimusten sopimuksiin. Upottamalla pet-objektit suoraan sovellusalustaan yksityisyys muuttuu rakenteelliseksi ominaisuudeksi, eikä toimenpiteelliseksi. Tämä mahdollistaa yhteistyön laajentamisen tiimeille ja kumppaneille neuvottelematta uudelleen Trustista, kun taas sääntelyviranomaiset ja riskitiimit voivat arvioida takuita käyttämällä objektiivisia, matemaattisia mittoja subjektiivisten käytäntöjen sijaan.

Yritysarkkitehtien PET-tiedostot ovat kriittinen mekanismi, joka parantaa datan puhdistustilaa turvallisesta sandboxista luotettavaksi yhteistyökehykseksi, joka voi tukea säänneltyjä, monen osapuolen analyysejä ja tekoälyn työkuormia yrityksen laajuisesti.

Monen osapuolen yhteistyössä Trust säilytetään näkyvyyden avulla. Yritystason datan puhdistustilan täytyy tarjota "pöytäkirja" osallistujien ja datan välisestä vuorovaikutuksesta.

Kyselylokit: Jokainen SQL-suoritus kirjataan lokiin, keräämällä pyynnön tekijän henkilöllisyyden, aikaleiman ja käytetyn kyselylogiikan.

Käytäntöjen noudattamisen lokit: Järjestelmän ei tarvitse tallentaa vain kyselyitä, vaan tietoturvakäytäntöjä (esimerkiksi aggregoinnin kynnysarvoja tai Differential Privacy) tuloksiin.

Zero-Tamper-tietueet: Datan puhdistustila käyttää muuttumatonta kirjausketjua (erillinen datamalliobjekti) varmistaakseen, ettei yhtään osallistujaa voi muuttaa tai poistaa lokeja, mikä tarjoaa sääntelyviranomaisille yhden version totuudesta.

Salesforce sallii organisaatioiden analysoida ja työstää dataa yhdessä jakamatta koskaan raakadataa. Salesforce Data 360 perustuu nollakopioituun, yhdistettyyn arkkitehtuuriin, jossa yksityisyyttä, suostumuksia ja hallintaa noudatetaan suorituksen yhteydessä. Se varmistaa, että havainnot ovat turvallisia, yhteensopivia ja täysin interaktiivisia. Salesforce Data 360 muuntaa puhdistetut tilat suoraan yritystietojen elinkaariin ja tekee niche-analyysityökaluista skaalattavia ja luotettavia infrastruktuureja tekoälyyn perustuvaa ja monen osapuolen yhteistyötä varten.

Data 360 clean room -arkkitehtuuri

Infrastruktuuritasolla Salesforce Data 360 toimii Hyperforcessa, joka on Salesforcen pilvipohjainen runtime, joka poimii hyperscaler-resurssit (AWS, Azure, GCP) yhtenäisen hallintasuunnitelman takana. Tämä arkkitehtuuri sallii datan pysyvän alueen sisällä suvereniteettia ja asuinpaikkoja koskevien vaatimusten täyttämiseksi, samalla kun se sallii hallittujen puhtaiden huoneiden toimintojen käytön maailmanlaajuisesti.

Kriittisesti ottaen tämä perusta mahdollistaa pilvipohjaisen puhtaiden huoneiden yhteistyön, mukaan lukien natiivisen yhteensopivuuden AWS Clean Rooms -palvelun kanssa. Käyttämällä Data 360:a orkestrointi- ja hallintakerroksena, yritykset voivat tehdä yhteistyötä AWS:llä suoraan toimivien kumppanien kanssa siirtämättä dataa Salesforcen hallittuun tallennustilaan. Kyselyt siirretään lähteeseen, yksityisyyssääntöjä noudatetaan johdonmukaisesti ja vain vaatimustenmukaiset, aggregoidut tulokset vaihdetaan sovellusalustojen välillä.

Vaatimustenmukaisuutta ja Trustia noudatetaan infrastruktuurin ja suorituksen rajoissa sen sijaan, että sovelluskerroksessa sovellettaisiin uudelleen – mikä tarjoaa kestävän pohjan laajoille monipalveluiden ja osapuolten yhteistyölle.

Data 360 toteuttaa jäljitettävän, kokonaisvaltaisen dataputken varmistaakseen, että tyhjän tilan toiminnot suoritetaan yhdenmukaistetun, hallittavan ja identiteettitietoisen datan päälle raakatulosten sijaan. Avainvaiheisiin sisältyy:

  • Yhdistä: Datan tuonti ja virtualisointi käyttövalmiiden liittimien, API-rajapintojen, SDK-pakettien, MuleSoftin tai nollakopioliittimien kautta
  • Pysy: Raakadata säilytetään natiivimuodoissa (Parquet/Iceberg)
  • Harmonisoi: Kartoitus kanonisiin datamalliobjekteihin (DMO) yhdenmukaisille liitoille
  • Yhtenäistä: Identiteetin vahvistus luo Kultaiset tietueet
  • Hanki havaintoja: Lasketut havainnot laskevat aggregoituja tilastoja hallitun rajoituksen sisällä
  • :Toiminto**** Hallitut tulokset kulkevat Salesforce-organisaatioihin, markkinointialustoihin, mainosverkostoihin, ulkoisiin datalustoihin tai muihin puhtaisiin tiloihin, mikä sulkee havaintojen ja toimintojen silmukan

Tämä myyntiputki varmistaa, että puhtaat tilat käyttävät yritystason dataa, ei ad hoc -noutoja.

Toisin kuin yksittäiset datan puhdistustilan alustat, jotka vaativat erillisen provisioinnin ja SQL-kehityksen, Salesforce-puhdistustilat on upotettu Data 360 -palveluun. Tämä mahdollistaa DMO-organisaatioiden, henkilöllisyyssääntöjen, suostumusmallien ja hallintakäytäntöjen uudelleenkäytön, jolloin identtiset suojauskerrokset poistetaan. Salesforcen malliin perustuva tyhjän huoneen malli on tärkeä kiihdytin, joka käyttää:

  • Out-of-the-box-malleja, jotka tukevat yleisimpiä yhteistyökuvioita, kuten kohdeyleisöjen päällekkäisyyksiä, vähentämistä, vaikutusaluetta ja nostamista.
  • Mukautetut mallit, joiden avulla arkkitehdit ja edistyneet käyttäjät voivat määrittää uudelleenkäytettävää analyyttistä logiikkaa toimialakohtaisten tai kumppanien tarpeiden mukaisesti – paljastamatta raakadataa tai käytäntöjen monimutkaisuutta. Tämä lähestymistapa standardoi yhteistyön samalla, kun se tarjoaa joustavuutta, ja sallii puhtaiden huoneiden skaalautumisen toistuvana yritysominaisuutena, eikä kertaluonteisena analyysiprojektina.

Data 360 käsittelee perinteisten puhtaiden huoneiden yleisen virhetilan: Aktivointihaaran. Sen Kultainen polku -kehys varmistaa, että puhtaassa huoneessa luotuihin havaintoihin voidaan reagoida välittömästi viemättä raakadataa.

  • Määritykset ja Discovery: Kumppanit jakavat skeemojen metadataa ja hyödyntävät malleja arvioidakseen toteutettavuutta ennen sopimusten viimeistelyä.
  • Analyysi: Käyttövalmiit ja mukautetut mallit edistävät päällekkäisyyden analyysiä, estämistä, ulkoasun mallinnusta ja nostojen mittausta, jotka kaikki suoritetaan hallitun rajoituksen sisällä.
  • Aktivointi: Hyväksytyt segmentit siirretään suoraan Marketing Cloudiin, mainosalustoihin tai kumppanijärjestelmiin, ja vain aggregoituja ja yhteensopivia tuloksia jaetaan.

Malleista tulee arvostettuja suorituspolkuja, jotta yhteistyö tapahtuu ennustetusti analyysistä aktivointiin.

Salesforce Data 360 Clean Room -työtilan käyttöönotto ei ole vain määritystoiminto — se on kurinalainen arkkitehtuurityönkulku, joka kattaa datan valmiuden, hallintasuunnitelman, suojatun yhteyden ja toimintavalvonnan.

Ennen kuin käsittelet dataa tai kokoonpanoa, arkkitehtien täytyy määrittää selkeästi:

  • Mihin kysymykseen yritämme vastata?
  • Mikä on odotettu lopputulos? (esimerkiksi päällekkäinen analyysi, nostomittari, estäminen, petosten havaitseminen)
  • Mikä aggregointitaso vaaditaan?
  • Mitä sääntely- tai sopimusrajoituksia sovelletaan?
  • Mikä aktivointipolku kuluttaa tulokset?

Työkumppanin tavoitteen ymmärtäminen määrittää kaiken seuraavan – liitosavaimet, identiteettisäännöt, hallintakynnysarvot ja kustannusten mallinnus. Clean Rooms on tarkoituksenmukaisesti rakennettuja ympäristöjä. Hey tulisi suunnitella määritetyn analyysitavoitteen ympärille, eikä yleisen datan näyttämiseen.

Ennen kuin yhteistyö voidaan aloittaa, yritystiedot täytyy valmistella rakenteellisesti ja semanttisesti. Puhtaat huoneet vahvistavat sen perustana olevan datan vahvuuksia ja heikkouksia. Roskakori sisään, roskakori ulos on vieläkin tärkeämpää tässä.

Syöte: Yhdistä Data 360:ään lähdesysteemit, kuten Salesforce CRM, Marketing Cloud, AWS S3 ja Google Cloud Storage. Käytä nollakopioliitintä (esimerkiksi Snowflake) välttyäksesi tarpeettomalta siirtämiseltä tai datan kopioinnilta aina, kun se on mahdollista.

Semanttinen kartoitus: Kartoita datavirrat Customer 360 -datamalliin. Standardoi avainkenttiä, kuten puhelinnumerot (formaatti E.164), maa-/osavaltion koodit (ISO-standardit) ja sähköpostiosoitteet. Epätasapaino (esimerkiksi yksi osapuoli käyttää sanaa ”CA” ja toinen sanaa ”California”) voi epäonnistua liittämisessä ja heikentää täsmäyssuhteita.

Identiteetin vahvistus: Määritä deterministisiä (tarkat vastaavuudet) ja todennäköisyyksiin perustuvia (epätarkkoja vastaavuuksia) sääntöjä yhtenäistetyn yksityishenkilön (kultainen tietue) luomiseksi. Tämä yhtenäistetty entiteetti on puhtaan huoneen täsmäyksen pinta. Identiteetin ratkaisemisen laatu vaikuttaa suoraan yhteistyöarvoon. Täsmäysten tarkkuus parantaa päällekkäisyyksiä, analyyttistä luottamusta ja vähentää epätosi-negatiivisia arvoja.

Kun data on yhdenmukaistettu, itse tyhjä tila täytyy provisioida määrittääkseen yhteistyön rajat.

Lisenssin vahvistus: Varmista, että kaikilla osallistuvilla organisaatioilla on tarvittavat Data 360- ja tyhjän tilan oikeutukset.

Datan tilan rajaaminen: Tyhjät tilat -objektit täytyy rajata tiettyyn datatilaan. Vain datatilaan kartoitetut objektit näytetään tyhjässä tilassa. Tämä varmistaa, että yhteistyö on loogisesti erillään ilman, että sinun täytyisi luoda uutta tietotilaa vain puhtaille huoneille.

Määritä hallintasäännöt: Laadi käytäntöjä deklaratiivisesti ennen kyselyiden suorittamista:

  • Aggregoinnin kynnysarvot: esimerkiksi vähintään 100 tietuetta per tulos
  • Liitä avaimia: esimerkiksi Email_Hash_SHA256
  • Sallitut toiminnot: vain aggregaattifunktiot, kuten COUNT, SUM, AVG
  • Yksityiset rajoitukset: estä rivitason viennit (SELECT *)

Hallintasääntöjä noudatetaan suorituksen aikana, mikä tekee yksityisyydestä ja vaatimustenmukaisuudesta järjestelmätason ominaisuuksia toimenpideohjeiden sijaan.

Puhtaat huoneet kattavat usein organisaation ja sovellusalustan rajat. Yhteyden täytyy olla selkeä ja tarkasti hallittava.

Tilin linkittäminen:

  • Salesforcesta Salesforceen: Käytä Data Cloud Onea tai hyväksyttyjä organisaatioiden välisiä jakomekanismeja.
  • Monimuotoiset skenaariot: Vahvista alueen kohdistus ja sijainti ennen kuin kyselyt otetaan käyttöön.

Todennus ja valtuutus: Määritä OAuth-käyttöoikeus erillisille integraatiokäyttäjille pienimmän käyttöoikeuden periaatteella — rajoita käyttöoikeudet vain tarvittaviin datatiloihin ja vältä hallintaoikeuksia. Tietoturvavirheet johtuvat usein integrointikäyttäjistä, joilla on liikaa käyttöoikeuksia, eikä salauksen tai sovellusalustan hallinnan heikkouksista.

Kun olet käytössä, keskitä työvuorot toiminnan valvontaan, kyselyiden laatuun ja kustannusten hallintaan.

Kyselyn suoritus: Analyytikot tai työnkulut suorittavat päällekkäisiä analyysejä ja aggregointeja Lasketut havainnot -ominaisuuden tai hyväksyttyjen SQL-rajapintojen kautta. Kaikki kyselyt noudattavat aggregoinnin kynnysarvoja ja yksityisyysasetuksia automaattisesti.

Tarkastus ja jäljitettävyys : Salesforce Data 360 -puhdistetut tilat tarjoavat tilintarkastuspolkuja datamalliobjektin (DMO) muodossa. Tämä kaappaa kyselyn toimintoja koskevan metadatan, mukaan lukien kyselyn suorittajan, suoritusajan ja käytäntöjen. Audit DMO sallii vaatimustenmukaisuuden raportoinnin, hallinnan vahvistuksen ja oikeuslääketieteen jäljitettävyyden — mikä varmistaa, että yhteistyö on sekä yksityisyyden suojaavaa että tarkastettavissa.

Kulutusjoukko: Data Cloud käyttää kulutukseen perustuvaa luottomallia. Tärkeimpiin tekijöihin sisältyy:

  • Käsitellyt rivit (esimerkiksi 1 M rivi = perustason luottoyksikkö)
  • Kyselyn monimutkaisuus
  • Identiteetin vahvistustoiminnot (korkeampi kerroin)
  • Erän syöttö (alhaisempi kerroin)

Digital Wallet ja hälytykset: Käytä Digital Walletia seurataksesi reaaliaikaista kulutusta ja määrittääksesi hälytyksiä 50 %, 75 % ja 90 % kynnysarvoille. Korjaa pikavalinnat tiettyihin työkuormiin välttyäksesi odottamattomilta kustannuksilta. Huomaa, että nollakopiointi ei poista laskentakustannuksia. Kun fyysinen identtisyys poistetaan, suoritus tapahtuu lähdejärjestelmässä. Arkkitehtien täytyy hallita kyselykuvioita, liitosvalmiutta ja suorituskykyä hallitakseen kustannuksia ja suorituskykyä.

Modernissa yrityksessä Trust ei ole kiinnitetty datan puhdistustilaan. Se on arkkitehtoninen lopputulos. Salesforce Data 360 noudattaa hallintaa, tietoturvaa ja vaatimustenmukaisuutta jatkuvasti ja automaattisesti siirtämällä puhtaat tilat käytäntöihin perustuvista ympäristöistä sovellusalustan hallitsemiin järjestelmiin. Suorituksen aikaiset ohjaimet (lukitut identiteetit, kirjausketjut ja erotettu yksityisyys) ovat yhdenmukaisia riippumatta siitä, tapahtuiko yhteistyö Salesforcessa, kumppaneiden välillä vai pilvipalveluissa.

Arkkitehtien tärkein työvuoro on, että Trust noudatetaan suorituksen aikana, eikä sitä oleteta etukäteen. Salesforce Data 360 saavuttaa tämän useilla sovellusalustan ydintehtävillä:

  • Lukittu identiteetti: Kumppanien käyttöoikeudet liittyvät salaustietoisesti Salesforce-organisaation vahvistettuihin henkilöllisyyksiin, mikä estää huijauksen tai valtuuttamattoman osallistumisen.
  • Tarkastuspolut: Jokainen kysely, liitos, segmentin päällekkäisyys ja aktivointi kirjataan lokiin, jotta ne ovat täysin tarkastettavissa ja säännösten mukaisia.
  • Erillinen yksityisyys: Rivitason tarkastus on rakenteellisesti mahdotonta. Tulokset aggregoidaan ja rajoitetaan tilastollisesti. Työkumppanit näkevät vain yksityisyyttä suojaavia tuloksia, kuten saavutustilastoja tai korotusprosentteja, eivätkä koskaan yksittäisiä transaktioita tai identiteettejä. Nämä ohjaimet korvaavat sopimusluottamuksen matemaattisilla takuilla ja sovellusalustan tason täytäntöönpanolla, mikä vähentää toiminta- ja oikeudellisia riskejä.

Kun tekoälyagentit vuorovaikuttavat yhä enemmän Clean Room -datan kanssa, Salesforce tuo Einstein Trust Layer -kerroksen käyttöön. Se toimii arkkitehtuurin välisenä lukuna luottamuksellisten yritystietojen ja ulkoisten LLM-ohjelmien välillä. Tämä varmistaa, että puhtaiden tilojen havainnot voivat turvallisesti edistää tekoälyn perustuvaa päätöksentekoa paljastamatta sen perustana olevaa dataa.

Tärkeimmät ominaisuudet:

  • Zero-datan säilyttäminen: LLM-ohjelmiin lähetetyt tiedot ovat väliaikaisia. Mallin tarjoajat eivät voi tallentaa kehotteita tai vastauksia koulutusta varten.
  • Toksisen kielen havaitseminen ja henkilötietojen peittäminen: Input- ja output-arvot skannataan automaattisesti ja henkilötiedot peitetään Data 360:ssa määritettyjen datan peittokäytäntöjen mukaisesti.

Datatilat tarjoavat loogisen erillisyyden organisaatiossa, ja niiden tulisi noudattaa sääntely-, maantieteellisiä ja kumppanirajoituksia, kuten:

  • EU:n tietotila
  • Pohjois-Amerikan datatila

Vain datatilaan kohdistetut datajoukot näytetään sen puhtaissa tiloissa, mikä estää vahingossa tapahtuvan rajat ylittävän altistumisen. Käyttöoikeusjoukot tarjoavat hienosäädön siitä, kuka voi luoda tai hallita puhtaita huoneita, suorittaa kyselyitä tai aktivoida segmenttejä. Datan tunnistus -käyttöoikeudet soveltavat datamalliobjektien kenttätason rajoituksia — esimerkiksi markkinoijat saattavat nähdä segmenttien nimet ja kohdeyleisön koon, mutta eivät tulojen tai terveyden osoittimia. Tietoturvaa noudatetaan semanttisella tasolla, mikä mahdollistaa turvallisen itsepalvelun yrityskäyttäjille ilman jatkuvaa IT-valvontaa.

Suostumusten signaalit leviävät automaattisesti Data 360:n kautta tyhjään tilaan. Suostumuksen kumoavat käyttäjät jätetään oletusarvoisesti pois analyysistä ja aktivoinnista — mikä varmistaa, että vaatimustenmukaisuus noudatetaan järjestelmän toimesta eikä manuaalisesti.

Salesforce Data 360 käsittelee hallintaa, tietoturvaa ja vaatimustenmukaisuutta ensiluokkaisina arkkitehtuuriperinteinä, ei valinnaisina lisäosina. Yhdistämällä suorituksen aikaisen auditoinnin, lukittujen identiteettien, erottuvan yksityisyyden, datatilojen, suostumusten tietoisen identiteetin ratkaisun ja Einstein Trust Layer -kerroksen, yritykset voivat laajentaa puhtaiden tilojen yhteistyötä kumppaneiden, usean pilvipalvelun järjestelmien ja tekoälyn perustuvien työkuormitusten välillä – kaikki ilman, että se vaarantaa Trustin, yksityisyyden tai säännösten noudattamisen.

Arkkitehtien täytyy käsitellä datan puhdistustiloja ydinrakenteellisena infrastruktuurina, eikä erillisinä analyysityökaluina, jotta he voivat siepata datan puhdistustiloista kaiken hyödyn. Seuraavat prioriteetit määrittävät pragmaattisen ja skaalattavan polun eteenpäin: Tee yhteistyöstä ensimmäisen luokan arkkitehtoninen huolenaihe : Ulkoinen datayhteistyö tulisi suunnitella samalla tarkkuudella kuin sisäinen integraatio. Puhtaita huoneita tulisi upottaa yrityksen viitearkkitehtuureihin datalustojen, integraatiokerrosten ja tekoälysjärjestelmien rinnalle – niitä ei tulisi ottaa käyttöön ad hoc -laajennuksina. Kun yhteentoimivuus laajenee (esimerkiksi Data 360:n puhtaiden huoneiden integrointi AWS:n puhtaisiin huoneisiin ja tulevan yhteensopivuuden kanssa puhtaiden huoneiden kanssa), arkkitehtien täytyy suunnitella yhteistyökuvioita, jotka ennustavat usean sovellusalustan ekosysteemejä yhden myyjän silojen sijaan.

Sisällön suunnittelu oletusarvoisesti lähteessä

Datan virtavuuden suunnittelu : ​Sen sijaan, että käytettäisiin oletusarvoisesti raskaita ETL-tiedostoja ja keskitettyä replikointia, arkkitehtien tulisi ensin harkita yhdistämistä ja nollakopiokäyttöoikeuksia. Laskentojen siirtäminen dataan (tarvittaessa) vähentää tarpeettomia päällekkäisyyksiä, vähentää kustannuksia ja säilyttää totuuden lähteen eheyden. Yhdistä vs. kopioi -vaihtoehdon tulisi olla tietoinen arkkitehtoninen päätös, ei peritty tapa.

Sulje havaintoihin perustuva aukko : Analyysissä pysähtyvät puhdistustilat eivät tarjoa liiketoiminta-arvoa. Arkkitehtuurien täytyy yhdistää tyhjän tilan tulokset automaattisesti aktivointijärjestelmiin ja tekoälyn työnkulkuihin. Palautussilmukan, suorituskyvyn mittauksen ja myöhemmän suorituksen täytyy olla suunniteltu alusta alkaen.

Agenttiyritykselle valmistautuminen : Kun tekoälyagentit käyttävät yhä enemmän yritystietoja, puhtaat huoneet toimivat ohjattuina suoritusympäristöinä, joissa agentit voivat toimia paljastamatta raakadataa. Arkkitehdit, jotka sovittavat puhdistustilan strategian tekoälyn hallinta- ja Trust, sopivat parhaiten tähän seuraavaan vaiheeseen.

Modernit datan puhdistustilat edustavat perustavaa laatua olevaa muutosta yritystietojen arkkitehtuurissa. Ne ratkaisevat datapalveluiden ja yksityisyyden välisen pitkäaikaisen jännityksen ottamalla käyttöön yhteistyö ilman datan altistumista.

Arkkitehtuurit, kuten Salesforce Data 360, osoittavat, että tämä kompromissi ei ole joko tai -asetus. Kun datan tallennustila irrotetaan aktivoinnista nollakopiokuvioiden avulla ja upotetaan yksityisyyttä parantavia teknologioita suoraan suoritukseen, yritykset voivat tehdä yhteistyötä arvokkaiden analyysien parissa luopumatta datan hallinnasta. Yksityisyys siirtyy sopimusvelvoitteesta arkkitehtotakuun.

Tärkeintä on, että puhtaat tilat muuntavat dataa staattisesta, erillisestä resurssista hallittavaan ja interaktiiviseen resurssiin. Kun havainnot on yhdistetty oletusarvoisesti aktivointi- ja tekoälykerroksiin, ne eivät enää pysähdy mittaristoissa. Ne kulkevat suoraan päätöksiin, kampanjoihin ja itsenäisiin järjestelmiin — mikä sulkee silmukan datan, toiminnon ja lopputulosten välillä yritystasolla.

Yugandhar Bora on Salesforcen ohjelmistojen suunnittelu-arkkitehti, joka on erikoistunut datan arkkitehtuuriin Data and Intelligence -sovellusalustalla. Hän johtaa Enterprise Architecture Review Board (EARB) -aloitteita, jotka keskittyvät datan hallintaan ja yhtenäistettyihin datamalleihin, ja edistää samalla automatisoitujen sovellusalustan provisiointiratkaisujen kehittämistä.

Birendra Kumar Singh on Salesforcen teknisen henkilöstön pääjäsen, joka on erikoistunut sovellusalustan ja datan arkkitehtuuriin Data 360:ssa. Hän on aktivointialustan ydinjäsen ja johtaa Clean Room -aloitetta, joka keskittyy datan puhdistustilan infrastruktuurin tarjoamiseen Data 360 -asiakkaille.

Priyanka Kshirsagar on Salesforcen johtava tuotepäällikkö, joka johtaa Data 360 Clean Roomsia — kykyä, jonka hän rakensi alusta alkaen salliakseen yritysasiakkaiden tehdä yhteistyötä ensimmäisen osapuolen tietojen parissa yksityisyyden suojaamisessa. Hän edustaa agenteille tarkoitetun tekoälyn ja ML:n tarjoamien käyttötapausten visiota, mukaan lukien ulkoasun mallinnus ja identiteetin rikastaminen puhtaissa huoneissa, ja on ottanut tuotteen käyttöön yleisen saatavuuden ja tason 1 Dreamforce-julkaisun kautta.