Esse texto foi traduzido usando o sistema de tradução automatizado do Salesforce. Pegue nossa enquisa para fornecer feedback sobre esse conteúdo e diga-nos o que você gostaria de ver em seguida.
Note
Visão geral
A arquitetura de dados corporativa está em um ponto de inflexão. As organizações devem oferecer suporte simultâneo a sistemas de IA em tempo real, cumprir normas de privacidade cada vez mais rígidas e colaborar com parceiros externos que não podem compartilhar dados brutos. Esses requisitos estão reformulando fundamentalmente o modo como as plataformas de dados são projetadas.
Arquiteturas tradicionais criadas com base em pipelines ETL e armazéns de dados centralizados têm dificuldade para atender a essas demandas. Replicar dados entre sistemas aumenta a latência, o custo e a complexidade da governança. Cada cópia se torna uma nova obrigação de conformidade, complicando o gerenciamento de consentimento, as solicitações de exclusão e a imposição de políticas em ambientes distribuídos.
Para lidar com esses desafios, o setor está mudando para modelos de colaboração impostos por política de cópia zero. As salas de atualização de dados emergiram como um recurso arquitetônico importante, permitindo que várias organizações analisem sinais compartilhados sem expor nem transferir dados brutos. Em vez de mover dados para ambientes centralizados, o cálculo é executado dentro do domínio governado de cada participante e apenas resultados seguros de privacidade são retornados.
Essa mudança arquitetônica está cada vez mais visível entre setores. Por exemplo, a aquisição do InfoSum pela WPP, que é a maior empresa em marketing e publicidade, reflete a crescente importância de salas limpas como infraestrutura para colaboração segura de privacidade. As instituições financeiras as usam para detectar fraudes entre instituições, os varejistas para coordenar promoções com marcas de consumidores e as organizações de saúde para analisar coortes de pacientes entre provedores sem compartilhar registros confidenciais subjacentes.
O Salesforce Data 360 operacionalize esse modelo por meio de uma arquitetura de cópia zero criada no Hyperforce. Os dados permanecem em seus sistemas de origem enquanto as consultas federadas aplicam políticas de privacidade, consentimento e residência em tempo de execução. Essa abordagem habilita percepções em tempo real, colaboração entre nuvens e tomada de decisão conduzida por IA sem expandir a superfície de risco criada pela replicação de dados.
Este documento examina como as salas de atualização de dados funcionam como um padrão arquitetônico fundamental para a empresa moderna, apoiando a inovação de IA, a conformidade regulatória e a colaboração entre domínios segura simultaneamente e em escala.
Por que limpar quartos agora é importante
Para entender por que as salas de atualização de dados são necessárias, os arquitetos corporativos devem primeiro confrontar a falha estrutural de modelos de integração legados. O setor está passando por uma transição decisiva de repositórios de dados monolíticos e centralizados para ecossistemas federados e descentralizados. Aqui, os dados são acessados, controlados e calculados no lugar em vez de movidos fisicamente. Esse turno não é incremental. É uma resposta direta às pressões sistêmicas em torno de escala, privacidade e agilidade que as arquiteturas tradicionais não podem mais absorver.
Redefinir integrações de dados no Modern Enterprise
Por anos, as empresas dependem de arquiteturas conduzidas por ETL que copiam dados de sistemas CRM, ERP e digitais para armazéns centralizados para relatórios e análise. Essa abordagem provou ser eficaz para análise histórica, mas foi projetada para um mundo mais lento e orientado a lotes.
À medida que as interações digitais aceleravam e os sistemas conduzidos por IA surgiam, as limitações desse modelo ficavam mais óbvias. Os pipelines de ETL são intrinsecamente assíncronos, o que significa que as percepções costumam chegar horas ou dias após os eventos ocorrerem. Essa latência está cada vez mais incompatível com casos de uso modernos, como personalização em tempo real, tomada de decisão adaptativa e sistemas de IA que exigem dados contextuais imediatos.
A replicação também introduz uma maior complexidade de governança e segurança. Cada nova cópia de dados requer políticas, monitoramento e controles de conformidade adicionais. Em ambientes regulamentados, estruturas como o Regulamento geral de proteção de dados (GDPR) exigem que as organizações gerenciem a exclusão, o consentimento e as restrições de uso em todos os locais em que os dados existem, um desafio operacional quando os conjuntos de dados são duplicados em vários sistemas.
Em escala, essa duplicação combina custo e sobrecarga operacional. As organizações pagam repetidamente por ingestão, armazenamento, segurança e processamento em várias plataformas enquanto o valor marginal de cópias adicionais diminui.
Como resultado, as arquiteturas de dados modernas estão mudando para modelos que minimizam a movimentação de dados e impõem a governança diretamente na origem. A integração de cópia zero e o acesso a dados federados permitem que as organizações gerem percepções sem replicar conjuntos de dados confidenciais, fornecendo uma abordagem mais escalonável, segura e alinhada à política para a colaboração de dados corporativos.
A emergência da matriz de dados e da matriz de dados
Em resposta a essas pressões, o setor se agrupou em torno de dois paradigmas arquitetônicos complementares: Rede de dados e tecido de dados. Juntos, eles representam uma mudança de controle centralizado para arquiteturas de dados federadas sensíveis ao domínio.
A Rede de dados descentra a propriedade dos dados para equipes alinhadas ao domínio, como Sales, Marketing ou Supply Chain. Cada domínio trata seus dados como um produto, com contratos, padrões de qualidade e objetivos de nível de serviço claramente definidos. Esse modelo melhora a responsabilidade e o alinhamento dos negócios, mas, em escala corporativa, introduz novos desafios em relação à coordenação, à interoperabilidade e à governança consistente entre domínios.
O Data Fabric lida com esses desafios fornecendo a camada conectiva que associa domínios descentralizados em um sistema coerente. Ele fornece metadados compartilhados, semântica comum, imposição de política automatizada, linhagem e governança, permitindo que os dados sejam descobertos, acessados e controlados de modo consistente sem forçar a consolidação física em um único repositório.
Juntos, a Rede de dados e o Tecido de dados estabelecem a base para acesso a dados federados. No entanto, eles param de resolver um problema crítico de próxima ordem: habilitar colaboração segura e regulamentada entre domínios e limites organizacionais, em que os dados devem ser analisados juntos sem serem copiados ou expostos.
O pivô estratégico para limpar os quartos
Conforme os dados corporativos se tornam mais distribuídos e as normas de privacidade se tornam mais rígidas, as organizações enfrentam um desafio arquitetônico essencial. Como eles colaboram entre equipes, parceiros e plataformas sem compartilhar dados brutos? As abordagens tradicionais de integração de dados não foram projetadas para esse nível de distribuição ou análise regulatória, o que criou tensão entre colaboração e conformidade.
Esse desafio levou a uma mudança para salas de atualização de dados como um recurso arquitetônico fundamental. Salas limpas levam a colaboração para longe da transferência de dados e para o cálculo regulado. Em vez de copiar ou trocar conjuntos de dados, as cargas de trabalho de análise e IA são executadas onde os dados já estão compartilhando os metadados. As consultas são avaliadas em tempo real em relação às regras de privacidade, consentimento e uso e apenas resultados agregados aprovados são retornados.
Neste modelo, as salas de limpeza de dados atuam como o limite Trust das arquiteturas de dados modernas. Eles permitem que as organizações trabalhem com parceiros e subsidiárias sem perder o controle de seus dados, apliquem privacidade e consentimento por meio de controles do sistema, em vez de apenas política, e operem entre nuvens respeitando os limites contratuais e de residência de dados.
Para casos de uso de ativação, análise e IA, as salas limpas fornecem uma maneira segura de gerar percepções de dados externos sem expor informações confidenciais. Eles permitem uma mudança de compartilhamento de dados para colaboração confiável. Para casos de uso de Ativação, salas limpas fornecem uma maneira segura de gerar públicos que podem ser ativados diretamente para um destino permitido. Tudo isso é feito sem expor nenhuma informação de identificação pessoal (PII) a nenhuma das partes.Esse é um ponto de viragem na arquitetura de dados corporativa. As salas de atualização de dados não são mais ferramentas de nicho. Eles estão se tornando a infraestrutura principal para plataformas de dados federadas prontas para IA que preservam a privacidade.
Personalidades da parte interessada e proteções técnicas
Uma arquitetura de sala de atualização de dados bem-sucedida é um sistema de várias interfaces projetado para resolver as pressões competitivas de utilitários de dados, segurança e velocidade. Há três personalidades principais cujos pontos de atrito distintos devem ser tratados pelo design técnico subjacente.
O agente de privacidade e conformidade (o mitigador de risco)
Os agentes de privacidade e conformidade usam a sala de atualização de dados como uma ferramenta de governança. Sua principal preocupação é o desvio de conformidade, o risco de ambientes de colaboração externos não aplicarem os mesmos padrões rígidos que os sistemas internos.
Pontos de fricção: Exposição regulatória (GDPR, CCPA, DMA) e ataques de "fishing" em que um parceiro tenta triangular a identidade de um usuário por meio de consultas granulares repetidas.
O cientista de dados e o analista (Otimizador de utilitários)
Os cientistas de dados veem a sala de atualização de dados como um refúgio seguro para modelagem avançada. Sua principal preocupação é a preservação de utilitários, garantindo que as medidas de privacidade não tornem os dados estatisticamente inútiles.
Pontos de fricção: Alta latência e acesso restrito a atributos granulares necessários para aprendizado de máquina (ML), modelagem de similaridade e previsão de rotatividade.
O usuário de marketing e negócios (o realizador de valor)
Essa personalidade é focada exclusivamente no tempo para valor (TTV). Sua preocupação é que os projetos de sala de atualização de dados costumam se tornar gargalos técnicos que exigem semanas de suporte de engenharia de dados.
Pontos de fricção: Processos de configuração complexos, limpeza de dados manual e o problema de "página em branco" de precisar escrever código para obter resultados de sobreposição simples.
O modelo de personalidade "Business First"
Embora as arquiteturas tradicionais se concentrem em criar a camada de dados antes da camada do usuário, nossa abordagem estratégica, alinhada à metodologia "Business First", inverte esse modelo. Priorizamos uma abordagem sem código a de poucos cliques que permite que os usuários de negócios gerem percepções e realizem ações imediatas.
Fluxo de trabalho "Insight-to-Action": A arquitetura é projetada como um espaço de trabalho ativo em vez de um repositório passivo. Ao fornecer modelos de caso de uso (por exemplo, sobreposição de segmento, ativação e desempenho da campanha), permitimos que os usuários de negócios façam o autoatendimento de percepções. Isso garante que uma percepção, como um segmento de similaridade otimizado, esteja imediatamente disponível para ativação em todo o ecossistema de marketing sem a necessidade de um engenheiro de dados mover arquivos manualmente.
Federação de Cópia Zero como um ativo estratégico: Para maximizar o TTV, a arquitetura adota uma lógica de cópia zero. Em vez do processo ETL tradicional, que introduz riscos de latência e segurança, nossa arquitetura federa consultas diretamente para onde os dados residem (por exemplo, Snowflake, BigQuery ou Amazon S3). Isso transforma o investimento de dados existente da organização em um ativo estratégico, permitindo que os usuários de negócios realizem ações com base nos dados mais atuais em tempo real enquanto mantêm uma governança rígida e eliminam o custo da redundância de dados.
Principais casos de uso de sala de atualização de dados
As salas de atualização de dados surgiram na publicidade em resposta à descontinuação de cookies e à regulamentação de privacidade, mas evoluíram além da medição para análise do cliente, segmentação de público e casos de uso de ativação entre setores. De acordo com o relatório Estado das mídias de varejo de 2025, 66% das organizações agora usam salas limpas em alguma capacidade, motivado pela necessidade de colaboração segura de privacidade que proporcione resultados de negócios mensuráveis.
O padrão é consistente entre setores: os dados permanecem com seu proprietário, o cálculo é controlado e apenas percepções seguras de privacidade são compartilhadas.
Marketing e publicidade: Medida sem cookies de terceiros
O desafio: Os profissionais de marketing precisam medir a eficácia da campanha, evitar impressões de anúncio duplicadas e otimizar o alcance/frequência, mas não podem mais depender de cookies de terceiros ou identificadores de dispositivo.
A Solução de Sala Limpa:
Os anunciantes contribuem com dados de exposição de campanha ou cliente com hash
Os editores contribuem com sinais de engajamento e impressão
Sala limpa calcula alcance, frequência, atribuição e aumento
A ativação ocorre por meio de plataformas aprovadas sem exportações de dados brutos
Resultado dos negócios: Quartos limpos fornecem atribuição de loop fechado vinculando impressões de anúncio a transações reais, análise de incrementalidade isolando verdadeiro aumento de campanha e medição unificada entre canais, recursos que a publicidade digital tradicional não pode oferecer.
Prova da indústria: A medição é o caso de uso de sala limpa mais estabelecido atualmente, com as principais redes de mídia como Pinterest, Disney e Paramount criando suas próprias salas limpas.
Mídia de varejo e Bens de consumo empacotados (CPG): Monetarizar dados de primeira parte sem compartilhá-los
O desafio: As marcas do CPG gastam muito em mídia de varejo, mas não têm visibilidade dos resultados da compra. Os varejistas possuem dados avançados de ponto de venda, mas não podem expô-los sem violar os compromissos de privacidade.
A Solução de Sala Limpa:
Retailers e empresas do CPG combinam dados de ponto de venda de locais de varejo com dados de marketing para otimizar atividades promocionais
Marcas contribuem com identificadores de fidelidade ou CRM com hash
Exposição de links de espaço limpo do anúncio para compras na loja/online
A ativação permanece no ecossistema de mídia do varejista
Resultado dos negócios:
Os varejistas monetizam dados de primeira parte sem vender informações brutas do cliente
As marcas obtêm uma atribuição de loop fechado mostrando quais campanhas geraram compras
Escala de Redes de mídia de varejo sem risco de privacidade
Prova da indústria: As Redes de mídia de varejo, como o Luminate da Walmart e o Kroger Precision Marketing, oferecem salas limpas que ajudam as marcas do CPG a analisar o comportamento do cliente e otimizar estratégias de marketing usando dados do varejista.
Serviços financeiros: Detecção colaborativa de fraudes
O desafio: As redes de fraudes operam entre instituições, mas os bancos não podem compartilhar publicamente dados do cliente ou da transação devido a normas como a GLBA e novas leis de privacidade.
A Solução de Sala Limpa:
Vários bancos unem dados anonimizados para identificar padrões indicativos de fraude, como atividade entre bancos incomum
Análise federada ou modelos executados em sinais de fraude compartilhados
Nenhuma instituição vê os dados no nível do cliente de outra
Resultado dos negócios:
Detecção anterior de padrões de fraude entre instituições
Menos positivos falsos por meio de conjuntos de sinais mais avançados
Conformidade regulatória sem centralizar dados confidenciais
Prova da indústria: As soluções de serviços financeiros da Experian e da TransUnion oferecem tecnologias de sala limpa que permitem que bancos e seguradoras colaborem na detecção de fraudes e na avaliação de risco enquanto mantêm controles rígidos de privacidade de dados.
Saúde e ciências biológicas: Pesquisar sem exposição de dados do paciente
O desafio: As empresas farmacêuticas precisam de resultados do paciente do mundo real para desenvolvimento de medicamentos, mas os dados residem em sistemas de EHR hospitalar protegidos por HIPAA e regulamentos semelhantes.
A Solução de Sala Limpa:
Médicos e pesquisadores farmacêuticos compartilham dados em uma sala limpa para saber como os pacientes estão reagindo aos tratamentos.
Os dados do paciente permanecem nos ambientes do provedor.
Os pesquisadores executam análises estatísticas aprovadas por meio de uma sala de limpeza.
A privacidade diferencial impede a nova identificação.
Resultado dos negócios:
Evidência do mundo real estatisticamente válida em escala
Simplifique o recrutamento de pacientes para ensaios clínicos combinando dados de pacientes anônimos com critérios de avaliação, encontrando candidatos elegíveis sem violar leis de privacidade de saúde
Dependência reduzida em populações de avaliação clínica limitadas
Prova da indústria: As salas limpas focadas em saúde, como o Datavant, fornecem ambientes em conformidade com a HIPAA para pesquisadores e organizações de saúde analisarem com segurança dados do paciente para ensaios clínicos e desenvolvimento de medicamentos.
Padrões entre setores: O imperativo Colaboração
Além desses casos de uso primários, as salas limpas habilitam:
Otimização da cadeia de suprimentos: Fabricantes e fornecedores colaboram para compartilhar detalhes de inventário, agendas de produção e previsões de demanda, permitindo uma melhor coordenação enquanto protege informações proprietárias.
M&A Due Diligence: Quando uma empresa adquire outra, a due diligence exige examinar projeções financeiras e bancos de dados do cliente sem compartilhar informações confidenciais diretamente; salas limpas revelam percepções como alinhamento do segmento do cliente e riscos de conformidade.
Mídia e entretenimento: Os editores comprovam o valor do público para os anunciantes enquanto protegem as identidades do assinante, habilitando CPMs premium com suporte em medidas confiáveis em vez de direcionamento probabilístico
Em AdTech, varejo, serviços financeiros, saúde e mídia, o Data Clean Rooms tornou-se uma infraestrutura Trust fundamental. Eles habilitam colaboração de alto valor que antes era bloqueada por restrições de privacidade, regulatórias ou de concorrência. Salas limpas são componentes arquitetônicos essenciais que permitem uma colaboração segura e governada, desbloqueando percepções e monetização sem abandonar o controle ou a conformidade de dados.
Quartos de atualização de dados: A base da colaboração de dados confiáveis
Uma sala de atualização de dados é um ambiente seguro e controlado que permite que várias partes gerem percepções conjuntas sem expor nem trocar dados brutos. Em vez de replicar conjuntos de dados, a análise aprovada, a IA e as cargas de trabalho de ativação são executadas no lugar e apenas saídas em conformidade com a política são retornadas. Quando a ativação requer registros no nível de indivíduo, os dados são entregues diretamente ao destino pretendido sem serem expostos a partes colaboradoras.
Arquitetonicamente, salas limpas mudam a colaboração de compartilhamento de dados para computação controlada. Cada participante mantém a custódia de seus dados, enquanto a imposição de tempo de execução controla o comportamento de consulta, as restrições de saída, o consentimento e as políticas de uso.
A colaboração é ainda mais habilitada por meio de mecanismos de alinhamento de identificador que preservam a privacidade, permitindo que conjuntos de dados de diferentes partes sejam correlacionados sem expor os identificadores subjacentes, uma funcionalidade explicada em mais detalhes mais adiante neste documento.
Como resultado, as salas de atualização de dados servem como infraestrutura básica para empresas regulamentadas por privacidade e conduzidas por IA em várias nuvens que operam em estratégias de dados federadas de cópia zero.
As primeiras salas de atualização de dados seguiram um modelo centralizado de "bunker". Todos os participantes precisavam copiar dados para um ambiente de terceiros neutro para análise. Embora seja simples no conceito, essa abordagem introduziu um atrito significativo. A movimentação de dados aumentou a latência e o custo, complicou acordos legais e de conformidade e forçou as organizações a desistir do controle direto de dados confidenciais. Em setores regulamentados, essas compensações costumavam tornar a colaboração imprática.
As salas de atualização de dados modernas evoluíram para um modelo federado e distribuído. Os dados permanecem no ambiente do proprietário e a análise é executada no lugar por meio de consultas federadas. A própria sala de atualização funciona como uma camada de governança que intercepta cada consulta, impõe controles de privacidade e política no momento da execução e retorna apenas saídas agregadas aprovadas.
Dimensão
Sala de limpeza tradicional ("Modelo de grupo")
Sala moderna limpa (modelo distribuído/federado)
Local dos dados
Os dados são copiados para um ambiente de terceiros centralizado
Os dados permanecem no ambiente do proprietário
Movimento de dados
Requer transferência física e duplicação de conjuntos de dados
Sem movimentação de dados brutos, as consultas são executadas no lugar
Controle e custódia
Custódia parcialmente cedida a plataforma de terceiros
Propriedade e custódia de dados brutos retidos por cada parte
Modelo de arquitetura
Agregação centralizada
Cálculo distribuído e federado
Imposição de governança
Políticas aplicadas após a movimentação dos dados
Apólices impostas no tempo de execução da consulta
Modelo de privacidade
Depende fortemente de controles contratuais e de procedimentos
Imposto tecnicamente por meio de controles de tempo de execução e limites de agregação
Latency
Latência maior devido à ingestão e sincronização
Latência menor, consultas federadas quase em tempo real
Estrutura de custos
Custos maiores de armazenamento, transferência e duplicação
Duplicação reduzida, conforme ocorre onde os dados residem
Complexidade de conformidade
Acordos legais complexos devido à movimentação de dados entre limites
Conformidade simplificada, pois os dados não saem do limite de origem
Escalabilidade
A escala exige mais armazenamento e replicação de dados
Escala por meio de computação distribuída sem duplicar dados
Ajuste regulamentado da indústria
Frequentemente imprático devido a questões de custódia e residência
Melhor alinhamento com restrições regulatórias, de consentimento e de soberania
O Salesforce Data 360 exemplifica esse modelo de federação. Editores e anunciantes podem colaborar e executar análises entre plataformas de nuvem sem que dados brutos saibam nunca sair do limite de segurança da plataforma. A retenção de dados é preservada, o risco é reduzido e a colaboração se torna mais rápida e fácil de escalar.
Essa mudança de dados compartilhados para computação compartilhada redefine a Trust na colaboração corporativa. Quartos limpos não são mais destinos em que os dados são armazenados, mas sistemas que controlam como as percepções são produzidas com segurança.
Criar salas de atualização de dados de nível corporativo
Para operar como um recurso arquitetônico essencial, uma sala de atualização de dados de nível corporativo deve cumprir um pequeno conjunto de requisitos não negociáveis.
Arquitetura de cópia zero
O requisito mais fundamental para salas de atualização de dados é a arquitetura de cópia zero. A colaboração de dados tradicional depende de pipelines ETL que copiam dados para ambientes compartilhados. Isso aumenta a latência, o custo, a exposição de segurança e o risco regulatório enquanto cria várias cópias não gerenciadas de dados confidenciais.
Uma moderna sala de atualização de dados elimina esse problema. Os dados permanecem em seu sistema de registro original, seja um armazém de dados na nuvem, uma plataforma operacional ou um aplicativo SaaS. A sala de atualização usa consultas federadas nessas origens distribuídas e retorna apenas resultados aprovados e seguros de privacidade.
Ao evitar a movimentação de dados físicos, as salas limpas de cópia zero reduzem a superfície de ataque, preservam a residência e a propriedade dos dados e se alinham naturalmente aos princípios do tecido de dados e da arquitetura de dados federada.
Quartos de atualização de dados interoperáveis
A estratégia de dados moderna depende da capacidade de colaborar sem mover dados. O Salesforce Data 360 fornece uma estrutura flexível que conecta sua empresa ao ecossistema de dados global por meio de dois modelos principais:
Conexão nativa do Salesforce-to-Salesforce : Nesse modelo, a colaboração ocorre diretamente entre dois clientes do Salesforce. Uma camada de metadados compartilhada permite que provedores e consumidores se conectem instantaneamente por meio de uma configuração simples. Isso permite que as equipes gerem percepções conjuntas sem o atraso ou o risco de replicar dados, garantindo que as informações permaneçam seguras em seu local original.
Integração externa do Salesforce-to-Cloud (AWS e Snowflake): Nesse modelo, a colaboração ocorre entre o Salesforce e ambientes de nuvem externos. Uma federação de cópia zero permite que as organizações conectem diferentes infraestruturas sem o custo ou o risco de movimentação de dados. Isso permite que as equipes resolvam a fragmentação de identidade e expandam o alcance enquanto mantêm os dados em sua nuvem de residente, mantendo a governança centralizada e eliminando taxas de saída.
Tecnologias de aprimoramento de privacidade (PETs)
Arquiteturas federadas e de cópia zero impedem que dados brutos sejam movidos ou duplicados, mas elas não garantem a privacidade por si só. Nesses modelos, o risco principal muda do armazenamento de dados para o cálculo de dados.
Informações confidenciais ainda podem ser vazadas por saídas de análise, mesmo quando apenas resultados agregados são retornados. Os vetores de ataque comuns incluem consultas repetidas ou sobrepostas (ataques diferenciados), análise de populações muito pequenas e inferência usando o Knowledge externo. Como resultado, as preocupações de privacidade vão além do controle de acesso para um requisito dinâmico para execução de consulta.
As salas de atualização do Enterprise Data devem tratar as Tecnologias de aprimoramento de privacidade (PETs) como controles obrigatórios no nível do sistema, não como recursos de análise opcionais ou diretrizes de política.
De uma perspectiva arquitetônica, isso significa:
A privacidade é imposta pela plataforma, não por analistas
Os controles são consistentes entre usuários, parceiros e cargas de trabalho
As garantias de privacidade são deterministas, repetíveis e auditáveis
O sistema define quais cálculos são permitidos, como os resultados são moldados e quando as consultas devem ser bloqueadas
Recursos principais do PET
Diferencial Privacidade: A privacidade diferencial (DP) fornece uma garantia matemática de que a presença ou ausência de qualquer indivíduo não afeta materialmente os resultados da consulta. Na prática, isso significa que a sala de atualização insere automaticamente ruído estatístico calibrado nas saídas e rastreia um orçamento de privacidade definido para cada conjunto de dados. Cada consulta consome parte desse orçamento e, depois de esgotada, outras consultas são bloqueadas.
Para arquitetos, o valor de DP reside na provabilidade. O risco de privacidade é limitado quantitativamente, permitindo a conformidade defensível e reduzindo a dependência da interpretação de política subjetiva.
Alinhamento seguro do identificador: Muitos cenários de colaboração exigem a identificação de sobreposições entre conjuntos de dados, como clientes ou contas compartilhados. Expor identificadores brutos violaria os princípios de minimização de dados. Em vez disso, uma arquitetura de nível de sala limpa depende de hash determinístico ou tokenização realizada dentro do limite de sala limpa. As comparações ocorrem sem revelar identificadores brutos a qualquer parte, habilitando um comportamento semelhante a junção sem divulgação de dados.
Limites de agregação e supressão de resultado: Mesmo saídas totalmente anonimizadas podem ser comprometidas quando os resultados são derivados de populações muito pequenas. Para evitar isso, uma sala de atualização de dados corporativa deve impor limites mínimos de agregação e suprimir automaticamente os resultados abaixo deles. Esses limites devem ser não substituíveis, garantindo uma proteção consistente contra vazamentos de segmentos pequenos.
Sem tecnologias de aprimoramento de privacidade (PETs) aplicadas na camada de execução, as salas do Data Clean correm o risco de se tornarem ambientes baseados em Trust que dependem de julgamento humano e de acordos contratuais. Ao integrar PETs diretamente à plataforma, a privacidade se torna uma propriedade estrutural, em vez de procedural. Isso permite que a colaboração se expanda entre equipes e parceiros sem renegociar a Trust, enquanto os reguladores e as equipes de risco podem avaliar garantias usando medidas objetivas e matemáticas em vez de políticas subjetivas.
Para arquitetos empresariais, os PETs são o mecanismo crítico que eleva uma sala de atualização de dados de um sandbox seguro para um tecido de colaboração confiável, capaz de dar suporte a análises regulamentadas de várias partes e cargas de trabalho de IA em escala corporativa.
Trilha de auditoria
Em uma colaboração multilateral, a Trust é mantida através da visibilidade. Uma sala de atualização de dados de nível corporativo deve fornecer uma "trilha de papel" de todas as interações entre os participantes e os dados.
Logs de consulta: Cada execução SQL é registrada, capturando a identidade do solicitante, o carimbo de data e hora e a lógica de consulta específica usada.
Registros de imposição de políticas: O sistema deve registrar não apenas o que foi consultado, mas quais políticas de privacidade (por exemplo, limites de agregação ou Privacidade diferencial) foram aplicadas aos resultados.
Registros do Zero-Tamper: Usando uma Trilha de auditoria imutável (objeto de modelo de dados dedicado), a sala de atualização de dados garante que os registros não possam ser alterados ou excluídos por nenhum participante, fornecendo uma única versão da verdade para os reguladores.
Habilitar salas modernas de atualização de dados com o Salesforce Data 360
O Salesforce habilita salas de atualização de dados modernas permitindo que as organizações analisem e colaborem em dados sem nunca compartilhar conjuntos de dados brutos. Criado em uma arquitetura federada de cópia zero com privacidade, consentimento e governança aplicados na execução, o Salesforce Data 360 garante que as percepções sejam seguras, em conformidade e totalmente acionáveis. Ao integrar salas limpas diretamente ao ciclo de vida dos dados corporativos, o Salesforce Data 360 as transforma de ferramentas analíticas de nicho em infraestrutura dimensionável e confiável para colaboração conduzida por IA e de várias partes.
Noções básicas da plataforma para salas de atualização de dados escalonáveis
Na camada de infraestrutura, o Salesforce Data 360 é executado no Hyperforce, o tempo de execução nativo da nuvem do Salesforce que abstrai recursos de hiperescala (AWS, Azure, GCP) por trás de um plano de controle unificado. Essa arquitetura permite que os dados permaneçam na região para atender aos requisitos de soberania e residência, ao mesmo tempo que habilita operações de sala limpa gerenciadas globalmente.
Crítico, essa base habilita a colaboração de sala de atualização entre nuvens, incluindo a interoperabilidade nativa com o AWS Clean Rooms. Usando o Data 360 como a camada de orquestração e governança, as empresas podem colaborar com parceiros que operam diretamente na AWS sem forçar a migração de dados para o armazenamento gerenciado pelo Salesforce. As consultas são enviadas para a origem, as regras de privacidade são aplicadas de maneira consistente e apenas resultados agregados em conformidade são trocados entre plataformas.
A conformidade e o Trust são aplicados na infraestrutura e no limite da execução, em vez de serem adaptados na camada de aplicativos, fornecendo uma base duradoura para a colaboração multicloud em escala.
O pipeline do Data 360 da ingestão à ativação
O Data 360 implementa um pipeline de dados de ponta a ponta rastreável, garantindo que as operações de sala limpa sejam executadas em dados harmonizados, governados e sensíveis à identidade, em vez de extrações brutas.
As principais fases incluem:
Conectar: Ingestão e virtualização de dados por meio de conectores prontos para uso, APIs, SDKs, MuleSoft ou conectores de cópia zero
Persistir: Armazenamento de dados brutos em formatos nativos (Parquet/Iceberg)
Harmonizar: Mapeamento para objetos de modelo de dados (DMOs) canônicos para junções consistentes
Unify: A resolução de identidade cria registros Golden
Derive Insights: Percepções calculadas calculam métricas agregadas dentro do limite governado
Ato: Saídas gerenciadas fluem para organizações do Salesforce, plataformas de marketing, redes de anúncios, plataformas de dados externas ou outras salas limpas, fechando o loop de percepção para ação
Esse pipeline garante que salas limpas operem com dados de nível corporativo, não extrações ad-hoc.
Integração nativa e "Cliques, não código"
Diferentemente das plataformas de sala de atualização de dados independentes que exigem provisionamento separado e desenvolvimento de SQL, as salas de atualização do Salesforce são integradas nativamente ao Data 360. Isso habilita a reutilização de DMOs, regras de identidade, modelos de consentimento e políticas de governança, eliminando camadas de segurança duplicadas.
O modelo de sala de limpeza conduzido por modelo do Salesforce é um acelerador importante, usando:
Modelos prontos para uso para suportar padrões de colaboração comuns, como sobreposição de público, supressão, alcance e medição de elevação.
Modelos personalizados que permitem aos arquitetos e usuários avançados definir lógica analítica reutilizável adaptada às necessidades específicas do setor ou do parceiro, sem expor dados brutos ou complexidade de políticas.
Essa abordagem padroniza a colaboração enquanto ainda permite flexibilidade, permitindo que salas limpas sejam escaladas como uma funcionalidade corporativa repetível, não um projeto de análise único.
O "caminho dourado" – Fechando o loop de percepção para ação
O Data 360 lida com um modo de falha comum de salas limpas tradicionais: a Lacuna de ativação. Sua estrutura Caminho Ouro garante que as percepções geradas em uma sala limpa possam ser tomadas imediatamente, sem exportar dados brutos.
Configuração e descoberta: Os parceiros compartilham metadados de esquema e aproveitam modelos para avaliar a viabilidade antes da finalização dos contratos.
Análise: Modelos predefinidos e personalizados conduzem a análise de sobreposição, a supressão, a modelagem de similaridade e a medição de elevação, tudo executado dentro do limite controlado.
Ativação: Os segmentos aprovados são enviados diretamente para o Marketing Cloud, plataformas de anúncio ou sistemas de parceiros, com apenas resultados agregados em conformidade compartilhados.
Os modelos se tornam caminhos de execução definidos por opinião, garantindo que a colaboração passe de forma previsível da análise à ativação.
Um manual para salas limpas do Salesforce Data 360
Implantar uma Sala do Salesforce Data 360 Clean não é apenas um exercício de configuração, é um fluxo de trabalho de arquitetura disciplinado que abrange a prontidão de dados, o design de governança, a conectividade segura e o monitoramento operacional.
Etapa 1: Definir o caso de uso da colaboração (Iniciar com intenção)
Antes de tocar em dados ou configuração, os arquitetos devem definir claramente:
Que pergunta estamos tentando responder?
Qual resultado esperado? (por exemplo, análise de sobreposição, medição de elevação, supressão, detecção de fraudes)
Qual nível de agregação é necessário?
Quais restrições regulatórias ou contratuais se aplicam?
Qual caminho de ativação consumirá os resultados?
Entender o objetivo do colaborador moldará tudo o que segue: chaves de junção, regras de identidade, limites de governança e modelagem de custo. Quartos limpos são ambientes criados com finalidade. Ele deve ser projetado com base em uma meta analítica definida, não em uma exposição de dados genérica.
Etapa 2: Preparar os dados para a colaboração Clean Room
Para que a colaboração possa começar, os dados corporativos devem ser preparados estruturalmente e semanticamente. Quartos limpos amplificam pontos fortes e pontos fracos nos dados subjacentes. Lixeira em, lixo fora é muito mais verdadeiro aqui.
Ingestão: Conecte sistemas de origem como Salesforce CRM, Marketing Cloud, AWS S3 e Google Cloud Storage ao Data 360. Sempre que possível, use conectores de cópia zero (por exemplo, Snowflake) para evitar movimentação desnecessária ou duplicação de dados.
Mapeamento semântico: Mapeie fluxos de dados para o modelo de dados Customer 360. Padronize os principais campos, como números de telefone (formato E.164), códigos de país/estado (padrões ISO) e endereços de email. Desalinhamento (por exemplo, uma parte usando "CA" e outra "Califórnia") pode silenciosamente falhar em junções e reduzir as taxas de correspondência.
Resolução de identidade: Configure regras determinísticas (correspondência exata) e probabilísticas (correspondência parcial) para criar um Indivíduo unificado (Registro Ouro). Essa entidade unificada é a superfície para correspondência de sala limpa.
A qualidade da resolução de identidade afeta diretamente o valor da colaboração. A maior precisão da correspondência aumenta as taxas de sobreposição, a confiança analítica e reduz os negativos falsos.
Etapa 3: Provisionar a sala de limpeza
Depois que os dados são harmonizados, a própria sala de atualização deve ser provisionada para definir limites de colaboração.
Validação de licença: Confirme se todas as organizações participantes têm os direitos de sala limpa e Data 360 necessários.
Escopo do espaço de dados: Objetos de sala limpa devem ter o escopo de um espaço de dados específico. Somente objetos mapeados para esse espaço de dados ficam visíveis para a sala de atualização. Isso garante que a colaboração seja logicamente isolada sem exigir a criação de um novo espaço de dados apenas para salas limpas.
Definir regras de governança: Estabeleça políticas declarativamente antes de as consultas serem executadas:
Limites de agregação: por exemplo, um mínimo de 100 registros por saída
Join Keys: for example, Email_Hash_SHA256
Operações permitidas: apenas funções agregadas, como COUNT, SUM, AVG
Restrições explícitas: exportações em nível de linha de bloco (SELECTE *)
As regras de governança são aplicadas no momento da execução, tornando propriedades no nível do sistema de privacidade e conformidade em vez de orientação procedural.
Etapa 4: Estabelecimento de conectividade multifator segura
Quartos limpos geralmente abrangem limites organizacionais e de plataforma. A conectividade deve ser explícita e estritamente controlada.
** Vinculação de conta:**
Salesforce-to-Salesforce: Use o Data Cloud One ou mecanismos de compartilhamento entre organizações aprovados.
Cenários de várias nuvens: Valide o alinhamento e a residência da região antes de as consultas serem habilitadas.
Autenticação e autorização: Configure o acesso baseado em OAuth para usuários de integração dedicados com o princípio de privilégio mínimo: limite o acesso estritamente aos espaços de dados necessários e evite permissões administrativas.
Falhas de segurança geralmente resultam de usuários de integração com permissão excessiva, em vez de fraquezas em controles de criptografia ou plataforma.
Etapa 5: Executar, monitorar e controlar cargas de trabalho de sala limpa
Após a ativação, concentre os turnos na supervisão operacional, na qualidade da consulta e no gerenciamento de custos.
Execução de consulta: Analistas ou fluxos de trabalho realizam análises e agregações de sobreposição por meio de Insights calculados ou interfaces SQL aprovadas. Todas as consultas aplicam automaticamente limites de agregação e controles de privacidade.
Auditoria e rastreabilidade : As salas de atualização do Salesforce Data 360 fornecem trilhas de auditoria na forma de um objeto de modelo de dados (DMO) de auditoria. Isso captura metadados sobre a atividade da consulta, incluindo quem executou a consulta, quando ela foi executada e quais políticas foram aplicadas. O DMO de auditoria habilita relatórios de conformidade, validação de governança e rastreabilidade forense, garantindo que a colaboração seja segura e revisável.
Monitoramento de consumo: O Data Cloud usa um modelo de crédito baseado em consumo. Os principais fatores incluem:
Linhas processadas (por exemplo, linhas 1M = unidade de crédito de linha de base)
Complexidade da consulta
Operações de resolução de identidade (multiplicador maior)
Ingestão em lote (multiplicador inferior)
Digital Wallet e Alertas: Use a Digital Wallet para rastrear o consumo em tempo real e configurar alertas nos limites de 50%, 75% e 90%. Correlacione picos a cargas de trabalho específicas para evitar custos inesperados.
Observe que a cópia zero não elimina os custos de computação. Enquanto a duplicação física é removida, a execução ocorre no sistema de origem. Os arquitetos devem gerenciar padrões de consulta, a seleção de junção e a frequência de execução para controlar o custo e o desempenho.
Governança, segurança e conformidade
Arquitetura de quartos limpos para Trust em escala
Em empresas modernas, o Trust não é ligado a uma sala de limpeza de dados. É um resultado arquitetônico. O Salesforce Data 360 impõe a governança, a segurança e a conformidade de modo contínuo e automático, migrando salas limpas de ambientes orientados por política para sistemas governados por plataforma.
Os controles de tempo de execução (identidades bloqueadas, trilhas de auditoria e privacidade diferencial) se aplicam de modo consistente independentemente de a colaboração ocorrer no Salesforce, entre parceiros ou entre nuvens.
Trust e governança de tempo de execução
A mudança mais importante para os arquitetos é que o Trust é aplicado durante a execução, não assumido previamente. O Salesforce Data 360 realiza isso por meio de vários controles de plataforma essenciais:
Identidade bloqueada: O acesso do parceiro é vinculado criptograficamente às identidades verificadas da organização do Salesforce, impedindo a falsificação ou a participação não autorizada.
Pilhas de auditoria: Todas as consultas, junções, sobreposições de segmento e ativações são registradas para total auditoria e conformidade regulatória.
Diferencial Privacidade: A inspeção no nível da linha é estruturalmente impossível. As saídas são agregadas e limitadas estatisticamente. Os colaboradores veem apenas resultados seguros de privacidade, como métricas de alcance ou porcentagens de aumento, nunca transações ou identidades individuais.
Esses controles substituem o Trust contratual por garantias matemáticas e aplicação em nível de plataforma, reduzindo o risco operacional e jurídico.
Governança de IA por meio da Camada de Trust do Einstein
À medida que os agentes de IA interagem cada vez mais com os dados da Sala limpa, o Salesforce introduz a Camada do Einstein Trust. Ele atua como um bloqueio aéreo arquitetônico entre dados corporativos confidenciais e LLMs externos. Isso garante que as percepções de sala limpa possam alimentar com segurança a tomada de decisão conduzida por IA sem expor dados subjacentes.
Principais funcionalidades:
Retenção de dados zero: Os dados enviados para LLMs são efetivos. Os provedores de modelo não podem armazenar avisos ou respostas para treinamento.
Detecção de linguagem tóxica e mascaramento de PII: Entradas e saídas são verificadas automaticamente e a PII é mascarada de acordo com as Políticas de mascaramento de dados configuradas no Data 360.
Isolamento lógico por meio de conjuntos de permissões e espaços de dados
Os espaços de dados fornecem isolamento lógico dentro de uma organização e devem estar alinhados a limites regulatórios, geográficos e de parceria, como:
Espaço de dados da UE
Espaço de dados da América do Norte
Somente conjuntos de dados atribuídos a um espaço de dados ficam visíveis dentro de suas salas limpas, evitando exposição cruzada acidental.
Os conjuntos de permissões oferecem controle detalhado sobre quem pode criar ou gerenciar salas limpas, executar consultas ou ativar segmentos. As permissões sensíveis aos dados aplicam restrições em nível de campo em objetos de modelo de dados. Por exemplo, os profissionais de marketing podem ver nomes de segmento e tamanho do público, mas não indicadores de renda ou saúde.
A segurança é imposta na camada semântica, permitindo o autoatendimento seguro para usuários de negócios sem supervisão de TI constante.
Conformidade e consentimento por design
Os sinais de consentimento se propagam automaticamente por meio do Data 360 para a execução da sala de limpeza. Usuários que revogam o consentimento são excluídos da análise e ativação por padrão, garantindo que a conformidade seja imposta pelo sistema, não controlada manualmente.
O Salesforce Data 360 trata a governança, a segurança e a conformidade como primitivos arquitetônicos de primeira classe, não como complementos opcionais. Ao combinar a capacidade de auditoria de tempo de execução, identidades bloqueadas, privacidade diferencial, espaços de dados, resolução de identidade sensível ao consentimento e a Camada de Trust do Einstein, as empresas podem dimensionar a colaboração de sala limpa entre parceiros, sistemas de várias nuvens e cargas de trabalho conduzidas por IA, tudo sem comprometer a Trust, a privacidade ou a conformidade regulatória.
Conclusão e caminho adiante
Um caminho prático para os arquitetos
Para capturar todo o valor das salas de atualização de dados, os arquitetos devem tratá-las como uma infraestrutura arquitetônica essencial, não como ferramentas de análise isoladas. As prioridades a seguir definem um caminho pragmático e escalonável:
Faça da colaboração uma preocupação arquitetônica de primeira classe: A colaboração de dados externos deve ser projetada com a mesma rigor da integração interna. As salas limpas devem ser integradas a arquiteturas de referência corporativas junto com plataformas de dados, camadas de integração e sistemas de IA, não implementadas como extensões ad hoc. À medida que a interoperabilidade se expande (por exemplo, a integração de sala limpa do Data 360 com salas limpas da AWS e futura compatibilidade entre salas limpas), os arquitetos devem projetar padrões de colaboração que antecipam ecossistemas de várias plataformas em vez de silos de fornecedor único.
Design para privacidade por padrão na fonte
Design para fluidez de dados: Em vez de usar como padrão ETL pesado e replicação central, os arquitetos devem primeiro considerar a federação e o acesso de cópia zero. Migrar o cálculo para dados (quando apropriado) reduz a duplicação desnecessária, reduz o custo e preserva a integridade da fonte da verdade. "Conectar vs. copiar" deve ser uma decisão arquitetônica consciente, não um hábito herdado.
Fechar a lacuna de percepção para ação : Quartos limpos que param na análise não fornecem valor comercial. As arquiteturas devem conectar de modo nativo saídas de sala limpa a sistemas de ativação e fluxos de trabalho de IA. Os loops de feedback, a medição de desempenho e a execução a jusante devem ser projetados desde o princípio.
Prepare-se para a Enterprise Agente: À medida que os agentes de IA usam mais dados corporativos, salas limpas servirão como ambientes de execução controlados em que os agentes podem operar sem expor dados brutos. Os arquitetos que alinham a estratégia de sala limpa com a governança de IA e as estruturas Trust estarão mais bem posicionados para esta próxima fase.
Conclusão
As salas de atualização de dados modernas representam uma mudança fundamental na arquitetura de dados corporativa. Eles resolvem a tensão de longa data entre utilitário de dados e privacidade habilitando a colaboração sem exposição de dados.
Arquiteturas como o Salesforce Data 360 demonstram que essa compensação não é uma consideração "ou ou". Ao desacoplar o armazenamento de dados da ativação por meio de padrões de cópia zero e incorporar tecnologias de aprimoramento de privacidade diretamente à execução, as empresas podem colaborar em análises de alto valor sem abandonar o controle de seus dados. A privacidade passa da obrigação contratual para a garantia arquitetônica.
O mais importante é que salas limpas transformam dados de um ativo estático isolado em um recurso governado e acionável. Quando conectados nativamente às camadas de ativação e IA, as percepções não ficam mais paralisadas nos painéis. Eles fluem diretamente para decisões, campanhas e sistemas autônomos, fechando o loop entre dados, ações e resultados em escala corporativa.
Sobre os autores
Yugandhar Bora é um arquiteto de engenharia de software na Salesforce, especializado em arquitetura de dados na plataforma de aplicativos de dados e inteligência. Ele lidera iniciativas do Conselho de revisão de arquitetura corporativa (EARB) focadas na governança de dados e modelos de dados unificados, ao mesmo tempo que contribui para soluções de provisionamento de plataforma automatizadas.
Birendra Kumar Singh é membro principal da equipe técnica, especializada em plataforma e arquitetura de dados dentro do Data 360 na Salesforce. Ele é um membro principal da Plataforma de ativação e lidera a iniciativa Clean Room focada em fornecer infraestrutura de sala de limpeza de dados a clientes do Data 360.
Priyanka Kshirsagar é gerente sênior de produto na Salesforce, liderando o Data 360 Clean Rooms, uma funcionalidade que ela criou do zero para permitir que os clientes corporativos colaborem em dados de primeira parte em um ambiente que preserva a privacidade. Ela conduz a visão para casos de uso habilitados por IA e ML, incluindo modelagem de similaridade e aprimoramento de identidade em salas limpas, e levou o produto pela Disponibilidade geral e um lançamento do Dreamforce de Nível 1.
We use cookies on our website to improve website performance, to analyze website usage and to tailor content and offers to your interests.
Advertising and functional cookies are only placed with your consent. By clicking “Accept All Cookies”, you consent to us placing these cookies. By clicking “Do Not Accept”, you reject the usage of such cookies. We always place required cookies that do not require consent, which are necessary for the website to work properly.
For more information about the different cookies we are using, read the Privacy Statement. To change your cookie settings and preferences, click the Cookie Consent Manager button.
Cookie Consent Manager
General Information
Required Cookies
Functional Cookies
Advertising Cookies
General Information
We use three kinds of cookies on our websites: required, functional, and advertising. You can choose whether functional and advertising cookies apply. Click on the different cookie categories to find out more about each category and to change the default settings.
Privacy Statement
Required Cookies
Always Active
Required cookies are necessary for basic website functionality. Some examples include: session cookies needed to transmit the website, authentication cookies, and security cookies.
Functional Cookies
Functional cookies enhance functions, performance, and services on the website. Some examples include: cookies used to analyze site traffic, cookies used for market research, and cookies used to display advertising that is not directed to a particular individual.
Advertising Cookies
Advertising cookies track activity across websites in order to understand a viewer’s interests, and direct them specific marketing. Some examples include: cookies used for remarketing, or interest-based advertising.