The Brief
AI 인사이트

에이전트가 마케팅을 실행하는 시대, 거버넌스 없는 도입이 가장 위험한 이유

agentic AI가 CDP·자산관리·B2B 마케팅 워크플로로 들어오면서 드러난 거버넌스 공백과 실무 대응

한마디로

Databricks CustomerLake, Salesforce Agentic Advisor처럼 답이 아니라 행동을 실행하는 에이전트형 제품이 쏟아지고 있어요. 그런데 정작 이 흐름을 받쳐야 할 거버넌스를 다 갖춘 마케팅팀은 13%뿐이고, 유출·종속·비용 리스크는 빠르게 현실이 되고 있습니다. 무엇이 바뀌었고 도입 전에 무엇을 먼저 세워야 하는지 정리했어요.

답하던 AI가 실행하는 AI로 넘어갔어요

최근 한 달 사이 나온 제품 발표를 모아보면 방향이 또렷해요. Databricks는 Data + AI Summit에서 CustomerLake를 내놨는데요, 기존 CDP가 캠페인을 여러 시스템에 거쳐 몇 주씩 굴리는 waterfall 구조였다면 CustomerLake는 lakehouse 위에서 고객 행동을 실시간 분석하고 의사결정해 하루 10억 건의 개인화 경험을 돌린다고 해요. 데이터를 CDP로 복제하지 않고 Unity Catalog 거버넌스 아래에서 신원 해소·오디언스 빌딩·캠페인 자동화·활성화를 한 곳에 모았다는 게 골자예요. Adobe, Meta, Braze 등 50개 넘는 파트너와 양방향 연동도 붙였고요.

Salesforce의 Agentic Advisor도 결이 같아요. 단순 챗봇이 아니라 미팅 준비, 포트폴리오 모니터링, 일과 자동화를 백그라운드에서 처리하는 'AI 동료' 콘셉트예요. Meeting Concierge, Run My Day 같은 6개 기능을 묶고 모든 액션을 human-in-the-loop로 검토하게 설계해 규제 요건을 맞췄다고 합니다. 자산관리사 은퇴 물결(향후 10년 40% 퇴직)과 고객 유지 위기(44%가 공급자 변경 계획)를 AI 수용력으로 메우겠다는 계산이죠.

학계 쪽 신호도 같은 곳을 가리켜요. arXiv에 올라온 Business World Model(BWM)은 비즈니스 상태·역학·제약·목표·행동 공간을 명시적으로 인코딩해 에이전트가 행동 시퀀스를 시뮬레이션하고 미래 결과를 추정하는 내부 시뮬레이터를 제안해요. 지시받아 실행하는 단계를 넘어 목표를 받아 스스로 계획·실행하는 자율 시스템의 개념 토대를 깔겠다는 거예요. 제품(Databricks·Salesforce)과 이론(BWM)이 같은 방향을 보고 있다는 점이 이 흐름의 무게예요.

현장은 아직 준비가 안 됐어요

Marketing AI Institute의 2026 설문이 온도차를 잘 보여줘요. 응답자 74%가 12개월 안에 AI를 조직 성공의 핵심으로 보고, 40%가 가장 주목하는 기술로 agentic AI를 꼽았어요. 그런데 AI 로드맵·카운슬·정책·윤리 기준을 모두 갖춘 곳은 13%뿐이에요. 교육을 제공하는 조직도 46%에 그치고요. 제품은 자율 실행을 향해 달리는데 그걸 통제할 운영 체계는 대부분의 팀에 없는 상태예요.

이게 왜 위험하냐면 에이전트의 실수는 규모가 다르기 때문이에요. CustomerLake가 하루 10억 건을 처리한다는 건 인프라 자랑이지만, 그 의사결정을 검증·통제할 측정 체계가 없으면 잘못된 세그먼트에 잘못된 메시지를 대규모로 쏘는 사고가 됩니다. 사람이 캠페인을 하나씩 만들 땐 실수도 한 건이지만, 에이전트가 always-on으로 돌면 오류도 always-on이에요.

유출 리스크는 이미 숫자로 측정됐어요. HuggingFace의 MosaicLeaks 연구를 보면 리서치 에이전트가 개인 문서와 웹 검색을 결합할 때 쿼리 하나하나는 무해해도 조합하면 기밀이 드러나는 '모자이크 효과'가 생겨요. 프롬프트로 '조심하라'고 지시하는 방식은 거의 안 통했고, 각 쿼리 단계마다 보상을 주는 강화학습(PA-DR)이 5~6배 효율적이라 유출률을 34.0%에서 9.9%로 낮췄어요. 핵심은 에이전트 안전이 가이드라인 문서가 아니라 모델 훈련 레벨에서 설계돼야 한다는 점이에요. 동시에 9.9%도 0이 아니라서 고객 데이터를 다루는 deep research 에이전트라면 유출 지표를 KPI에 넣고 정기 감사해야 하고요.

실무에서 먼저 세울 것

첫째, CDP 선택 기준이 '어떤 데이터 플랫폼'에서 '어떤 AI 플랫폼'으로 옮겨가는데 이게 곧 종속 결정이라는 걸 계약 단계에서 인지하세요. CustomerLake가 데이터 복제 없이 lakehouse 위에서 작동한다는 건 매력이지만, 50개 파트너 양방향 연동이 락인을 푸는 카드인지 더 강하게 묶는 명분인지는 따로 따져야 해요. Alphabet과 Meta의 AI 입찰 상품(Performance Max·Advantage+) 논쟁도 같은 구도예요. ROAS가 오르는 듯 보여도 채널 기여도와 증분 효과가 블랙박스화되면서 측정 권한이 플랫폼 쪽으로 넘어가요. 예산이 락인되는 동안 자체 first-party data와 incrementality 측정 역량을 얼마나 확보했는지를 점검하는 게 실무의 본질이에요.

둘째, 'human-in-the-loop로 규제 충족'을 액면 그대로 믿지 마세요. Salesforce Agentic Advisor의 검토 단계가 형식적 클릭으로 전락하면 책임 소재만 흐려져요. 감사 추적과 근거 데이터 품질부터 보고, 수작업 50% 절감 같은 숫자는 벤더 베스트케이스로 깔고 자사 CRM 데이터 정합성과 실제 절감분을 별도 지표로 검증하세요.

셋째, 비용을 KPI에 넣으세요. GitHub Copilot이 토큰 사용량 기반 과금으로 바꾸면서 Uber 같은 곳도 예산을 빠르게 소진하고 사용량 제한을 거는 'Tokenpocalypse'가 시작됐어요. 그동안 투자금으로 보조되던 토큰 단가가 실사용량으로 전가되는 거예요. 에이전트가 always-on으로 도는 CustomerLake류 제품일수록 토큰 소비도 always-on이라 라우팅·캐싱·프롬프트 압축 같은 토큰 다이어트가 곧 운영비 차이로 직결돼요. 도입 단계부터 사용량 모니터링과 토큰당 산출 가치를 KPI에 넣지 못한 PoC는 정산 시즌에 가장 먼저 잘립니다.

자율 실행보다 통제 설계가 먼저예요

BWM의 한계가 이 전체 흐름의 한계를 압축해서 보여줘요. 모델이 비즈니스 역학을 명시적으로 인코딩해도 결국 품질은 입력 가정이 현실을 얼마나 반영하느냐에 달려 있어요. 시장 반응이나 경쟁사 행동처럼 통제 불가능한 변수가 많은 마케팅에선 시뮬레이션 결과가 그럴듯할수록 오히려 위험하고요. 검증된 reward 신호와 피드백 루프 없이 목표 지향 자율 실행을 맡기는 건 시기상조예요.

설문이 보여준 낙관 편향도 같은 맥락이에요. 71%가 AI로 일자리가 줄 거라 보면서 정작 본인 일자리를 걱정하는 사람은 20%뿐이에요. 진짜 변수는 노코드로 에이전트를 짜는 도구 숙련도가 아니라, 그 결과물을 검증하고 통제하는 운영 체계예요. 자율 워크플로 설계 능력이 경쟁력이 된다는 진단은 맞지만, 거버넌스를 먼저 세운 13%의 팀이 결국 모멘텀을 가져갈 거예요. 에이전트형 제품을 도입할지 말지가 아니라, 들이기 전에 측정·감사·비용·종속 네 가지를 통제할 체계를 세웠는지가 실무의 갈림길이에요.

태그

관련 AI 인사이트