The Brief
데이터 인프라BigQuery

BigQuery Graph로 금융사기 네트워크 탐지하기

한마디로

그래프 쿼리로 사기 연결고리를 빠르게 찾아 수억 명 사용자 데이터도 실시간 분석할 수 있게 됐어요

한눈에

BigQuery Graph는 카드·기기·연락처 같은 공통점으로 엮인 사기 조직을 네트워크 분석으로 찾는 도구예요. 기존 SQL 조인으로는 수억 개 사용자 관계를 빠르게 처리하기 어려웠는데, 그래프 쿼리 언어(GQL)로 패턴 매칭이 가능해지면서 대규모 탐지가 현실화됐어요. 금융 슈퍼앱 Curve가 BigQuery Graph를 도입한 사례를 보면 변화가 명확해요. 기존엔 SQL의 다중 조인으로 방대한 사용자·거래 데이터를 연결하려니 쿼리가 복잡해지고 속도가 떨어졌어요. 하나의 거래에서 카드 정보, 사용 기기, 연락처가 다른 거래들과 중복되는 패턴을 찾으려면 수십 줄의 조인 로직이 필요했거든요. GQL로 전환하니 같은 작업을 몇 줄의 그래프 패턴으로 표현할 수 있게 됐어요. 결과적으로 2025년 한 해 약 1,200만 달러의 사기 손실을 방지했고, 72% 정도의 정확도로 사기 사용자를 식별하고 있어요. 실무에서 쓰는 포인트는 다음과 같아요. 첫째, 고객 데이터에서 직접 만드는 네트워크 그래프를 활용하면 돼요. 사용자를 노드로, 카드·기기·연락처 공유를 간선으로 모델링한 뒤 GQL로 밀집된 부분그래프(클리크)를 찾으면 사기 조직이 드러나요. 둘째, SQL 조인 반복을 줄이므로 쿼리 비용과 실행 시간이 크게 단축돼요. 기존 다중 조인으로 몇 분 걸리던 분석을 수초 안에 끝낼 수 있어요. 셋째, 실시간 탐지를 향해 스트리밍 데이터 처리로 나아갈 수 있어요. 거래가 들어올 때마다 그래프를 업데이트하고 의심 패턴을 즉시 감지하는 것이 Curve의 다음 목표예요. 마케팅·이커머스 회사라면 비슷하게 활용할 수 있어요. 사용자 구매 이력, 사용 기기, IP, 배송지를 그래프로 모델링해 불량 계정이나 부정 주문 집단을 찾는 식이에요. CRM 데이터베이스의 고객 관계망을 분석해 이탈 위험 집단을 조기에 감지하는 것도 가능해요. 다만 그래프 설계와 쿼리 로직이 핵심이라 데이터 엔지니어와 분석가의 협력이 필수 요구돼요.

자주 묻는 질문

BigQuery란 뭐예요?

Google Cloud의 서버리스 데이터 웨어하우스로, 페타바이트 규모의 데이터를 SQL로 빠르게 분석하는 도구예요. BigQuery Graph는 여기에 그래프 분석 기능을 더한 확장판이라고 보면 돼요.

일반 SQL 조인 대신 GQL(그래프 쿼리)을 써야 하는 이유가 뭐예요?

SQL 조인은 수백 수천 줄의 코드로 늘어나고 성능이 떨어져요. GQL은 그래프 패턴을 직관적으로 표현하므로 읽기 쉽고 실행도 빨라요. Curve 사례에서 쿼리 복잡도가 크게 줄어든 이유도 여기예요.

마케팅 팀이 이걸 직접 쓸 수 있어요?

데이터 엔지니어가 먼저 고객 데이터를 그래프로 모델링하고 GQL 쿼리를 작성한 후, 분석 결과 대시보드를 마케팅 팀이 보는 구조가 일반적이에요. 데이터 팀과의 요청·협의 과정이 필요해요.

비용이 많이 들어요?

BigQuery는 스캔한 데이터량으로 과금되는데, GQL로 쿼리 효율이 오르면 스캔 범위가 줄어들어 오히려 비용이 절감돼요. 다만 초기 그래프 설계와 쿼리 최적화에 시간 투자가 필요해요.

에디터 노트

금융사기 탐지는 네트워크 분석의 가장 설득력 있는 사례인데, 마케팅·ERM에서 고객 이탈·부정 거래 탐지까지 확대되면 CRM 경쟁이 기술 차이로 벌어질 가능성이 커요. 다만 그래프 설계와 GQL 문법이 SQL만큼 대중적이지 않아 도입 장벽이 있으니 데이터 팀의 역량 확보가 선결 과제예요.

태그

용어 풀이
BigQuery
구글 클라우드의 서버리스 데이터 웨어하우스로 페타바이트 규모 데이터를 SQL로 빠르게 분석하는 도구
Graph Query Language (GQL)
그래프 구조의 노드와 간선 패턴을 직관적으로 표현해 복잡한 관계 분석을 간결하게 처리하는 언어
패턴 매칭
그래프에서 특정 구조의 노드 조합을 찾는 분석 기법으로 사기 네트워크나 고객 집단 식별에 쓰임
네트워크 분석
사용자·기기·카드 같은 요소들 간 연결 고리를 가시화하고 밀집된 클러스터를 찾는 데이터 분석 방법

관련 마테크