Google AI Overviews 법적 책임 — 콘텐츠 검수 3개월 회고

목차

AI Overviews는 Google 검색 결과 최상단에 Gemini가 작성한 요약 답변을 띄우는 기능이다. 미국에서 2024년 5월 정식 출시된 이후 영국, 일본, 인도 등 100여 개 시장으로 확장된 것으로 알려져 있다. 한국은 작성 시점(2026년 6월) 기준 정식 도입 전 단계로 보인다.

운영 중인 사이트가 영문 시장 콘텐츠를 일부 다루고 있어서, 지난 3개월간 사내 콘텐츠 검수 파이프라인에 AI 검색을 끼울 수 있을지를 검토했다. 실험 도중 독일 법원에서 Google AI Overviews 법적 책임에 관한 판단이 나왔다는 외신 보도가 흘러나왔다. 그 시점에 검토 방향이 한 차례 꺾였다. 그 3개월을 시간순으로 풀어본다.

AI Overviews가 뭐고, 어디까지 와 있나

AI Overviews의 동작은 단순하다. 검색창에 질문을 넣으면 결과 페이지 최상단에 4~6줄짜리 답변이 뜨고, 그 아래에 참고한 페이지 링크가 카드 형태로 붙는다. 답변 자체는 Gemini 계열 모델이 검색 인덱스의 페이지들을 가지고 그 자리에서 합성해서 만든다.

기능 출시 직후부터 환각(hallucination) 사례가 끊이지 않았다. 가장 유명한 건 "피자에 치즈를 더 잘 붙이려면 풀(glue)을 섞어라"는 답변이 미국 사용자들 사이에서 화제가 된 2024년 사례다. 풍자성 게시판 글을 그대로 가져와서 정답인 양 제시한 케이스로 보도됐다.

특히, 이런 환각이 단순한 웃음거리로 끝나지 않는 이유는 노출 위치에 있다. 검색 결과 최상단은 일반 사용자 입장에서 "Google이 검수해서 띄운 정보"처럼 인식되기 쉽다. 광고 라벨조차 붙어 있지 않은 위치다.

그래서, 또 하나 짚어둘 지점은 제로클릭 비율 증가다. 답변이 위에 떠 있으면 사용자는 출처 페이지를 클릭하지 않고 떠난다. 매체사 트래픽이 줄어드는 구조적 압력이 누적되고 있다는 보도가 EU 쪽에서 꾸준히 나오고 있다. 이게 소송 동기와 무관하지 않아 보인다.

콘텐츠 검수에 AI 검색을 끼워볼까

3개월 전, 운영 중인 사이트의 콘텐츠 검수 파이프라인을 손볼 일이 있었다. 영문 시장 콘텐츠 비중이 늘면서 사실 확인에 드는 시간이 매주 40시간 가까이 됐다. 작성자 4명, 검수자 1명 체제에서 검수자 한 명이 명확한 병목이었다.

게다가, 검토 후보는 세 가지로 좁혔다.

  • Google AI Overviews 기반 1차 컨텍스트 요약
  • Perplexity Pro의 출처 기반 답변
  • 사내 RAG 파이프라인 자체 구축

결국, 세 번째 옵션은 인프라 비용과 운영 부담 때문에 일찌감치 제외했다. RAG는 만드는 것보다 유지가 어렵다는 게 작성 시점까지의 개인적 결론이다. 인덱스 갱신, 청크 사이즈 튜닝, 임베딩 모델 교체에 따른 재계산을 한 분기마다 돌리는 일이 작은 팀에 부담이라는 판단이었다.

이처럼, 남은 두 후보를 놓고 4주짜리 작은 실험을 잡았다. 기대치는 낮게 잡았다. AI 검색을 정답지로 쓰는 게 아니라 "이 주제에 어떤 맥락이 있는지" 1차 스캔용으로 쓰는 정도. 검수자가 본격적으로 자료를 파기 전에 큰 그림을 잡아주는 보조 도구로 본 거다.

게다가, 선임 한 명이 회의에서 한 말이 기억난다. "잘 굴러가는 검수 프로세스를 굳이 AI로 뒤집을 이유는 없다. 지금 문제는 검수자 시간이지 검수 품질이 아니다." 5년차로서 이 의견에 가까운 입장이었다. 도입은 보수적으로, 효과가 검증되면 단계적으로 확장하는 방향으로 잡았다.

실험 첫 달, 걸린 것들

초반 2주는 인상이 나쁘지 않았다. 영문 검색어를 넣고 상단 요약을 읽으면 1~2분 안에 주제 윤곽이 잡혔다. 검수자가 "이 분야는 처음 다룬다"고 했던 콘텐츠도 첫 5분의 진입 비용이 확실히 줄어든 것으로 보였다.

문제는 3주차에 본격적으로 드러났다.

출처와 답변이 일치하지 않는 케이스

또한, 특정 통계 수치가 AI Overviews 답변과 출처 카드에 표시된 원문에서 달랐다. 답변에는 "전년 대비 24% 증가"라고 적혀 있는데, 카드로 표시된 출처 페이지를 열어보면 24%라는 숫자가 어디에도 없는 식이었다. 비슷한 케이스를 한 주 안에 세 번 봤다.

출처 페이지가 실제 근거가 아닌 경우, 또는 근거이긴 한데 다른 맥락에서 인용된 경우가 섞여 있었다. AI Overviews 답변이 통째로 틀린 게 아니라, "정확히 어디서 왔는지 추적이 어려운 상태"가 자주 발생했다는 표현이 적절해 보인다.

검수자 입장에서는 결국 모든 사실 주장을 원문에서 직접 확인해야 했다. AI 답변은 키워드 힌트 정도로 축소된 셈이었다. 절약된 시간은 처음 기대했던 40%가 아니라 10~15% 안팎으로 줄었다.

같은 질문, 다른 답변

결국, 같은 질문을 다음 날 다시 넣으면 답이 미묘하게 달라지는 일이 잦았다. 문장 구조만 바뀌는 거면 그러려니 했겠는데, 인용 수치나 출처 페이지가 달라지는 경우가 있었다.

검수 기록을 남기려면 답변을 통째로 캡처해두는 수밖에 없었다. 어제 본 답변과 오늘 본 답변이 다르면, 어떤 걸 기준 자료로 인용했는지 사후에 추적이 안 된다. 이 부분이 운영 관점에서 가장 까다로운 지점으로 보였다.

출처 표기가 뜻하는 게 뭔지 모호하다

그래서, 출처 카드가 붙어 있어도 그게 "이 답변의 근거"라는 의미인지 "이 주제에 관련된 페이지"라는 의미인지 명확하지 않았다. AI Overviews의 공식 도움말 페이지를 봐도 이 부분은 다소 모호하게 처리돼 있다(작성 시점 기준).

이게 단순한 UX 문제가 아니라, 글 후반부에 나올 법적 책임 논의와 직결된 지점이라는 걸 그때는 깊이 인지하지 못했다.

실험 6주차, 독일 판례 보도가 떴다

한편, 6주차쯤 외신을 통해 독일 법원에서 Google이 AI Overviews 결과에 대해 일정 부분 책임을 진다는 취지의 판단을 내렸다는 보도가 흘러나왔다. 정확한 판결문은 작성 시점 기준 영문 번역본 일부만 공개돼 있고, 한국어 번역본은 보지 못했다.

즉, 복수 매체가 전한 골자를 정리하면 다음과 같이 읽혔다. AI가 생성한 답변이 특정인이나 사업체에 관해 사실과 다른 진술을 포함했을 때, "AI가 작성했다"는 사실만으로 면책되지 않는다는 게 요지로 알려져 있다. EU의 디지털서비스법(DSA)과 기존 출판물 책임 원칙이 함께 언급됐다는 보도가 있었다.

판결의 정확한 사건 번호나 원고 측 세부는 확인하지 못했기 때문에 여기서는 단정하지 않겠다. 중요한 흐름은 두 가지로 읽힌다.

반면, 첫째, "AI 답변에 대해 플랫폼이 책임에서 자유롭지 않다"는 신호가 EU 회원국 법원에서 명시적으로 나왔다는 점이다. 둘째, 이 신호가 미국 안의 비슷한 소송들과 맞물려 글로벌 흐름으로 굳어질 가능성을 시사한다는 점이다.

EU AI Act와 묶어 보면

따라서, EU AI Act는 2024년 발효된 종합 AI 규제 프레임워크다. 일반 목적 AI(GPAI) 조항이 2025년 8월부터 단계적으로 적용되고 있다고 알려져 있다. AI Overviews 같은 생성형 검색 서비스가 이 프레임워크의 어디에 정확히 포지셔닝되는지는 아직 사례가 충분히 쌓이지 않아 보인다.

법조계 분석 글들을 몇 개 훑어보면 공통적으로 짚는 지점이 있다. 생성형 검색 결과는 단순 호스팅(safe harbor)에 해당하지 않고, 일종의 출판 행위로 볼 여지가 크다는 시각이다. 사용자가 입력한 콘텐츠를 그대로 보여주는 게 아니라 모델이 새로 합성한 텍스트이기 때문이다.

이 시각이 법정에서 어떻게 정착될지는 더 지켜봐야 한다. 다만 "AI 답변이 잘못됐어도 우리는 알고리즘일 뿐"이라는 방어 논리가 자동으로 먹히지 않는 시점에 들어선 것으로 보인다.

내부 회의 안건에 오르다

실제로, 판례 보도가 운영 회의 안건에 올라간 게 7주차였다. 영문 콘텐츠 안에 AI Overviews 요약을 인용 자료로 쓰는 게 적절한가에 대한 내부 토론이 길게 이어졌다.

여기서 한 가지 관점 전환이 일어났다. 우리는 검색 결과의 피인용자가 될 수도 있고, 동시에 그 결과를 인용해서 글을 쓰는 작성자이기도 했다. 양쪽 입장에서의 리스크를 같이 봐야 한다는 의견이 나왔다.

반면, 자기 사이트가 AI 검색의 출처 카드로 노출됐을 때, 그 답변이 자기 글과 다른 방향으로 요약됐다면 어떻게 대응할 것인가. 이 케이스는 작성자 입장에서 사실상 대응 수단이 거의 없다는 게 회의에서 모인 결론이었다.

운영 방식이 바뀐 지점

이처럼, 판례 보도 이후 내부 합의로 바꾼 게 몇 가지 있다.

먼저 AI Overviews 답변을 콘텐츠 안에 직접 인용하지 않기로 했다. 인용이 필요하면 무조건 원문 페이지를 직접 열어서 거기서 인용한다. 이 원칙은 사실 실험 4주차쯤 자연스럽게 자리잡고 있던 걸 보도 이후 명문화한 형태다.

검수 로그 포맷도 손봤다. 어떤 AI 검색 결과를 1차 컨텍스트로 참고했는지, 그 시점의 답변을 어떻게 보존했는지 기록한다. 사후에 "이 글의 근거가 어디서 왔는지" 추적이 가능해야 한다는 요구를 운영 매뉴얼에 적었다.

항목 기존 운영 변경 후
AI 검색 답변 직접 인용 일부 허용 금지
검수 로그에 AI 사용 기록 선택 필수
1차 자료 원문 확인 검수자 재량 모든 사실 주장에 필수
답변 캡처 보존 기간 없음 12개월

따라서, 캡처 12개월은 길게 잡은 편이라고 본다. 운영 부담은 늘지만, 사후 검증 요청이 들어왔을 때를 대비하는 게 더 무겁다고 판단했다.

이처럼, 작성자 교육도 한 차례 다시 했다. 두 가지가 핵심이었다. AI 검색 답변을 "팩트"로 받아들이지 말 것. 답변에 들어간 모든 고유명사, 수치, 일자는 원문 확인 없이 글에 옮기지 말 것.

추가로 사내 위키에 "AI 검색 출처가 모호할 때의 처리 순서"를 한 페이지 분량으로 정리해 올렸다. 답변에 인용된 출처를 클릭해서 해당 수치가 그 페이지에 실제로 있는지, 어떤 맥락에서 쓰였는지 두 단계로 확인하는 흐름이다. 짧지만 이게 있고 없고가 검수자 사이의 일관성을 꽤 좌우한다.

AI 검색 법적 리스크를 어떻게 바라볼 것인가

결국, 여기서부터는 검토 과정에서 정리한 개인적 견해다. 일반론으로 받아들이지 말고 한 작은 팀의 운영 관점으로 읽어주면 좋겠다.

AI 검색 결과에 대한 책임이 어디까지인지의 논의는 한국에서도 시간 문제로 보인다. 한국에서 AI Overviews가 정식 도입되는 시점에 비슷한 논쟁이 따라올 가능성이 있다는 게 개인적 추측이다.

반면, 콘텐츠 운영자 입장에서 실질적으로 고민할 지점은 두 갈래로 보인다.

특히, 첫째는 인용 책임이다. AI 검색 답변을 그대로 옮긴 콘텐츠가 명예훼손이나 허위사실 유포로 문제 되면 누가 책임을 지는가. 인용한 매체인가, 검색 플랫폼인가. 한국 법원이 이걸 어떻게 정리할지는 아직 사례가 쌓이지 않아 모르겠다.

둘째는 피인용 대응이다. 자기 사이트가 AI 검색의 출처 카드로 노출됐을 때, 그 답변이 자기 글과 다른 방향으로 요약됐다면 어떻게 대응할 것인가. 후자가 특히 곤란하다.

물론, 자기 글이 의도와 다르게 인용된 채 검색 결과 상단에 뜨면, 정정 요청을 어디에 어떻게 넣어야 할지 명확한 창구가 보이지 않는다. Google에 신고 양식이 있긴 한데, 처리 결과나 처리 기간에 대한 공식 SLA는 찾지 못했다.

작은 사이트가 손에 잡을 수 있는 것

또한, 큰 매체사는 법무팀이 알아서 한다지만, 1인 운영 블로그나 작은 팀이 할 수 있는 건 제한적이다. 현실적으로 두 가지 정도가 손에 잡힌다.

  • 내 글이 어떻게 인용되는지 주기적 모니터링 (월 1회 정도라도)
  • 글 안에 핵심 주장의 근거와 출처를 명시적으로 박아두기

두 번째는 AI 검색이 글을 요약할 때 근거 정보까지 함께 끌고 가도록 유도하는 효과가 일부 있는 것 같다. 정량 검증은 못 했고 체감 수준의 인상이다. 다만 본문에 "출처: X, 2025-12 기준" 같은 표기를 박아두면 요약된 답변 안에 그 표기가 같이 살아남는 비율이 더 높아 보였다.

사후 대응보다 사전 기록이 낫다

법적 리스크 얘기가 나오면 보통 "문제 생기면 어떻게 할 거냐"로 흐른다. 실무 관점에서는 그보다 "문제가 생겼을 때 우리가 무엇을 가지고 있을 거냐"가 더 중요해 보인다.

근거 자료의 원문 캡처, 검수 시점의 AI 답변 캡처, 작성자와 검수자 사이의 결정 메모. 이 세 가지가 남아 있으면 사후 검증 요청에 1주일 안에 답할 수 있다. 이게 없으면 답할 수가 없다. 이번 운영 변경의 핵심은 결국 이 사전 기록 체계였다고 본다.

작은 결론과 다음 분기

예를 들어, 실험 결과를 한 줄로 적자면, 영문 콘텐츠 검수에서 AI 검색의 비중을 줄이고 보조 도구 위치에 고정한 게 이번 분기 결정이다. 검수자 병목은 다른 방식으로 푼다. 외주 1차 검수 도입을 다음 분기 안건으로 올려뒀다.

실제로, 판례 자체보다 판례가 신호한 흐름이 더 무거웠다. AI가 생성한 정보를 기관이 어떻게 책임지게 할 것인가의 논의가 본격적으로 시작된 거다. 이 흐름은 EU에서 시작해서 다른 지역으로 번질 가능성이 높아 보인다.

물론, 당장 손에 잡힐 행동 셋을 정리하자면 이렇다. AI 검색 답변을 본문에 직접 인용하지 않기, 모든 사실 주장은 원문 확인 후 인용하기, 검수 시점의 AI 답변을 캡처해서 일정 기간 보존하기. 작은 팀이라도 이 셋은 큰 비용 없이 도입할 수 있다.

다음에는 사내 RAG 기반 1차 검수 보조 도구를 작게 만들어볼 생각이다. 외부 AI 검색의 답변을 가져오는 대신, 회사 내부에서 통제 가능한 데이터셋만 가지고 비슷한 보조 기능을 흉내내는 방향으로 가본다.

관련 글