중국 AI 인재 자국 잔류, 실리콘밸리 인재 전쟁 끝나나

처음 잡았던 가설이 빗나간 이유
데이터 사이의 충돌을 어떻게 다뤘나
- 학부 국적과 현 소속의 차이
- DeepSeek 표본은 아직 들어가지 않았다
풀(Pull) 요인이 푸시(Push) 요인을 추월한 시점
한국 AI 팀 입장에서 이 데이터를 어떻게 읽나
- 가격 비교는 했는데 결정은 못 했다
통계 한 줄로 정리하려다 배운 것
언제 이 변화를 진지하게 반영해야 하나

$ python3 ai_talent_trend.py --source macropolo --year 2022
Top-tier AI researchers by country of undergrad (NeurIPS 2022 sample):
  China:    47%
  US:       18%
  Europe:   12%
  India:     5%
  Other:    18%

Where China-origin researchers work:
  USA:           38% (2019: 56%)
  China:         42% (2019: 34%)
  Other:         20% (2019: 10%)

[INFO] Significant reversal detected since 2019.
[WARN] Single-cause explanation likely insufficient.

따라서, 이 출력을 처음 봤을 때 손이 멈췄다. "중국 출신 AI 인재의 미국 잔류율 56% → 38%" 한 줄을 어떻게 풀어 써야 할지 감이 안 잡혔다. 출처는 MacroPolo Global AI Talent Tracker 2.0(2023년 6월 공개, NeurIPS 2022 채택 논문 표본 기준)이다. 같은 표본에서 학부를 중국에서 마친 톱티어 연구자 비중은 47%로 집계됐다(MacroPolo, 2023년 6월).

처음엔 "DeepSeek 충격" 한 단어로 묶으려 했다. 그런데 표본 시점이 DeepSeek-V3 공개(2024년 12월)보다 2년 이상 앞선다. 인재 이동은 이미 2022년에 방향을 틀고 있었고, DeepSeek은 결과지 원인이 아니라는 뜻이다. 이걸 한 줄로 정리하려다 실패한 기록을 남긴다.

처음 잡았던 가설이 빗나간 이유

가장 그럴듯한 첫 가설은 "미중 갈등 → H-1B 비자 위축 → 중국 인재 본국 귀환"이었다. 인과 관계가 깔끔하다. 그래서 1차로 이 프레임에 데이터를 끼워 맞춰봤다.

문제가 바로 드러났다. 2019년 → 2022년 사이 H-1B 신규 발급의 절대치가 폭락한 게 아니다. USCIS H-1B Employer Data Hub 기준 2019 회계연도 신규 승인 약 38만 건에서 2022 회계연도 약 44만 건으로 오히려 늘었다(USCIS H-1B Employer Data Hub). 인재 본국 귀환을 비자 정책 변수로만 설명하기엔 분모가 맞지 않는다.

또한, 두 번째로 시도한 게 "미국 빅테크 채용 축소"였다. 2022~2023년 메타·구글·아마존의 해고 뉴스가 매일 떴으니 자연스러운 의심이다. 그런데 같은 기간 AI/ML 직군 채용은 줄지 않았다. Indeed Hiring Lab 2024년 1월 리포트 기준 미국 전체 SWE 공고는 전년 대비 30% 이상 빠졌지만, AI/ML 특화 직군은 같은 시점 전년 대비 증가 영역에 머물렀다. 빅테크에서 잘린 일반 SWE와 톱티어 AI 연구자는 다른 시장에 있다.

세 번째 가설이 비교적 데이터에 맞았다. "중국 내 산업·연구 환경의 풀(pull) 요인이 강해졌다"는 쪽이다. 결정적 신호 두 개를 묶으면 윤곽이 잡힌다. 첫째, 중국 내 톱티어 연구자 흡수 기관이 2019년 칭화·베이징대 중심에서 2022년 화웨이·바이트댄스·텐센트로 확산됐다. 둘째, 미국 박사 학위 취득자의 귀국 비율이 1년 후 잔류율 기준 꾸준히 떨어졌다(NSF Survey of Earned Doctorates 2022 보고).

데이터 사이의 충돌을 어떻게 다뤘나

이처럼, 신뢰성을 흔드는 게 데이터 소스 간 수치 차이였다. 같은 "중국 출신 AI 연구자" 라벨인데도 정의가 다르면 결과가 달라진다.

지표	MacroPolo (2022 NeurIPS)	Paulson Institute (별도 분석)	Nature Index AI (2023)
표본 기준	채택 논문의 1저자 학부 국적	인용 상위 2% 연구자	저널 발표 기관 소속
중국 비중	47% (학부 기준)	약 26% (현 소속)	약 29% (현 소속)
미국 비중	18% (학부 기준)	약 36% (현 소속)	약 40% (현 소속)
시점	2022년 12월	2022년 누적	2023년 12월

세 데이터가 같은 방향을 가리키지만 절대값은 꽤 다르다. 학부 국적과 현 소속을 섞어 쓰면 "중국이 미국을 제쳤다"는 식의 자극적 결론이 쉽게 나온다. 그런데 이건 측정 단위를 바꾼 결과지 같은 척도 안에서의 역전이 아니다.

학부 국적과 현 소속의 차이

또한, "중국 출신"이 47%라는 건 어디서 박사를 했고 어디서 일하는지는 따지지 않는다. 미국에서 박사를 받고 미국 회사에서 일해도 학부가 중국이면 중국 출신으로 잡힌다. 반대로 "현 소속"으로 보면 미국이 여전히 단일 1위다. 둘을 섞어서 "중국이 이미 1위"라고 적은 기사를 여럿 봤는데, 표본 기준을 한 번만 확인하면 무너지는 주장이다.

DeepSeek 표본은 아직 들어가지 않았다

MacroPolo 2.0이 NeurIPS 2022 기준이라는 점이 중요하다. DeepSeek-V3(2024년 12월), DeepSeek-R1(2025년 1월), Qwen-2.5(2024년 9월) 등 최근 2년의 임팩트는 통계에 반영되기 전이다. 다음 트래커가 2025년 NeurIPS 표본으로 갱신되면 잔류율 38%가 더 떨어질 가능성이 높다는 게 개인적인 추정이다. 다만 수치를 미리 단정하는 건 위험하다.

풀(Pull) 요인이 푸시(Push) 요인을 추월한 시점

"중국이 인재를 못 빠져나가게 막는다"보다 "중국이 인재를 끌어당기는 환경을 만들었다"가 더 정확한 표현으로 보인다. 푸시(미국이 밀어내는 힘)보다 풀(중국이 끌어당기는 힘)이 강해진 시점이 2020~2022년 사이 어딘가다.

풀 요인 세 가지가 자주 거론된다. 첫째, 중국 내 AI 스타트업 평가액이 글로벌 톱 10 안에 복수 진입(Moonshot AI, Zhipu AI, MiniMax, 01.AI). 둘째, GPU 확보 경로가 우회로(중고 H100, 화웨이 Ascend 910B)로도 어느 정도 작동. 셋째, 위챗 기반 채용 네트워크에서 미국 박사 신규 졸업자에게 미국 대비 비슷한 수준의 패키지 제시가 가능해졌다(시니어 연구자 기준, 주거비 차이를 감안하면 실수령 기준 더 높은 경우도 있다는 보도).

따라서, 푸시 요인도 같이 작동했다. China Initiative(2018~2022) 종료 후에도 미국 대학 내 중국계 연구자에 대한 행정적 부담이 남았다는 보고가 여러 건 있다(MIT Technology Review, 2022-02-23 등 다수 매체 보도 종합). 비자 갱신 지연, 보안 클리어런스 검토 강화, 일부 분야 출판 제한 등이 누적적 효과를 냈다.

한국 AI 팀 입장에서 이 데이터를 어떻게 읽나

한국에서 AI 모델팀이나 응용 AI 팀을 운영한다면 이 추세는 두 가지 실무적 함의가 있다.

첫 번째는 채용 풀 자체의 재편이다. 과거에 미국에서 박사를 마친 중국계 연구자가 자연스럽게 미국 빅테크로 흘러갔다면, 그 흐름의 38%가 다른 경로로 빠지고 있다는 뜻이다. 이 중 일부는 중국으로, 일부는 싱가포르·UAE·캐나다 등 제3국으로 간다. 한국이 보이는 선택지에 들어가려면 일하는 환경 자체를 글로벌 표준에 맞춰야 한다(영문 코드베이스, 영문 회의, 출퇴근 자율성 등). 막연한 이야기가 아니라 실제로 NAVER Cloud나 카카오엔터프라이즈 일부 팀이 시도 중인 방식이다.

반면, 두 번째는 모델 선택지의 다변화다. 2024년 말 기준 한국 SaaS 제품이 LLM 통합을 결정할 때 사실상 OpenAI·Anthropic·Google 3사 + 오픈소스 Llama 정도가 후보였다. 2025년 들어 DeepSeek, Qwen이 가격·라이선스 양쪽에서 진지한 후보로 올라왔다. 단순히 "중국산이라 못 쓴다"고 컷오프하기엔 비용 차이가 크다. 사내 보안 정책과 데이터 거주성 요건을 먼저 정리한 뒤 케이스별로 판단할 영역이 됐다.

가격 비교는 했는데 결정은 못 했다

API 토큰 가격만 보면 DeepSeek-V3가 GPT-4o 대비 1/10 수준이다(2025년 1월 공식 가격 기준). 그런데 실제로 사내 RAG에 붙여보면 한국어 컨텍스트 처리에서 GPT-4o가 여전히 안정적이라는 게 체감이다. 정성 평가지 정량은 아니다. 이 부분은 더 돌려본 뒤에 정리할 계획이다.

통계 한 줄로 정리하려다 배운 것

이처럼, 처음에 잡았던 "DeepSeek 충격으로 중국 인재가 본국에 머문다"는 한 줄이 왜 틀렸는지 정리하면 이렇다. 트렌드는 DeepSeek보다 최소 2년 이상 앞섰고, 단일 원인(비자, 해고, 정치)으로 환원이 안 됐다. 풀과 푸시가 동시에 작동했고, 데이터 소스마다 측정 기준이 달라서 어떤 숫자를 쓰느냐로 결론이 흔들렸다.

같은 주제로 자료를 검색하다 인용된 수치가 35%, 47%, 26%로 다 다르게 나오면 십중팔구 측정 기준(학부 국적/현 소속/논문 채택 vs 인용)이 섞인 거다. 원본 보고서의 Methodology 섹션을 먼저 펴라. 5분이면 정리된다.

언제 이 변화를 진지하게 반영해야 하나

판단 기준을 실무 단위로 잘라본다.

중국발 오픈모델을 후보군에 넣어야 하는 상황

월 LLM 비용이 회사 인프라 예산의 5% 이상을 차지하기 시작했을 때
사내 데이터가 외부 API로 나가는 게 정책상 문제가 없거나, on-prem 배포가 가능한 경우
한국어 처리 비중이 50% 미만이고 영어/중국어 문서 처리가 중심일 때

아직 OpenAI/Anthropic 중심으로 가도 되는 상황

금융·의료·공공 등 데이터 거주성 규제가 강한 도메인
한국어 자연어 이해 정확도가 직접적인 제품 품질 지표인 경우(요약, 상담 등)
사내 보안 검토 절차가 6개월 이상 걸리는 조직

특히, 중국계 연구자 채용을 검토해볼 만한 상황

영문 기반 운영이 이미 정착된 팀이고, 비자 스폰서십 경험이 있는 경우
미국 박사 졸업자 중 본국 귀환 대신 제3국을 고려하는 풀이 늘었다는 점을 고려하면, 한국이 그 선택지에 들어가려면 패키지와 일하는 방식 둘 다 글로벌 표준이어야 한다

한편, 오늘 당장 할 수 있는 액션 세 가지로 좁히면 이렇다.

사내에서 쓰는 LLM 비용 리포트를 뽑아서 월간 추이를 그려본다. 5% 라인을 넘었다면 DeepSeek/Qwen 벤치마크를 한 번이라도 돌려본다.
채용 공고의 영문 버전 유무, 영문 코드리뷰 정착 여부를 점검한다. 둘 중 하나라도 빠져 있으면 글로벌 인재 풀에 노출 자체가 안 된다.
MacroPolo 차기 트래커 공개 일정(통상 격년)을 캘린더에 잡아둔다. 다음 표본은 2024 NeurIPS 기반이 될 가능성이 높고, 그때 가설을 한 번 더 검증한다.

즉, 수치 하나로 깔끔하게 정리되지 않는 주제다. 데이터를 더 들여다본 뒤에 가설을 갱신할 생각이다.

Ferrari + IBM이 AI로 F1 슈퍼팬 만드는 법 — 개인화 프로젝트 회고 – Ferrari + IBM이 노린 슈퍼팬 전략의 구조와, 비슷한 개인화 시스템을 3개월 운영하며 부딪힌 현실을 시간순으로 비교한다.
Cerebras IPO 108% 급등, AI 칩 투자 거품을 판단하는 5가지 기준 – Cerebras가 IPO 첫날 108% 급등하면서 NVIDIA 독점 구도에 균열이 보이기 시작했다. WSE-3가 H100을 대체할 수 있는…
Nvidia $40B AI 투자, 개발자 생태계에 실제로 뭐가 돌아오나 – Nvidia가 OpenAI, CoreWeave, 각국 sovereign AI에 쏟아붓는 투자 발표가 잇따른다. 막상 GPU 한 장 빌리려 …

중국 AI 인재 자국 잔류, 실리콘밸리 인재 전쟁 끝나나

목차

처음 잡았던 가설이 빗나간 이유

데이터 사이의 충돌을 어떻게 다뤘나

학부 국적과 현 소속의 차이

DeepSeek 표본은 아직 들어가지 않았다

풀(Pull) 요인이 푸시(Push) 요인을 추월한 시점

한국 AI 팀 입장에서 이 데이터를 어떻게 읽나

가격 비교는 했는데 결정은 못 했다

통계 한 줄로 정리하려다 배운 것

언제 이 변화를 진지하게 반영해야 하나

관련 글

목차

처음 잡았던 가설이 빗나간 이유

데이터 사이의 충돌을 어떻게 다뤘나

학부 국적과 현 소속의 차이

DeepSeek 표본은 아직 들어가지 않았다

풀(Pull) 요인이 푸시(Push) 요인을 추월한 시점

한국 AI 팀 입장에서 이 데이터를 어떻게 읽나

가격 비교는 했는데 결정은 못 했다

통계 한 줄로 정리하려다 배운 것

언제 이 변화를 진지하게 반영해야 하나

관련 글

More posts

Ferrari + IBM이 AI로 F1 슈퍼팬 만드는 법 — 개인화 프로젝트 회고

xAI 연 7조 태우는데 Anthropic은 월 1조 내며 쓰는 이유

Cerebras IPO 108% 급등, AI 칩 투자 거품을 판단하는 5가지 기준