나도 모르게 전쟁용 AI를 만들고 있었다면?
AI가 세상을 ‘이해’하려면 무엇이 필요할까요? 정답은 데이터입니다.
AI 모델은 스스로 세상을 배우지 않습니다. 대신 훈련 데이터(training data)라고 불리는 방대한 자료를 통해 패턴을 학습합니다. 사진 속 사물이 무엇인지, 음성이 어떤 언어인지, 문장의 의미가 무엇인지 같은 정보를 수백만 개의 예시를 통해 익히는 방식입니다.
문제는 이 데이터가 자연 상태로 존재하지 않는다는 것입니다. AI가 학습할 수 있는 형태로 만들려면 인간이 직접 데이터를 정리해야 합니다. 사진 속 사물에 이름을 붙이고, 음성을 텍스트로 옮기고, 영상 속 행동을 분류하는 작업이 필요합니다. 이런 작업을 데이터 라벨링(data labeling)이라고 부릅니다.
현재 AI 산업 뒤에는 이런 작업을 수행하는 수백만 명의 데이터 노동자가 있습니다.
그런데 최근, 영국의 탐사보도 전문 매체 'TBIJ(The Bureau of Investigative Journalism)'이 꽤 불편한 사실을 드러냈습니다🔍
🕵️ 에펜(Appen)과 미 공군 비밀부대
호주에서 설립된 에펜(Appen)은 AI 학습용 데이터를 공급하는 대표적인 기업입니다. 500개 이상의 언어를 다루는 노동자 100만 명을 확보하고 있고, 구글·마이크로소프트 같은 빅테크 기업에 데이터를 납품한다고 알려져 있지요.
TBIJ의 조사에 따르면, 2015년부터 2017년까지 에펜은 미 공군의 비밀부대인 '빅사파리(Big Safari)' 관련 작업에 노동자들을 투입했습니다.
빅사파리는 미군의 첨단 정찰·감시 시스템 개발을 담당하는 부대입니다. 대표적으로 리벳조인트(Rivet Joint)라는 최첨단 정찰기가 있는데, 이 정찰기를 띄우면 250킬로미터 거리에서 적의 통신을 가로채고 적의 위치를 실시간으로 파악할 수 있습니다.
에펜의 노동자들은 이 리벳조인트의 감시용 AI 시스템 구축에 필요한 데이터 작업을 수행했습니다. 문제는 노동자들이 그 사실을 전혀 몰랐다는 점입니다.
TBIJ의 조사에 따르면 2005년부터 2020년까지 에펜이 군사 기구와 체결한 계약의 규모만 1,700만 달러에 달합니다.

🎙️ 음성을 타이핑했을 뿐인데…
이스마일(가명)은 2015년부터 2018년 사이, 케냐 북서부 카쿠마 난민수용소에서 에펜의 작업을 수행했습니다. 그가 맡은 일은 단순했습니다. 소말리아어 뉴스 방송이나 공개 회의 같은 음성을 듣고 정확히 타이핑하는 일이었죠.
이런 작업은 AI 개발에서 흔히 사용됩니다. 음성을 텍스트로 바꾼 데이터를 이용해 '음성 인식 모델(speech recognition model)'을 훈련하기 때문입니다.
이스마일은 누가 이 작업을 발주했는지 알지 못했습니다.
TBIJ가 파헤친 내용을 보면, 에펜은 소말리아의 전화통화 데이터베이스를 구매하는 국방 계약을 최소 2건 체결했습니다. 목적은 소말리아어 음성인식 시스템 구축이었고요.
미군은 2007년부터 소말리아에서 군사 작전을 수행하고 있고, 분쟁감시기구 에어워(Airwars)에 따르면 그 과정에서 최소 93명, 최대 170명의 민간인이 사망했습니다.
이스마일이 타이핑한 음성이 정확히 어디에 쓰였는지는 여전히 불분명합니다. 하지만 그가 이 연결고리를 알았다면, 이 작업을 계속했을까요?
👣 사막의 발자국을 찾다가
비슷한 이야기는 또 있습니다.
DAIR(분산AI 연구소)의 연구원 크리스탈 카우프만은 2015년 건강 문제로 집에서 할 수 있는 일을 찾다가 아마존 머캐니컬 터크에 가입했습니다.
지질학 전공인 카우프만은 지오하이브(GeoHIVE)라는 발주자와 연결되어 위성·항공 이미지를 분석하는 작업을 받았습니다.
이미지 속에서 야생동물, 갈라파고스의 거북, 미국 동네의 태양광 패널 등과 같은 대상을 찾는 일이었어요. 환경 보호나 연구에 기여하는 느낌을 받아 좋은 일을 한다는 기분이 들었다고 합니다.
그런데 어느 날, 갑자기 작업 대상이 ‘국경 횡단 지점 표시’로 바뀌었습니다🏜️ 사막 지형에서 발자국과 바퀴 자국을 표시하는 일을 하고 사진 1세트(10~15장)당 0.25~0.65달러를 받는 조건이었어요.
카우프만은 몇 장 하다가 손놀림을 멈췄습니다. 그 작업이 "사람들을 돕는 게 아니라 체포하는 데 쓰일 것 같은 불길한 느낌"이 들었거든요.
이후 조사해보니 지오하이브는 위성데이터 기업 맥사르(Maxar Intelligence)의 자회사였고, 맥사르는 미 국토안보부·국방부와 계약을 맺고 있었어요.
나는 미국 정부를 위해 일하겠다고 지원한 적이 없어요. - 크리스탈 카우프만
⚡ 과거의 일이 아니다
2025년 3월, 스케일 AI는 미 국방부와 선더포지(Thunderforge) 프로젝트 계약을 체결했습니다. ‘선더’는 천둥, ‘포지’는 대장간. 전투 계획을 천둥처럼 빠르게 만들어낸다는 뜻이 담겨 있습니다.
선더포지는 AI가 바로 활용 가능한 데이터를 공급해서 함정과 항공기의 이동 계획을 자동으로 수립하는 프로젝트입니다. 계약 규모는 4,000만 달러. 이 프로젝트에 필요한 학습 데이터는 스케일 AI 자회사 리모태스크(Remotasks)를 통해 아프리카 등지의 노동자들이 제작하고 있습니다.
현재와 같은 구조라면, 어떤 데이터 노동자는 자신이 동의하지 않는 팔레스타인 폭격이나 베네수엘라 공격에 기여하게 될 수도 있습니다.
💬 우리가 아직 논의하지 않은 문제
AI 산업은 빠르게 성장하고 있습니다. 하지만 그 기반이 되는 데이터 노동의 윤리 기준은 거의 논의되지 않았습니다.
AI 기업들은 외주 플랫폼을 통해 데이터를 생산하고, 플랫폼은 다시 전 세계의 단기 노동자들에게 작업을 나눕니다. 이런 여러 단계의 구조 속에서 실제 작업을 수행하는 사람들은 자신의 노동이 어디에 사용되는지 알기 어렵습니다.
적어도 무기 시스템이나 군사 정보, 감시 기술에 사용될 가능성이 있는 데이터 작업이라면, 노동자에게 작업의 목적을 사전에 알리고 작업을 거부할 권리를 보장해야 하지 않을까요?
후원 계좌(일시, 정기후원 모두 가능)
우리은행 1006-701-498815 더삶(the삶)