Editor’s Note
○ AI 업계가 왜 딥시크에 주목하고 있는지, 어떤 논란이 뒤따르고 있는지 '딥시크 쇼크'의 모든 것을 정리했습니다.
쇼크에 빠지다
오픈 AI의 생성 AI 모델인 ‘챗 GPT’가 세상에 등장하며 AI 붐이 일어난 지 이제 겨우 2년 남짓인데, 전 세계가 또 한 번 발칵 뒤집혔습니다. 지난달 중국의 AI 스타트업 딥시크(DeepSeek)가 사고 능력을 가진 새로운 생성 AI 모델 ‘R1’을 발표한 건데요.
‘R1’은 미국 수학경시대회 벤치마크 테스트와 코팅 테스트에서 오픈 AI의 추론 특화 모델이자 최초의 사고력을 가진 모델 ‘o1’의 성능을 훌쩍 넘어서는 정확도를 기록했어요. 게다가 ‘R1을’ 개발하는 데 들어간 비용이 챗 GPT 개발비의 1/10 수준에 불과하고, 엔비디아의 중국 수출용 저성능 칩을 사용한 것으로 알려졌죠.
‘이 비용에 이런 성능이 가능한데 심지어 무료로 쓸 수 있다고?’ 거대 언어 모델(LLM)을 개발하기 위해 고성능 반도체 칩을 개발하고, AI 전용 데이터센터를 확보하기 위해 막대한 시간과 비용을 투자하던 미국 빅테크의 방향성에 반하는 R1의 등장으로 AI 업계는 말 그대로 딥시크 쇼크에 빠졌어요. 딥시크의 등장으로 AI 대장 엔비디아의 주가는 17% 폭락했고, 시가총액 5,890달러(847조 원)가 증발했을 정도.
메기의 등장
미국 빅테크 기업들이 주축이던 AI 업계에 혜성처럼 등장한 딥시크는 2023년 5월 중국에 설립된 AI 스타트업이에요. 일반인들에게는 생소하지만, 2023년 11월부터 AI 모델을 출시하면서 이미 중국에서는 유명했고, 실리콘밸리에서도 눈여겨보던 기업이죠.
파란을 일으킨 딥시크의 CEO 량원펑은 유학 경험이 없는 중국 본토의 기술 인재로 투자회사를 운영하다 생성 AI 모델 개발사업에 뛰어든 것으로 알려졌어요. 투자회사를 운영하며 벌어둔 자금을 천재 개발자들을 영입하는 데 사용하고 기술뿐 아니라 AI의 언어 능력을 향상시키기 위해 기술과 관계없이 인문학에 배경을 가진 인재 영입에도 힘썼다고 해요.
“중국의 AI와 미국 사이에 1~2년 격차가 있다고 말하지만, 실제 갭은 독창성과 모방의 차이”일뿐이고 “이를 바꾸지 못하면 중국은 영원히 추종자에 머물 것”이라고 매체 인터뷰에서 목소리를 내며 존재감을 나타내기도 했어요.
딥시크의 성공 비결?
🔍 누구나 개발 가능한 오픈소스
전문가들은 오픈 AI의 챗 GPT를 비롯해 그동안 빅테크들이 선보인 생성 AI 모델 사이에서 딥시크 R1이 경쟁력을 가질 수 있었던 가장 큰 이유를 오픈소스 정책으로 보고 있어요.
오픈소스는 소프트웨어나 프로그램 개발에 필요한 소스코드, 설계도 등을 누구에게나 공개하는 것을 말해요. 딥시크는 개발한 모든 모델과 학습 데이터를 무료로 전 세계에 공개하기 때문에 누구나 제약 없이 코드를 열람할 수 있죠. AI 모델 구동에 필요한 모든 코드를 일일이 개발할 필요 없이, 이미 검증된 코드를 사용할 수 있어 짧은 시간 내에 고성능의 모델을 완성할 수 있었을 거라는 분석이에요.
🔍 족집게형 ‘전문가 혼합’ 기법
사실 오픈 AI를 제외한 메타, 데이터브릭스 등 기업들도 오픈소스 방식을 채택하고 있어 오픈소스가 절대적인 딥시크의 성공 요인이라고 볼 수는 없어요. 딥시크가 공개한 R1 모델의 논문에 따르면 미국과 기술격차를 줄이기 위해 새로운 기법을 적용한 것을 확인할 수 있는데, 가장 대표적으로 ‘전문가 혼합 기법(MoE, Sparse Mixture of Experts)’을 들 수 있어요.
전문가 혼합 기법은 특정 작업에 특화된 여러 개의 LLM을 한 데 모은 뒤에, 작업의 종류에 따라 필요한 LLM을 활성화하는 방식이에요. 쉽게 말해 수학에 대한 질문을 던지면 수학과 관련된 LLM만 작동하고 영어에 관련된 질문을 던지면 영어와 관련된 LLM만 작동하는 것이죠. 때문에 메모리 사용량은 줄이고, 연산 능력을 높일 수 있게 됐어요. 실제로 R1 모델의 매개변수는 6,710억 개 수준이지만 질문에 답할 때 활성화되는 건 340억 개에 불과하다고 해요.
뒤따르는 논란
🔍 실제로는 더 많은 비용이 들었을 거야
일각에서는 딥시크가 공개한 개발 비용이 세간의 주목을 받기 위해 과장된 것이라고 주장하고 있어요. 딥시크가 밝힌 V3 모델 개발비용 557만 달러(82억)는 사전 훈련에 들어간 비용만을 의미할 뿐 GPU 도입이나 연구개발 등 총비용 개념이 아니고 정작 ‘R1’의 비용은 공개하지 않았기 때문인데요. 게다가 딥시크가 중국 내 스타트업 중 최고 수준의 연봉을 제시하며 인재를 영입했음을 고려했을 때 인건비 등 모든 요소를 고려하면 실제 비용은 딥시크가 발표한 개발 비용 82억의 50배에 달할 것이라는 추측이에요.
🔍 개인정보가 유출될 수 있어
딥시크가 R1을 출시한 지 18일 만에 1,600만 건의 다운로드를 기록하며 전 세계 140개국 앱스토어에서 다운로드 1위를 기록했어요. 하지만 딥시크 앱을 통해 제공된 개인정보가 중국 서버에 저장되기 때문에 데이터 유출에 촉각을 곤두세우고 있죠. 실제로 딥시크가 수집하는 개인정보는 빅테크의 AI 모델보다 광범위한데, 이름, 메일 주소, IP, 쿠키 정보 외에 키보드 입력 패턴, 리듬까지 자동 수집하는 것으로 확인됐어요.
이에 미국은 의회, 국방부, 로펌 등 수백 개 기관과 기업에 딥시크 접속을 차단했고, 이탈리아도 자국 내 딥시크 앱 다운로드를 금지한 상황. 영국, 독일, 프랑스, 일본, 대만 등도 각종 개인 정보와 민감한 데이터가 중국으로 흘러 들어가 국가 안보를 위태롭게 할 수 있음을 인지하고 규제책을 검토하고 있어요.
🔍 오픈 AI 데이터 도용한 거 아니야?
미국에서는 딥시크가 오픈 AI의 데이터를 허가 없이 도용한 게 아니냐는 의혹까지 제기했어요. 오픈 AI의 데이터를 바탕으로 유사한 모델을 더 빠르고, 저렴하게 만든 게 아니냐는 주장인데요. 오픈 AI는 중국 기반 기관들이 자사 제품에서 대량의 데이터를 빼내는 정황을 확인했다며 AI 도구 복제 시도가 있었는지 MS와 함께 조사를 진행 중이라고 합니다.
또 한 번의 트리거
오픈 AI는 AI 검색 및 연구 도구인 ‘딥 리서치’를 서둘러 공개했고, 챗GPT 무료 사용자에게도 최신형 LLM인 o3-미니 모델을 제공하겠다고 발표했어요. 딥시크를 견제하기 위해 기존의 전략을 수정하는 모습이라는 분석에 무게가 실리는 한편, AWS와 MS는 딥시크의 R1을 자사 서비스에 도입하겠다고 밝혔는데요.
특히 MS는 딥시크의 오픈 AI 기술 도용 여부에 대한 조사를 진행하면서도 딥시크를 도입하겠다는 입장을 밝힌 터라, 오픈 AI 의존도를 줄이려는 빅테크들이 새로운 판도를 형성하는 게 아니냐는 해석도 나오고 있는 상황이에요.
딥시크에 대한 관심만큼 수많은 논란이 뒤따르고 있지만 챗 GPT가 불러온 AI 광풍에 이어 딥시크가 또 한 번의 AI 트리거가 될 거라는 사실에는 논란의 여지가 없어 보입니다.
___
· 본 게시글은 신세계아이앤씨에 저작권이 있습니다.
· 본 게시글은 사전 동의 없는 2차 가공 및 영리적 이용을 금지합니다.
· 콘텐츠 사용 시 ‘신세계아이앤씨’로 출처 표기 부탁드립니다.