본문 바로가기
경제 인사이트

중국 AI 딥시크 등장 이슈 총정리

by 나우의경제노트 2025. 2. 7.
반응형
목록

1.개발비용이 효율적인 이유

2.다른기업들과 차별성

3.맺음말

 

딥시크

 

 

 

안녕하세요 나우의 경제노트입니다. 
연일 방송에 나오고 있는 '딥시크'에 대해서 혹시 알고 계신가요?
최근 중국의 인공지능(AI)스타트업인 딥시크(DeepSeek)가 개발한 AI모델
'딥시크-V3'가 세계적으로 큰 주목을 받고 있습니다. 해당 모델은 미국의 오픈 AI가
개발한 챗GPT와도 유사한 성능을 보이면서 비용적 측면에서 훨씬 저렴하다는 장점으로
화제가 되오고 있습니다.

 


 

 

1. 개발비용이 효율적인 이유

 

1. 효율적인 개발 비용
딥시키는 엔비디아의 H800 GPU를 시간당 2달러에 임대하여 2개월 동안 모델을 훈련
시켰으며 총 개발 비용은 약557만6천달러, 우리나라돈으로 약 78억 8천만 원으로 추산됩니다.

​해당 금액은 메타의 최신 AI모델인 라마(Llama)3의 훈련비용의 10분의 1 수준인 것으로
밝혀져 큰 충격을 주고 있기도 합니다.

딥시크

 

여기서 핵심은 엔비디아의 GPU를 시간당 2달러에 임대하여 극한의 효율을
끌어올린 측면이라 할 수 있습니다.





2. 고성능 모델
딥시크-V3는 6710억 개의 파라미터를 가진 대규모 언어 모델로 독특한
혼잡 전문가(MoE) 아키텍처를 통해 연산 효율을 높이고 뛰어난 성능을 자랑합니다.

딥시크

 

 

 

MoE

Mixture of Experts로 혼합 전문가로 해석이 가능합니다.

이는 여러개의 하위 모델 중 일부만 활성화해서 특정작업을 처리하는 방식의 AI기술인데

이를 통해 모든 파라미터를 사용하는 Dense 모델보다 연산량을 줄이고 효율성을 높일 수 있는것이

특징입니다.

작업에 따라 가장 적합한 전문가 모델만 활성화 하기 때문에 대규모 AI모델에서도 비용과 성능의 균형을 유지할 수 있습니다.

 

 

 

 

 

2. 다른 기업들과 차별성

 

1. 기업의 시스템 문제
메타(META)와 같은 대기업은 보통 기존의 내부 시스템이나 구조를 기반으로
모델을 개발합니다. 자체적으로 보유한 데이터 센터, GPU장비, 연구팀 등이 있지만
이와 같은  고정비용이 크기 때문에 비용 절감이 어렵습니다.



메타와 같은 기업은 모델 훈련을 위해 자체적으로 수천 대의 고성능 GPU를
사용하지만 이런 장비와 시설 유지비용이 막대합니다.



그와 반대로 딥시크는 외부 리소스 (GPU 임대)를 적극 활용하여 초기 투자비용과
고정비용을 줄였기에 지금과 같은 효율성을 보여줄 수 있었던 것이죠.





 DENSE? MoE?
앞서 말했듯 MoE는 Mixture of Experts로서 모델의 모든 파라미터를
활성화하기보단 특정 작업에 필요한 전문가 파라미터만 활성화하여 연산량, GPU사용비를
절감할 수 있다는 건 잘 알겠는데...


DENSE는 기존 기업들이 많이 활용했던 방식으로서 밀집형 모델 구조를 뜻 합니다.

DENSE모델은 모든 파라미터를 활성화해서 연산량이 더 크긴 하지만 아키텍처가 비교적
단순하고 검증되어 있어서 개발과정에서의 리스크가 적습니다.

반대로 MoE는 관리와 구현이 더 복잡하고 특정 상황에서 성능이 불안정 해질 수 있다는
리스크가 있다는 것입니다.









훈련 데이터와 최적화 알고리즘 효율화

앞선 이유 외에도 딥시크는 고품질의 데이터셋을 선별적으로 활용해 모델 훈련을 최적화
했습니다.


데이터의 품질을 높이면 더 적은 데이터로도 유사한 결과를 도출할 수 있으며
최적화 알고리즘을 사용해 모델 학습속도를 가속화하고 훈련과정에서 불필요한 반복작업을
줄이는 등 기업 내적으로 엄청난 노력을 통해 소요되는 모든 질량을 최적화시킨 것이
딥시크의 큰 장점으로 자리 잡습니다.

 

 


 

 

결론적으로 딥시크가 세계 AI시장에 큰 충격을 줄 수 있었던 이유는 아래와 같이 정리할 수 있습니다.

1.GPU 임대 방식의 활용과 비용 효율적인 칩 선택

2. MoE 아키텍쳐를 활용한 연산 최적화

3. 고품질 데이터와 최적화된 학습 알고리즘


4. 효율적인 훈련 기간 설계

 

 

 

 

 

3. 맺음말

딥시크 AI는 오픈소스 전략과 비용 효율적인 모델을 통해 AI 시장에 큰 영향을 미치고 있다고 생각합니다. GPT-4급 성능을 갖춘 DeepSeek-V3는 경쟁력을 입증하며, 글로벌 AI 패권 경쟁에서 중요한 변수로 작용할 가능성이 큽니다. 앞으로 오픈 AI, 구글 등 기존 강자들과의 경쟁이 더욱 치열해질 것으로 보입니다.