블로그

딥시크의 탈출 ai 열풍은 다시 큰 파도를 일으킬 것인가?

업데이트 시간: 2 10, 2025    독자층: 46

딥시크의 탈출 ai 열풍은 다시 큰 파도를 일으킬 것인가?

최근 들어 deepseek는 과학 기술의 중심에 서 있다.마방진 산하의 인공지능 창업회사인 심도탐구회사가 내놓은 ai 대형모델은 한때 여러 앱스토어 전 세계 다운로드 순위표의 1위를 차지하기도 했다.딥시크의 폭발적인 진출은 자본시장의 열기에 불붙었으며 춘절 이후 딥시크개념, 클라우드컴퓨팅 등 지수는 상승폭이 10%를 넘는 고공 행진을 거듭했다. 컴퓨터, 미디어 부문도 중신 1 급 업종 중 상승폭이 앞자리를 차지했다.
deepseek의 돌파는 주로 저비용과 추리능력에서 나타났다.v3 모델이 트레이닝 비용과 계산 효율성에 있어서 상당한 진전을 보이고 있는 반면, r1 모델은 fp8, moe, mla, ptx 등과 같은 프로젝트 최적화를 통해 계산 자원 이용률을 극대화하고 비용을 대폭 절감하는 트레이닝 추론 모델의 새로운 방법을 제시하고 있다.수학, 코드 및 자연어 추론 작업에 있어서 openai o1과 비슷한 성능을 가지고 있다.
deepseek-r1 이전에는 rlhf (reinforcement learning from humanfeedback) 라는 인간 피드백에 기반한 강화학습) 모델이 널리 사용되었는데,이 모델은 인간이 작성한 수많은 양질의 질문서를 사용하여"어떤 것이 좋은 답인가"를 알아냈다.마치 옆에서 문제를 지도하는 선생님이 있는 것 같았다.이런 방법은 비록 효과적이기는 하지만 한계가 있다.r1 모델은 rlhf의 hf (인간 피드백) 부분을 돌파적으로 포기하고, 순수한 rl (집중 학습) 만을 남겨 놓고, 교사의 지도에 의존하지 않고 스스로 머리를 써서 시행착오에서 학습하는 것과 같다.
구체적으로, r1 모형의 강화 학습 모형은 두 개의"보상 함수"를 설정한다.
1. 정답을 찾을 때마다 자신에게 상을 준다.이 해답은 외부 도구를 통해 검증되며, 확실히 정확하다.
사고과정함수:답안이 꼭 정확하지 않더라도 추리 과정의 논리가 명확하고 절차가 합리적이라면 자신에게 상을 줄 수 있다.이는 마치 문제를 풀 때 비록 마지막 답안은 틀렸지만 사고방식은 아주 좋으므로 격려할만하다.
이런 방식을 통해 r1 모형은 끊임없이 부동한 문제풀이방법을 시도하고나서이 두가지 장려규칙에 근거하여 자신의 수행상황을 평가하게 되는데 최종적으로 어떤 방법이 더욱 효과적이고 어떤 추리절차가 더욱 합리한가를 배우게 되며 최종적으로 갈수록 총명해지고 추리능력도 제고된다.가장 중요한 것은 r1 모델은이 과정에서 많은 데이터가 필요하지 않으며 자가 학습과 최적화를 통해 능력을 향상시킨다.동시에 오픈소스로 모델의 평등권을 실현하여 오픈소스모델과 페쇄소스모형의 기술격차를 줄였으며 중국과 미국 인공지능 사이의 기술격차도 줄였다.
이번 ai 상황과 미래의 잠재적 기회에 대해 deepseek의 폭발적인 인기는 전 세계 인공지능 분야의 미래 발전이 더욱 다양할 수 있음을 의미하는 동시에, 대규모 모델 원가 하락은 인공지능 응용 분야의 폐쇄적 상업화 고리 형성을 가속화할 것으로 예상된다.deepseek는 인공지능 응용 착륙을 가속화하고 후방 훈련 및 추론 기반 컴퓨팅 파워 수요의 폭발적인 성장을 이끌 것으로 기대된다.추산력 판의 후속 구조상 추산력의 수요 비중이 더욱 증가할 것으로 예상되어 추산력 칩과 단측 산력에 호재가 되고 있다.
반면 ai 스타트업들은 운영패러다임의 변화를 겪게 된다. 비싼 gpu 클러스터에 의존해 온 ai 기업들은 비용 부담 때문에 파산 위기에 처할 수도 있다.이에 따라 중고 시장의 gpu 공급량이 크게 늘어나게 되고 중소 ai 업체들은 가격이 훨씬 싼 저가 gpu를 조달할 가능성이 크다.하드웨어 수요도 구조적인 변화를 겪을 것이다. 훈련 위주의 연산 수요가 지난해부터 추리 쪽으로 바뀌고 있다.이러한 추세는 앞으로도 지속될 것으로 예상되며, 많은 중소 ai 기업들은 기본 모델을 훈련하는 대신 deepseek와 같은 오픈 소스 모델을 채택할 것이다.훈련시장에서 엔비디아의 주도적 위치도 재평가 받을 수 있다.