검수요청.png검수요청.png

스텝펀

위키원
이동: 둘러보기, 검색
스텝펀(StepFun, 阶跃星辰)
스텝펀(StepFun, 阶跃星辰)
지앙다신(姜大昕) 스텝펀(StepFun, 阶跃星辰) CEO

스텝펀(StepFun, 阶跃星辰, jiē yuè xīng chén)은 중국의 대표적인 생성형 AI 유니콘 기업으로, 1000억 파라미터의 스텝-1, 1조 파라미터의 스텝-2 등 11개의 혁신적 AI 모델을 출시했다. 오픈콤패스 멀티모달 모델 평가에서 1위를 차지하며 기술력을 입증했으며, 최근 포테라 캐피털 주도로 수억 달러 투자를 유치함. AGI 실현을 위한 "단일 모달리티-다중 모달리티-세계 모델" 로드맵을 제시하고, 아이폰16과 통합된 지능형 비서 '웨원' 출시와 주요 기업들과의 전략적 협력을 통해 소비자·기업 시장을 동시에 공략하고 있다. 스텝펀은 마이크로소프트(MS) 수석 과학자 출신인 지앙다신(姜大昕, jiāng dà xīn) CEO가 2023년 4월 설립했다.

개요[편집]

스텝펀은 현재 중국의 생성형 AI 모델 분야에서 주목 받는 6개 유니콘 기업 중 하나임. 스텝펀은 공개된 기업 가치 평가나 투자 유치 소식이 전혀 없는 상황에서 유니콘 기업으로 인정받아 이목을 끌었다. 스텝펀은 치열한 'AI 모델 전쟁' 속에서 약 1년간 조용히 개발에만 매진하다가 2024년 3월에 공식적으로 모습을 드러냈다.

스텝펀은 '스텝(Step)' 시리즈를 통해 완성도 높은 AI 모델군을 선보이고 있다. 이는 스텝 시리즈는 스텝-1(Step-1) 1000억 파라미터 언어 모델, 스텝-1V(Step-1V) 1000억 파라미터 멀티모달 모델, 그리고 스텝-2(Step-2) 1조 파라미터 MoE(Mixture of Experts) 언어 모델 프리뷰 버전으로 구성되어 있다. 스텝-1V는 출시 직후 모델 평가 시스템인 오픈콤패스(OpenCompass) 멀티모달 모델 3월 순위에서 1위를 차지했으며, 알리바바(Alibaba)의 큐원-VL-맥스(QWen-VL-Max)와 구글(Google)의 제미나이 프로비전(GeminiProVision)이 각각 2, 3위를 기록했다.

스텝펀은 일반 소비자와 기업 고객을 동시에 공략하는 전략을 채택하고 있으며, 주력 방향은 일반 소비자 시장에 맞춰져 있다. 일반 소비자 시장에서는 다중 모달리티 지능형 비서 웨원(跃问)을 출시함. 웨원은 업무와 생활 문제 해결을 지원하고 콘텐츠 창작을 돕는데, 특히 '사진 촬영 질문' 기능은 아이폰16(iPhone 16) 카메라 제어 키에 통합된 최초의 AI 모델 응용 제품이다.

기업 시장에서는 파트너사들과 심층 협력을 통해 특화된 사용자 경험을 구축하고 있다. 중웬온라인(中文在线), 중국지망(中国知网) 등과 전략적 협력을 맺어 AI 모델 기술을 활용한 온라인 문학 창작과 대중 지식 서비스 분야를 개척하고 있다. 또한 스마트 단말기 영역에서는 아너(HONOR)와 오포(OPPO) 등 주요 스마트폰 제조사의 AI 모델 기술 파트너로 참여하고 있다.

주요 인물[편집]

지앙다신(姜大昕) CEO

스텝펀의 창립자이자 CEO인 지앙다신(姜大昕)은 마이크로소프트(MS) 글로벌 부사장과 마이크로소프트의 아시아 지역 최대 R&D 센터 중 하나인 STCA의 수석 과학자를 역임했음. 지앙다신 대표는 MS의 검색 엔진 빙(Bing), 음성 비서 코타나(Cortana), 클라우드 서비스 애저(Azure), 사무용 소프트웨어 마이크로소프트365(Microsoft 365) 등의 자연어 이해 시스템 개발을 주도한 바 있다.

지앙다신 CEO는 스케일링 법칙(Scaling Law)을 믿으며 가까운 미래에 10조와 100조 파라미터 규모의 발전이 있을 것으로 전망하고 있다. 다만 뇌신경과학 분야에서 스케일링 법칙과 멀티모달 외에도 AGI(범용 인공지능)로 가는 새로운 길을 발견할 가능성도 배제하지 않는다고 설명한다. 그는 16년간 MS에서의 경험을 통해 개방적 사고방식과 '성장형 사고방식(growth mindset)'을 자신의 핵심 가치로 확립했다고 덧붙였다.

지앙다신 CEO는 기존 검색 기술이 한계에 도달했다고 판단하고 있다. 부스팅 트리(Boosting Tree)부터 신경망, CNN(합성곱 신경망), RNN(순환 신경망), LSTM(장단기 메모리), BERT(자연어 처리 사전학습 기술)에 이르기까지 각 세대의 기술을 검색에 적용해왔으나, 챗GPT(ChatGPT)의 등장으로 검색 기술의 질적 변화가 필요하다고 인식하고 있으며, 스텝펀은 차세대 검색의 정의와 GPT-4와의 격차를 줄이는 것을 목표로 하고 있다고 밝혔다.

투자유치[편집]

스텝펀은 2024년 말 포테라 캐피털 주도로 수억 달러 투자를 유치했으며, 텐센트·치밍·샤오미도 참여했다. 멀티모달 API 사용량이 45배 증가한 가운데, 고급 추론 능력 향상과 소비자 중심 신제품 개발에 투자금을 활용할 계획이다.

이번 투자는 상하이 국영기업인 캐피털 인베스트먼트(Capital Investment)의 사모펀드 자회사인 포테라 캐피털(Fortera Capital)이 주도했으며, 이는 소셜 미디어 플랫폼 위챗(WeChat)을 통해 공개되었다.

이번 투자에는 중국의 게임 및 소셜 미디어 대기업인 텐센트 홀딩스(Tencent Holdings)와 틱톡(TikTok)의 모회사인 바이트댄스(ByteDance)의 초기 투자자였던 치밍 벤처 파트너스(Qiming Venture Partners), 그리고 샤오미(Xiaomi)가 참여했다. 구체적인 투자 금액은 공개되지 않았으나, 수억 달러 규모로 추정된다.

제품[편집]

스텝펀은 AGI 실현을 위한 명확한 기술 로드맵을 바탕으로 스텝 시리즈를 포함한 11개 혁신적 기반 모델을 성공적으로 출시했다. 아이폰16과 통합된 웨원 서비스로 소비자 시장을 선도하고, 주요 기업들과의 전략적 협력으로 다양한 산업 혁신을 이끌고 있다.

스텝펀은 모델 진화가 단일 모델에서 다중 모델, 그리고 세계 모델이라는 세 단계를 거칠 것이라고 설명한다. 지앙다신 CEO는 AGI 실현을 위한 기술 로드맵으로 "단일 모달리티 - 다중 모달리티 - 다중 모달리티의 통합적 이해와 생성 - 세계 모델 - AGI"를 제시하고 있다.

10개월 동안 스텝펀은 총 11개의 자체 개발 기반 모델을 출시했으며, 여기에는 스텝-1(Step-1), 스텝-2(Step-2), 스텝-1V(Step-1V), 스텝-1X(Step-1X), 스텝-1.5V(Step-1.5V), 스텝-비디오(Step-Video), 스텝-TTS-미니(Step-tts-mini), 스텝-ASR(Step-Asr), 스텝-1o 오디오(Step-1o Audio) 등이 포함된다. 특히 스텝-2(Step-2)는 중국 내 AI 스타트업이 최초로 출시한 1조 파라미터 규모의 모델이다.

스텝-2(Step-2)[편집]

1조개의 매개변수를 가진 대형언어모델(LLM)이다. 딥시크의 'V3' 모델이 6710억개의 매개변수로 오픈 소스 사상 최대 규모로 눈길을 끌었는데, 스텝-2는 그보다 2배나 큰 규모를 자랑한다.

스텝-2는 '전문가 혼합(MoE)' 아키텍처를 사용 텍스트 생성, 논리적 추론, 수학 문제 해결 등 다양한 작업에서 성능을 향상시키기 위해 설계됐다.

스텝펀은 1만6000 토큰의 컨텍스트 창을 지원하는 '스텝-2-16k' 버전을 통해 수학, 추론, 프로그래밍, 언어 이해, 지시 수행 및 데이터 분석 등을 평가하는 라이브벤치에서 중국 LLM 중 1위, 세계적으로는 5위를 기록했다.

특히, 복잡한 지시를 이해하고 수행하는 지시 수행 능력에서 86.57점을 기록하며 전체 1위를 차지했고, 58.67의 추론 점수와 54.86의 데이터 분석 점수를 얻었다. 그러나 코딩과 수학 분야에서는 각각 46.87과 48.88점에 그쳤다.

한편, 중국 LLM 중 가장 큰 모델은 2023년 공개된 화웨이의 '판구-시그마(PanGu-Σ)'로, 1조850억개의 매개변수를 가진 것으로 알려졌다. 스텝-2의 크기와 흡사하다.

라이브벤치 벤치마크 결과 (사진=스텝펀)

참고자료[편집]

같이 보기[편집]


  질문.png 이 문서는 로고 수정이 필요합니다.  

  검수요청.png검수요청.png 이 스텝펀 문서는 인공지능 기업에 관한 글로서 검토가 필요합니다. 위키 문서는 누구든지 자유롭게 편집할 수 있습니다. [편집]을 눌러 문서 내용을 검토·수정해 주세요.