중국의 스마트폰 및 전기 자동차 제조업체인 샤오미가 고급 추론 작업을 위해 특별히 설계된 최초의 오픈 소스 대규모 언어 모델(LLM)인 MiMo를 출시하며 AI 경쟁에 공식적으로 뛰어들었습니다.
70억 개의 파라미터로 구성된 비교적 컴팩트한 아키텍처에도 불구하고 MiMo는 이미 수학 추론과 코딩에서 OpenAI의 o1-mini와 같은 대형 경쟁사보다 뛰어난 성능을 보이며 AI 분야의 강력한 경쟁자로 자리매김하고 있습니다.
MiMo는 샤오미의 첫 번째 언어 모델이며, 샤오미는 Core로 알려진 전문 AI 태스크 포스에서 강화 학습을 사용하여 개발했다고 밝혔습니다.
Xiaomi는 MiMo가 논리적 사고, 수학적 추론, 복잡한 추론이 필요한 작업에 특히 적합하다고 강조했습니다. 따라서 알고리즘 설계, 소프트웨어 엔지니어링, 데이터 과학 및 학술 연구와 같은 영역에 강력한 도구가 될 수 있습니다.
크기가 작다는 점도 독특한 장점입니다: 하드웨어 리소스가 제한된 엔터프라이즈 환경이나 엣지 컴퓨팅 설정에 MiMo를 배포할 수 있어 강력하면서도 실용적입니다.
오픈 소스 철학에 따라, 샤오미는 MiMo와 기술 보고서 전문을 GitHub와 Hugging Face에서 공개적으로 이용할 수 있도록 했습니다. 이를 통해 전 세계 개발자 커뮤니티가 이 모델의 기능을 테스트하고, 미세 조정하고, 확장하여 혁신과 채택을 가속화할 수 있을 것으로 기대합니다.
샤오미의 AI 모델은 중국의 자금력이 풍부한 빅테크 기업들이 자사 제품과 AI를 결합하는 상업적 잠재력에 힘입어 기반 모델 개발에 강점을 보이기 시작한 시점에 나온 것입니다.
샤오미는 딥서치와 알리바바에 이어 추론 모델을 출시하고 있지만, 인공지능이 인간 지능과 같거나 능가하는 이론적 지점인 인공 일반 지능에 도달할 가능성이 아직 남아있다고 금요일에 밝혔습니다.
2025년이 AI 모델 경쟁의 후반부인 것처럼 보이지만, 우리는 AGI로 가는 길이 아직 멀다고 굳게 믿습니다."라고 말했습니다;
알리바바는 속도, 확장성, 다국어 처리의 기준을 높이는 것을 목표로 3세대 오픈 소스 Qwen AI 모델을 공식 출시했습니다.
이번 출시는 중국 전역의 거대 기술 기업에서 강력한 언어 모델이 빠르게 유입되고 있는 중국의 이미 경쟁이 치열한 AI 환경에 새로운 모멘텀을 더할 것입니다.
새로운 Qwen3 시리즈는 6억 개의 가벼운 매개변수부터 2,350억 개에 이르는 8가지 모델로 구성되어 있으며, 각 모델은 효율성, 추론 및 언어 다양성 면에서 업그레이드된 성능을 자랑합니다.
알리바바의 AI 개발을 주도하는 부서인 알리바바 클라우드에 따르면, Qwen3의 모든 버전은 더 빠른 처리 속도와 광범위한 언어 지원을 제공하도록 최적화되어 기업 및 개발자 모두가 더 쉽게 사용할 수 있게 되었습니다.
바이트댄스, 텐센트 홀딩스와 같은 다른 주요 기업들도 AI 분야에서 상당한 진전을 이루었습니다. 지난주 Baidu는 대규모 언어 모델의 최신 버전인 어니 4.5 터보를 출시하여 중국을 대표하는 기술 기업 간의 경쟁이 더욱 치열해졌습니다.