Arcee AI CTO Lucas Atkins와 CEO Mark McQuade

techcrunch.com

26명이 OpenAI에 맞섰다 — Arcee의 오픈소스 LLM이 OpenClaw 1위를 찍은 이야기

Arcee AI, Trinity LLM, 오픈소스 AI, OpenClaw, 소규모 스타트업AI 사이드 프로젝트

I cant help rooting for tiny open source AI model maker Arcee — TechCrunch

Tiny startup Arcee AI built a 400B-parameter open source LLM from scratch to best Metas Llama

Trinity-Large-Thinking: Scaling an Open Source Frontier Agent — Arcee AI

Big Tech 수천 명이 수조 원을 쏟아붓는 AI 모델 시장에서, 직원 26명짜리 스타트업이 $2천만으로 400B 파라미터 오픈소스 LLM을 만들었어요. 그리고 OpenClaw에서 가장 인기 있는 오픈 모델 1위를 찍었습니다.

3초 요약

26인 스타트업 Arcee → $2천만 + 33일 학습 → 400B 오픈소스 Trinity LLM → OpenClaw 인기 1위 → Claude 대비 96% 저렴

이게 뭔데?

Arcee AI는 샌프란시스코에 있는 아직 많이 알려지지 않은 AI 스타트업이에요. 원래는 SK Telecom 같은 대기업 고객의 LLM 파인튜닝을 대신 해주는 B2B 사업이었는데, CEO Mark McQuade가 "계속 남의 모델에 의존하면 안 되겠다"는 결론을 내렸어요. 그리고 2025년 말부터 아예 자기네 모델을 처음부터 만들기 시작했습니다.

그 결과물이 Trinity 시리즈예요. 2025년 12월에 작은 모델(Nano 6B, Mini 26B)을 먼저 내놓고, 2026년 1월에 Trinity Large(400B)를, 4월 1일에는 추론 능력을 강화한 Trinity-Large-Thinking까지 출시했어요. 이 모든 게 단 9개월, 총 $2천만 예산으로 이루어진 일이에요.

왜 지금 화제냐면, Anthropic이 Claude Code 구독자들에게 OpenClaw 사용을 별도 유료로 전환한다고 발표하면서 OpenClaw 커뮤니티가 대안 모델을 찾기 시작했거든요. 이 타이밍에 Trinity-Large-Thinking이 OpenClaw용 벤치마크인 PinchBench에서 Claude Opus 4.6(93.3점) 바로 다음인 91.9점을 기록했어요. 가격은 Claude 대비 96% 저렴한 토큰당 $0.90/백만 출력 기준.

26명

Arcee 전체 팀 규모

$2천만

Trinity 전체 개발 비용

96%

Claude Opus 대비 저렴한 가격

3.37조

Preview 출시 후 2개월 내 처리 토큰

뭐가 달라지는 건데?

가장 중요한 차이는 라이선스예요. Trinity는 Apache 2.0 라이선스로 배포돼요. 이게 왜 중요하냐면, Meta의 Llama는 상업적 조건과 사용 제한이 붙어 있어서 오픈소스 표준을 위반한다는 비판을 받아왔거든요. 중국 모델들(DeepSeek, Qwen 등)은 성능은 뛰어나지만 데이터 주권 문제로 많은 미국·유럽 기업들이 도입을 꺼려요.

Trinity는 이 틈새를 파고들었어요. 누구든 모델 가중치를 다운받아서 온프레미스에서 돌리고, 자기 데이터로 파인튜닝하고, 상업적으로 활용할 수 있어요. 제약이 없어요. Hugging Face 공동창업자 Clement Delangue가 "미국의 강점은 항상 스타트업이었다. Arcee가 오픈소스 AI에서 그게 가능하다는 걸 보여줬다"고 말할 정도예요.

	Claude / GPT-4o (클로즈드)	Trinity-Large-Thinking	Llama 4 (Meta)
라이선스	API 종속, 비공개	Apache 2.0 (완전 자유)	Meta 조건부 라이선스
온프레미스	불가	가능 (가중치 다운로드)	가능 (상업 제한 있음)
PinchBench	93.3 (Opus 4.6)	91.9	미공개
비용 (출력 1M 토큰)	$25 (Opus 기준)	$0.90	클라우드마다 다름
파라미터 활성화	밀집 구조	13B 활성 / 400B 총 (MoE)	Maverick MoE

아키텍처도 독특해요. Trinity는 Mixture-of-Experts(MoE) 구조를 사용하는데, 256개 전문가 모델 중 한 번에 4개만 활성화돼요. 총 파라미터는 400B지만 실제로 추론할 때 활성화되는 파라미터는 13B(1.56%)뿐이에요. 덕분에 같은 하드웨어에서 경쟁 모델보다 2~3배 빠른 추론 속도를 냅니다.

핵심만 정리: 시작하는 법

Trinity를 써보고 싶다면 3가지 경로가 있어요.

OpenRouter로 바로 써보기 (가장 빠름)
openrouter.ai에서 arcee-ai/trinity-large-thinking을 선택하면 돼요. OpenClaw, Cline, Kilo Code 등 기존 코딩 에이전트 하네스와 통합도 이미 되어 있어요.
Arcee API 사용 (팀/기업용)
chat.arcee.ai에서 계정을 만들고 API 키를 발급받으면 돼요. 출력 토큰 기준 $0.90/백만으로 Claude Opus 대비 96% 저렴해요. 128k 컨텍스트 기준 서빙 중이에요.
가중치 직접 다운로드 (온프레미스/연구용)
Hugging Face에서 세 버전을 고를 수 있어요. Preview(인스트럭트), Base(17조 토큰 체크포인트), TrueBase(10조 토큰 순수 프리트레이닝). 규제 산업에서 자체 얼라인먼트가 필요하면 TrueBase가 유용해요.
OpenClaw 기본 모델로 설정
OpenClaw 설정에서 Trinity-Large-Thinking으로 바꾸면 돼요. Anthropic 구독 없이 OpenRouter 크레딧만으로 사용 가능해요.

Trinity 사용 전 알아두면 좋은 것

Trinity-Large-Thinking은 현재 텍스트 전용이에요. 멀티모달은 개발 중이라 이미지 처리가 필요하면 다른 모델과 병행해야 해요. 코딩 에이전트 작업에는 강하지만 SWE-bench 기준으로는 Claude Opus 4.6(75.6%)보다 낮은 63.2%예요.

🔗

더 깊이 파고 싶다면

Trinity-Large-Thinking 공식 블로그

CTO Lucas Atkins가 직접 쓴 출시 후기. 훈련 과정과 설계 철학 공개

VentureBeat 기술 심층 분석

MoE 구조, SMEBU 전문가 밸런싱, 벤치마크 비교를 가장 깊이 다룬 기사

Hugging Face 모델 허브

Trinity Large Thinking 가중치 다운로드. Preview·Base·TrueBase 모두 Apache 2.0

OpenClaw x OpenRouter 현황

실시간 모델 사용량 데이터. Trinity가 어느 위치에 있는지 직접 확인

Trinity Large 기술 보고서 (GitHub)

SMEBU 알고리즘, z-loss 정규화 등 훈련 세부 구현이 수록된 공식 기술 문서

TechCrunch — 이 스타트업을 응원할 수밖에 없는 이유

CEO McQuade 인터뷰 중심. OpenClaw 사건과 Arcee의 역할을 가장 잘 정리한 기사

자주 묻는 질문

오픈소스라도 상업적으로 쓸 수 있나요?

네, Apache 2.0 라이선스라 제약이 없어요. 사내 제품에 탑재하거나 SaaS에 붙이거나 고객사에 배포해도 됩니다. 단, 저작자 표기(NOTICE 파일)는 유지해야 해요.

온프레미스에서 돌리려면 얼마나 큰 서버가 필요한가요?

400B 파라미터지만 MoE 구조라 추론 시 13B만 활성화돼요. 실제로는 2~4장의 고성능 GPU(A100 80GB 기준)면 돌아가요. 가중치 자체는 8bit 양자화 기준 약 200GB 스토리지가 필요해요.

Trinity-Large-Thinking이 코딩에도 쓸 만한가요?

에이전트 태스크(OpenClaw 등)에는 충분히 강해요. 다만 SWE-bench 기준으로는 Claude Opus 4.6(75.6%)보다 낮은 63.2%예요. 단순 코드 작성보다 멀티-턴 도구 호출, 장기 에이전트 루프에서 강점이 있어요.

Anthropic이 OpenClaw를 막으면서 Trinity가 반사이익을 받은 건가요?

그 시점이 맞아떨어진 건 사실이에요. 다만 Trinity-Large-Preview는 이미 1월에 출시되어 OpenRouter에서 3.37조 토큰을 처리했고, 4월 이전부터 OpenClaw 커뮤니티에서 인기 있었어요. Anthropic의 정책 변경이 관심을 더 높인 건 맞지만, 바닥부터 쌓아온 성능이 먼저였어요.

앞으로 더 작은 모델도 나오나요?

네. Arcee는 Trinity-Large에서 쌓은 프리트레이닝 노하우를 Mini(26B)와 Nano(6B)에 증류하는 2세대 Trinity-2 시리즈를 준비 중이에요. 비전 모델과 음성-텍스트 모델도 로드맵에 있어요.