☁️ 엘리스클라우드
엘리스는 AI·HPC 워크로드를 위한 두 가지 클라우드 서비스를 제공합니다. 두 서비스는 격리 모델·제어 범위·운영 부담에서 차이가 있으며, 워크로드 특성에 따라 적합한 쪽을 선택합니다.
서비스 비교
| 항목 | ECI (Elice Cloud Infrastructure) | 엘리스AI클라우드 |
|---|---|---|
| 격리 단위 | 가상머신 | 컨테이너 |
| OS·런타임 제어 | 사용자에게 sudo 권한 제공 — 가상머신 내부에서 커널 모듈·Docker·NVIDIA 컨테이너 런타임 등 자유 설치 | 엘리스 사전 구성 — 표준 런타임(Jupyter·VSCode 등) 즉시 사용 |
| 네트워크 | 가상 네트워크·서브넷·공인 IP·방화벽·InfiniBand/RoCEv2 패브릭 직접 구성 | 플랫폼이 관리. 컨테이너에 외부 포트 노출(HTTP·TCP)만 설정 |
| 스토리지 | 블록 스토리지(스냅샷·스케줄러 포함), 오브젝트 스토리지, 병렬 파일 시스템(PFS) | 블록 스토리지, 데이터허브(S3 호환 오브젝트 스토리지) |
| 자동화 인터페이스 | Terraform provider(elice-dev/eci), CLI(eci), REST API | 포털 UI 중심 |
| 가격 모델 | 온디맨드 · 약정형 · 스팟 | 온디맨드 · 약정형 |
| 부가 서비스 | 가상 클러스터(HPC), 모니터링·알림, RBAC, 활동 로그 | ML API(학습된 모델을 REST 엔드포인트로 서빙) |
선택 기준
ECI를 선택하는 경우
- 커스텀 OS·드라이버 버전·커널 모듈을 직접 통제해야 하는 워크로드
- Docker·containerd 등 컨테이너 런타임을 직접 운영하는 경우
- InfiniBand 패브릭 기반 다중 노드 분산 학습(예: 대규모 LLM 사전학습)
- Terraform·CLI 기반 IaC 자동화, 다중 환경(dev/stage/prod) 운영
- 가상 네트워크·방화벽·VPN 등 네트워크 토폴로지를 정밀 설계해야 하는 경우
엘리스AI클라우드를 선택하는 경우
- 사전 구성된 환경에서 즉시 모델 학습·실험을 시작하고 싶을 때
- 컨테이너 빌드·런타임 제어 없이 Jupyter·VSCode 등 표준 도구만 사용하는 경우
- 학습된 모델을 ML API로 빠르게 서빙해야 할 때
- 인프라 운영 부담을 최소화하고 싶을 때
두 서비스는 별도 제품이며 자원을 공유하지 않습니다. 단일 조직 내에서 두 서비스를 함께 운영할 수 있습니다.
다음 단계
- ECI 시작하기 — 회원가입부터 첫 GPU 가상머신 생성까지
- 엘리스AI클라우드 소개 — 런박스·ML API·데이터허브 안내