Serverless 방식으로 모델 사용하기
Serverless는 별도의 인스턴스 생성이나 서버 설정 없이 즉시 호출 가능한 모델 실행 방식입니다. 엘리스AI클라우드에서 제공하는 사전 준비된 엔드포인트를 통해 모델을 사용할 수 있으며, 사용한 만큼만 비용이 부과됩니다.
특징
- 인프라 준비 없이 즉시 사용 가능
- 호출량 기반 과금
- 트래픽 변화에 자동 대응
- 테스트, 프로토타이핑, 유연한 서비스 운영에 적합
Serverless 엔드포인트 사용
모델 라이브러리에서 Serverless 지원 모델을 선택하면, 해당 모델의 Serverless 엔드포인트를 바로 사용할 수 있습니다.

- ML API -> 모델 라이브러리 이동
- Serverless 지원 모델 선택
- 제공되는 API 호출 정보 확인
- API Key 포함하여 호출
Serverless 호출 방법
Serverless 호출은 API Key 인증이 필수입니다. API Key를 헤더에 포함하여 HTTP 요청을 호출합니다.
API Key에 대해서는 API Key 관리하기 문서 를 확인해주시기 바랍니다.
배포된 모델의 API 요청 방법에 대해서는 API 요청 문서를 확인해주시기 바랍니다.
Serverless 이용 현황 모니터링
ML API의 Serverless 이용 현황 페이지에서 사용량과 비용을 확인할 수 있습니다.

확인 가능한 정보
- 총 이용 금액
- 기간별 호출량
- Token, Seconds(Audio), Megapixels(Image) 사용량
- 모델별 / API Key별 필터
이를 통해 서비스 사용 추이를 분석하고 비용을 효율적으로 관리할 수 있습니다.
과금 기준
Serverless는 호출 단위 과금 방식이며, 모델 유형에 따라 비용 정책이 상이할 수 있습니다.
- Input Token / Output Token 기준 과금
- 호출량 기준 그래프 제공
- 기간 설정 필터를 통해 히스토리 확인 가능