본문으로 건너뛰기

Serverless 방식으로 모델 사용하기

Serverless는 별도의 인스턴스 생성이나 서버 설정 없이 즉시 호출 가능한 모델 실행 방식입니다. 엘리스AI클라우드에서 제공하는 사전 준비된 엔드포인트를 통해 모델을 사용할 수 있으며, 사용한 만큼만 비용이 부과됩니다.

특징

  • 인프라 준비 없이 즉시 사용 가능
  • 호출량 기반 과금
  • 트래픽 변화에 자동 대응
  • 테스트, 프로토타이핑, 유연한 서비스 운영에 적합

Serverless 엔드포인트 사용

모델 라이브러리에서 Serverless 지원 모델을 선택하면, 해당 모델의 Serverless 엔드포인트를 바로 사용할 수 있습니다.

사용하기-Serverless

  1. ML API -> 모델 라이브러리 이동
  2. Serverless 지원 모델 선택
  3. 제공되는 API 호출 정보 확인
  4. API Key 포함하여 호출

Serverless 호출 방법

Serverless 호출은 API Key 인증이 필수입니다. API Key를 헤더에 포함하여 HTTP 요청을 호출합니다.

API Key에 대해서는 API Key 관리하기 문서를 확인해주시기 바랍니다.

배포된 모델의 API 요청 방법에 대해서는 API 요청 문서를 확인해주시기 바랍니다.

Serverless 이용 현황 모니터링

ML API의 Serverless 이용 현황 페이지에서 사용량과 비용을 확인할 수 있습니다.

서버리스 모니터링

확인 가능한 정보

  • 총 이용 금액
  • 기간별 호출량
  • Token, Seconds(Audio), Megapixels(Image) 사용량
  • 모델별 / API Key별 필터

이를 통해 서비스 사용 추이를 분석하고 비용을 효율적으로 관리할 수 있습니다.

과금 기준

Serverless는 호출 단위 과금 방식이며, 모델 유형에 따라 비용 정책이 상이할 수 있습니다.

  • Input Token / Output Token 기준 과금
  • 호출량 기준 그래프 제공
  • 기간 설정 필터를 통해 히스토리 확인 가능