AWS Bedrock

Amazon Bedrock은 AI21 Labs, Anthropic, Cohere, Meta, Stability AI, Amazon 등 선두 AI 기업의 파운데이션 모델(FM)을 단일 API로 제공하여 생성형 AI 애플리케이션을 쉽게 구축하고 확장할 수 있도록 지원하는 완전 관리형 서비스입니다. RAG, 파인튜닝 등으로 모델을 맞춤화하고, 에이전트, 지식 기반 등의 도구를 활용할 수 있습니다.
주요 차별점
- 다양한 선도 AI 기업의 고성능 파운데이션 모델(FM) 선택 가능 (Anthropic Claude 3.7/3.5, Meta Llama 3.1/4, Mistral Large 2, Amazon Titan, Cohere Command R+ 등)
- 서버리스 환경에서 간편하게 FM 실험, 평가, 맞춤화 및 배포
- RAG, 파인튜닝, 지속적 사전 학습 등 다양한 모델 맞춤화 옵션 제공
- 에이전트, 지식 기반, 가드레일, 흐름 등 포괄적인 생성형 AI 애플리케이션 개발 도구 지원
- 온디맨드 및 프로비저닝된 처리량 요금제를 통한 유연한 비용 관리 (배치 추론 시 최대 50% 할인)
대상 사용자
- 생성형 AI 애플리케이션 개발자
- 기업 및 조직의 AI/ML 엔지니어
- 자체 데이터를 활용해 AI 모델을 맞춤화하려는 사용자
- 확장 가능하고 안전한 AI 솔루션을 찾는 기업
가격 정책
모델 유형, 제공업체, 입출력 토큰 수, 사용량(온디맨드/프로비저닝된 처리량)에 따라 비용이 책정됩니다. 텍스트 생성, 이미지 생성, 임베딩 모델별로 요금이 상이하며, 모델 맞춤화(파인튜닝, 스토리지) 비용이 별도로 발생합니다. 일부 모델은 배치 추론 시 할인된 가격으로 제공됩니다.
가격 상세 보기API 및 개발
API 제공: 예
SDK: AWS SDK (Python, Java, Node.js, .NET, Go, C++ 등)를 통해 모든 Bedrock API 작업 지원
주요 연동 서비스/플랫폼
- Amazon S3, Amazon Kendra, AWS Lambda 등 다양한 AWS 서비스와 통합
- Amazon SageMaker와의 원활한 연동
- VPC를 통한 안전한 데이터 전송 및 보안 구성
정보 업데이트
최종 업데이트: 2025-05-11
모델 목록
모델명 | 설명 | 강점 | 주요 사용 사례 | 펼치기/접기 |
---|---|---|---|---|
Anthropic Claude 3.7 Sonnet | Anthropic의 최신 주력 모델 중 하나로, 지능, 속도, 비용 간의 균형이 뛰어나며, 복잡한 추론, 코드 생성, 멀티모달 기능이 강화되었습니다. | 강력한 추론 및 코드 생성 능력, 이미지 및 텍스트 입력 처리 (멀티모달), 200K 토큰 컨텍스트 윈도우, 높은 정확도와 신뢰성, 하이브리드 추론 기능(Extended Thinking) | 고급 질의응답 시스템, 복잡한 소프트웨어 개발 지원, 대규모 문서 분석 및 요약, 과학 및 연구 분야 활용, 창의적인 콘텐츠 생성 | |
Anthropic Claude 3.5 Sonnet | 이전 세대 Sonnet보다 지능, 속도, 비용 효율성이 향상된 모델로, 기업용 워크로드에 적합합니다. | 향상된 지능 및 추론 능력, 우수한 비용 효율성, 멀티모달 기능 (이미지 분석 등), 200K 토큰 컨텍스트 윈도우, 강력한 코드 생성 및 이해 | 고객 서비스 자동화, 데이터 추출 및 분석, 콘텐츠 생성 및 요약, 코드 생성 및 검토, 다국어 번역 | |
Anthropic Claude 3 Haiku | 시장에서 가장 빠르고 비용 효율적인 모델 중 하나로, 거의 즉각적인 응답성이 필요한 실시간 상호 작용 및 콘텐츠 조정에 적합합니다. | 매우 빠른 응답 속도, 뛰어난 비용 효율성, 강력한 비전 기능, 200K 토큰 컨텍스트 윈도우, 견고한 보안 및 안전 기능 | 실시간 고객 지원 챗봇, 콘텐츠 모더레이션, 간단한 질의응답, 물류 최적화, 데이터 추출 작업 | |
Meta Llama 3.1 (405B, 70B, 8B) | Meta의 최신 오픈소스 모델 시리즈로, 다양한 크기와 성능 옵션을 제공합니다. 특히 Llama 3.1 405B는 최고 수준의 성능을 목표로 하며, 128K 토큰 컨텍스트와 다국어 지원이 특징입니다. | 다양한 모델 크기 (8B, 70B, 405B 파라미터), 최대 128K 토큰의 긴 컨텍스트 윈도우, 향상된 추론, 수학, 코딩 능력, 8개 이상의 언어 지원, 오픈소스 기반의 높은 접근성 (일부 모델) | 최첨단 AI 연구 및 개발, 복잡한 문제 해결 및 코드 생성, 다국어 애플리케이션 구축, 대규모 문서 이해 및 요약, 자체 모델 구축 및 미세 조정 | |
Amazon Titan Text Premier / Express / Lite | Amazon이 개발한 텍스트 생성 모델 시리즈로, 다양한 작업과 성능 요구사항에 맞춰 선택할 수 있습니다. Titan Text Premier는 복잡한 작업에, Express는 속도와 효율성, Lite는 가장 경제적인 옵션입니다. | 다양한 성능 및 비용 옵션 (Premier, Express, Lite), 요약, 번역, 질의응답, 코드 생성 등 광범위한 작업 지원, 최대 32K 토큰 컨텍스트 (Premier), RAG 및 에이전트 구축에 최적화, AWS 생태계와의 긴밀한 통합 | 기업용 챗봇 및 가상 비서, 콘텐츠 생성 및 개인화, 문서 요약 및 정보 추출, 코드 생성 및 개발 지원, 다국어 번역 및 로컬라이제이션 | |
Amazon Titan Image Generator G1 | 텍스트 프롬프트를 기반으로 고품질 이미지를 생성하고 기존 이미지를 편집할 수 있는 모델입니다. 워터마크 기능을 통해 AI 생성 콘텐츠 식별을 지원합니다. | 사실적이고 다양한 스타일의 이미지 생성, 기존 이미지 편집 및 사용자 지정 (인페인팅, 아웃페인팅), 보이지 않는 워터마크 기능으로 AI 생성 이미지 식별, 책임감 있는 AI 사용 지원, 간편한 API를 통한 애플리케이션 통합 | 광고 및 마케팅 캠페인용 이미지 제작, 웹사이트 및 프레젠테이션용 시각 자료 생성, 콘텐츠 개인화 및 다양화, 제품 디자인 및 프로토타이핑, 교육 및 엔터테인먼트 콘텐츠 제작 | |
Stability AI Stable Diffusion XL 1.0 / 3.0 / 3.5 Large | Stability AI의 대표적인 텍스트-이미지 변환 모델로, 다양한 스타일과 고품질의 이미지를 생성합니다. 최신 버전(3.0/3.5)은 이미지 품질, 프롬프트 이해도, 텍스트 렌더링 능력이 향상되었습니다. | 최첨단 이미지 생성 품질, 다양한 예술적 스타일 및 프롬프트 지원, 향상된 프롬프트 이해도 및 텍스트 렌더링 (SD 3.0/3.5), 고해상도 이미지 생성 가능, 오픈소스 기반의 강력한 커뮤니티 지원 (일부 모델) | 디지털 아트 및 일러스트레이션 제작, 콘셉트 아트 및 캐릭터 디자인, 광고 및 마케팅용 시각 콘텐츠, 게임 및 엔터테인먼트 산업 활용, 개인화된 상품 디자인 | |
Cohere Command R / R+ / Command / Command-Light | Cohere의 대화형 AI 모델 제품군으로, 기업 환경에 최적화된 확장성과 성능을 제공합니다. Command R+는 고급 RAG 및 도구 사용에 뛰어나며, 다양한 규모와 요구사항에 맞는 옵션을 제공합니다. | 고급 RAG 및 다단계 도구 사용 (Command R+), 다국어 지원 (10개 언어), 확장성과 신뢰성을 갖춘 기업용 설계, 다양한 모델 크기 및 가격 옵션, 데이터 보안 및 개인 정보 보호 중점 | 기업 내부 지식 검색 및 질의응답, 복잡한 워크플로우 자동화, 고객 지원 및 서비스 데스크 최적화, 데이터 기반 의사결정 지원, 다국어 고객 상호작용 | |
Mistral Large 2 / Medium 3 / Small 3.1 | Mistral AI의 고성능 언어 모델 시리즈로, 코드 생성, 수학, 추론 능력이 뛰어나며 다국어 지원이 강화되었습니다. Mistral Large 2는 플래그십 모델이며, Medium 3와 Small 3.1은 효율성과 멀티모달 기능을 제공합니다. | 뛰어난 코드 생성, 수학, 추론 능력 (Large 2), 네이티브 멀티모DAL (Medium 3, Small 3.1 - 텍스트, 이미지), 광범위한 다국어 지원 (수십 개 언어), 최대 128K 토큰 컨텍스트 윈도우, 오픈 소스 기반 및 자체 배포 옵션 (일부 모델) | 복잡한 소프트웨어 개발 및 코드 분석, 다국어 콘텐츠 생성 및 번역, 기업용 AI 솔루션 및 챗봇, 이미지 기반 질의응답 및 콘텐츠 생성, 연구 및 학술 분야 활용 |