분류 전체보기 15

12. Agentic AI (feat. AWS Bedrock Agents)

Samsung SDS 소속의 AWS Ambassador로서, AWS의 다양한 기술과 최신 트렌드를 탐구하고 이를 바탕으로 기술 블로그를 작성하고 있습니다. 클라우드 아키텍처, 인공지능, 데이터 분석 등 AWS의 강력한 서비스들을 활용하는 방법을 공유하며, 실무에서 얻은 인사이트와 모범 사례를 전달하는 데 집중하고 있습니다. Written in July 10, 2025 by Sang Hyun Jo (Samsung SDS) 1. Agentic AI인공지능이 단순히 주어진 명령을 기계적으로 실행하는 수준을 넘어, 스스로 목표를 설정하고, 상황을 판단하며, 능동적으로 행동하는 시대가 도래했습니다. 이러한 차세대 AI를 바로 Agentic AI라고 부릅니다.1-1. Agentic AI의 핵심 특징Agentic A..

AWS Ambassador 2025.07.16

11. Multi-Agent AI 구성 (1) - 직접 구성

Samsung SDS 소속의 AWS Ambassador로서, AWS의 다양한 기술과 최신 트렌드를 탐구하고 이를 바탕으로 기술 블로그를 작성하고 있습니다. 클라우드 아키텍처, 인공지능, 데이터 분석 등 AWS의 강력한 서비스들을 활용하는 방법을 공유하며, 실무에서 얻은 인사이트와 모범 사례를 전달하는 데 집중하고 있습니다. Written in May 19, 2025 by Sang Hyun Jo (Samsung SDS) AI 기술이 발전함에 따라, 단일 모델에 의존하는 전통적인 AI 접근법을 넘어서는 새로운 패러다임이 등장하고 있습니다. 바로 '멀티 에이전트 AI 시스템'입니다. 이 혁신적인 접근법은 여러 전문화된 AI 모델들이 함께 협업하여 복잡한 문제를 해결하는 방식으로, 현재 AI 기술의 한계를 ..

AWS Ambassador 2025.05.19

10. Embedding Model 배포 (2) - EC2 직접 배포

SageMaker 엔드포인트로 임베딩 모델 배포 시 단점SageMaker 엔드포인트는 모델 배포에 편리한 관리형 솔루션을 제공하지만, 임베딩 모델을 배포할 때 고려해야 할 몇 가지 중요한 단점이 있습니다:1. 비용 관련 단점중지 기능 부재: EC2와 달리 사용하지 않는 시간에 엔드포인트를 중지할 수 없어, 24시간 지속적으로 비용이 발생합니다.높은 프리미엄: 동일한 인스턴스 유형 대비 EC2보다 약 25-30% 더 비싼 가격이 책정됩니다.최소 인스턴스 요구사항: 최소 1개 이상의 인스턴스가 항상 실행되어야 하므로 트래픽이 적은 시간에도 비용이 발생합니다.자원 낭비: 임베딩 요청이 간헐적인 경우에도 리소스가 항상 프로비저닝되어 있어 비효율적입니다.2. 유연성 제약커스터마이징 제한: SageMaker 컨테이..

AWS Ambassador 2025.04.20

9. Embedding Model 배포 (1) - SageMaker Endpoint

검색 증강 생성(Retrieval-Augmented Generation, RAG)은 대규모 언어 모델(LLM)의 한계를 극복하는 방법론으로 주목받고 있습니다. RAG 시스템의 핵심에는 임베딩 모델이 있으며, 이는 시스템 전체의 성능을 좌우하는 중요한 요소입니다. 이 글에서는 RAG에서 임베딩 모델이 왜 중요한지, 어떤 역할을 하는지 살펴보고 AWS 인스턴스에 직접 임베딩 모델을 배포하는 방법을 다뤄보겠습니다.임베딩 모델: RAG의 숨은 영웅RAG 시스템은 크게 검색(Retrieval)과 생성(Generation) 두 단계로 나뉩니다. 임베딩 모델은 검색 단계에서 핵심적인 역할을 담당합니다.텍스트의 의미를 수치화하는 마법임베딩 모델은 텍스트를 고차원 벡터 공간의 점으로 변환합니다. 이 과정을 통해 단어나 ..

AWS Ambassador 2025.04.20

8. Fine-Tune FM with SageMaker Studio - Canvas (No Code) (2)

파인 튜닝(Fine-tuning)은 사전 훈련된 대규모 언어 모델(LLM)을 특정 도메인이나 작업에 최적화하는 과정입니다. 이는 모델이 일반적인 지식을 바탕으로 특수한 영역에서도 뛰어난 성능을 발휘할 수 있게 해주는 핵심 기술입니다. 기본적으로 파인 튜닝은 이미 방대한 데이터로 학습된 모델을 '재교육'하는 것으로, 처음부터 모델을 훈련시키는 것보다 훨씬 효율적입니다. 특히 의료, 법률, 금융과 같은 전문 분야나 기업 내부 지식을 활용한 응용 프로그램 개발에 중요한 역할을 합니다.파인 튜닝은 강력한 도구이지만, 그 과정은 복잡하고 다양한 기술적 도전 과제를 수반합니다. 이 문서에서는 파인 튜닝의 주요 단계를 단계별로 살펴보고, 이 과정에서 직면하게 되는 주요 어려움에 대해 자세히 알아봅니다. 이를 통해 파..

AWS Ambassador 2025.03.05

7. Fine-Tune FM with SageMaker Studio (1)

파인튜닝(Fine-tuning)은 Llama, Titan 같은 사전 학습 모델(pre-trained model)을 특정 작업이나 데이터에 보다 잘 맞도록 추가적으로 학습하는 과정입니다. 사전에 훈련된 모델은 대규모 데이터셋에서 미리 학습된 패턴을 가지고 있으며, 이러한 모델을 새로운, 도메인에 특화된 데이터셋에 적용할 때 추가적인 학습을 통해 모델의 성능을 개선할 수 있습니다. 시간이 지나면서 환경이 변하거나 새로운 유형의 데이터가 등장할 때, 모델이 최신 상황에 맞게 학습되도록 합니다. 파인튜닝은 모델이 새로운 데이터셋에서 더 높은 정확도와 성능을 달성하도록 도와줍니다. 파인튜닝은 이처럼 모델의 범용성을 확장하고, 특정 작업에 대한 모델의 정밀도를 높이며, 제한된 자원 하에서도 효과적인 학습을 가능하게..

AWS Ambassador 2025.03.05

6. AWS Opensearch를 활용한 Zero ETL RAG 활용

최근 AI 기술이 급속도로 발전하면서, 데이터의 중요성이 어느 때보다도 강조되고 있습니다. 우리는 데이터의 시대에 살고 있다해도 과언이 아닐정도로, 데이터는 새로운 기회의 문을 열어주는 열쇠와 같습니다. 하지만 데이터를 수집하고, 처리하며 분석하는 과정에 상당히 많은 시간과 비용이 소모되고 있습니다. 그래서 많은 기업들은 데이터를 보다 효율적으로 활용하고, AI 기술의 잠재력을 최대한 발휘할 수 있는 방안을 모색하고 있습니다. 그 해답 중 하나가 바로 'Zero ETL 파이프라인'입니다. 데이터 수집과 처리/분석에 들어가는 시간과 비용을 대폭 줄이는 동시에, 데이터 생성 즉시 생성형 AI와 연계하여 활용할 수 있는 구조를 제공 할 수 있습니다. 앞으로 소개할 내용은 이러한 Zero ETL 파이프라인을 통..

AWS Ambassador 2025.03.05

5. 환각을 최소화하는 최신 정보 반영 LLM RAG 애플리케이션

RAG (Retrieval-Augmented Generation) 는 대규모 언어 모델(LLM)과 검색 기술을 결합하여 보다 정확하고 신뢰할 수 있는 응답을 생성하는 방식입니다. 사용자의 쿼리가 입력되면, 관련된 지식을 검색한 후 이를 컨텍스트로 활용하여 LLM이 정보 기반 응답을 생성합니다. 이 방식의 주요 장점으로는 최신 정보에 접근 가능, 환각 현상 감소, 도메인 특화 지식 활용, 그리고 응답의 투명성과 추적 가능성 향상이 있습니다. RAG의 핵심 구성 요소로는 지식 저장소(문서, 데이터베이스, 웹 정보 등), 검색 엔진(벡터 데이터베이스, 의미 기반 검색), 그리고 생성 모델(LLM) 이 포함됩니다. 이를 통해 보다 신뢰할 수 있고 정확한 정보를 제공할 수 있습니다. RAG(Retrieval-Au..

AWS Ambassador 2025.03.05

4. 온프레미스와 클라우드의 최적 조합: 하이브리드 클라우드 전략

하이브리드 클라우드는 AWS와 같은 Cloud Service Provider인 공용 클라우드와 기업 내부의 온프레미스 DC를 결합한 환경을 의미합니다. 이러한 환경에서는 데이터와 애플리케이션은 AWS와 온프레미스 DC 간에 이동할 수 있습니다. 이는 기업이 자체 데이터 센터(사설 클라우드)의 보안과 제어력을 유지하면서, 공용 클라우드의 유연성, 확장성, 효율성을 활용할 수 있습니다. 하이브리드 구성 필요 요소하이브리드 클라우드 구성을 위해 온프레미스 DC의 VPN 서버 Private IP, IP 대역, DNS 서버 IP, APP 서버 IP, DC에서 AWS로 향하는 Conditional Forwarding, 보안 그룹의 트래픽 허용이 필요합니다. AWS 환경 구성AWS CLI, CDK를 활용해 AWS에..

AWS Ambassador 2025.03.05

3. AWS 서버리스의 Latency 문제 분석과 개선을 위한 Caching 전략

서버리스 컴퓨팅이 개발, 배포, 세분화된 비용 과금의 간편함으로 인해 주목을 받고 있지만, 데이터베이스, 파일 저장소, 또는 하나 이상의 서버리스 함수를 포함하는 복잡한 서비스를 구현 시 요청을 처리하는 데 있어서의 지연 시간 문제가 발생할 수 있습니다. 본 포스트에서는 지연 문제가 발생 할 수 있는 상황 예시와 이에 대한 해결책으로 Caching 기법을 소개하고자 합니다.서버리스 아키텍처의 지연 문제서버리스 컴퓨팅은 '서버리스 애플리케이션' 또는 'Function as a Service (FaaS)'의 개념을 통해 가능해졌으며, 이를 통해 애플리케이션 개발자와 소프트웨어 서비스 제공자는 서비스 수준 계약 협상 중에 서버 사양을 추정할 필요가 없고, 서비스를 클라우드 서비스 플랫폼에 안전하게 맡길 수 있..

AWS Ambassador 2025.03.05