HAN - 백수의 AI 생활 경제 블로그

ReAct Agent는 어떤 방식으로 의사결정을 수행하는가

6월 30, 20266월 21, 2026 작성자: HAN

ReAct Agent의 개념과 부각 배경 인공지능 에이전트가 복잡한 비즈니스 태스크를 자율적으로 수행하기 위해서는 고도화된 추론 능력과 외부 환경과의 상호작용 능력이 동시에 요구됩니다. 과거의 AI 모델들은 내부적인 지식만으로 문제를 해결하려다 보니 최신 정보의 부재나 계산 착오로 인한 할루시네이션(환각 현상)을 자주 겪었습니다. 반면, 외부 도구(API)만 기계적으로 호출하는 시스템은 문제의 본질을 파악하지 못하고 잘못된 명령을 연쇄적으로 실행하는 한계가 … 더 읽기

Agentic RAG는 기존 RAG와 무엇이 다른가

6월 30, 20266월 20, 2026 작성자: HAN

Agentic RAG의 개념과 부각 배경 전통적인 RAG(Retrieval-Augmented Generation) 시스템은 사용자가 질문을 던지면 외부 데이터베이스에서 관련 문서를 검색(Retrieve)하고, 이를 거대언어모델(LLM)에 전달하여 답변을 생성(Generate)하는 일직선 형태의 고정된 프로세스로 작동합니다. 이는 정형화된 Q&A 환경에서는 효과적이지만, 복잡한 추론이나 다단계 데이터 접근이 필요한 비즈니스 자동화 환경에서는 한계를 보입니다. Agentic RAG(에이전틱 RAG)는 이러한 일직선형 구조를 탈피하여, LLM에게 단순한 답변 생성을 넘어 … 더 읽기

Retrieval Precision과 Recall의 균형 맞추기

6월 30, 20266월 19, 2026 작성자: HAN

RAG 시스템에서 Precision과 Recall의 개념 RAG(Retrieval-Augmented Generation) 시스템의 검색 단계에서 정밀도(Retrieval Precision)와 재현율(Retrieval Recall)은 검색 품질을 평가하는 두 가지 핵심 지표입니다. 외부 데이터베이스에서 문서를 찾아 거대언어모델(LLM)에 넘겨줄 때, 이 두 지표는 서로 반비례 관계(Trade-off)를 가집니다. Precision과 Recall의 불균형이 초래하는 문제점 한쪽 지표로 지나치게 치우친 검색 전략은 RAG 파이프라인과 LLM의 최종 생성 답변에 각각 다른 형태의 … 더 읽기

Lost in the Middle 현상은 왜 발생하는가

6월 30, 20266월 18, 2026 작성자: HAN

Lost in the Middle 현상의 정의와 개요 대형 언어 모델(LLM)의 컨텍스트 윈도우가 수백만 토큰으로 확장되면서 방대한 양의 텍스트를 한 번에 입력할 수 있게 되었습니다. 하지만 정보를 대량으로 입력하는 것과 이를 완벽하게 활용하는 것은 다른 문제입니다. Lost in the Middle(중간 실종 현상)은 LLM이 입력된 긴 컨텍스트 중에서 맨 앞(초반부)과 맨 뒤(후반부)의 정보는 잘 기억하고 인용하는 반면, … 더 읽기

Context Window가 커져도 RAG가 사라지지 않는 이유

6월 30, 20266월 17, 2026 작성자: HAN

거대해지는 Context Window와 RAG의 공존 인공지능 모델이 한 번에 이해할 수 있는 텍스트의 양인 ‘컨텍스트 윈도우(Context Window)’가 수백만 토큰 수준으로 급격히 확장되면서, 일각에서는 외부에서 정보를 찾아주는 RAG(검색 증강 생성) 기술이 더 이상 필요 없어질 것이라는 예측을 제기하기도 했습니다. 책 수십 권 분량의 데이터를 모델에 통째로 넣고 질문하면 되기 때문에 복잡한 검색 시스템을 구축할 이유가 없다는 … 더 읽기

Long Context와 RAG는 어떤 상황에서 갈리는가

6월 30, 20266월 16, 2026 작성자: HAN

Long Context LLM과 RAG의 기술적 특징 거대언어모델(LLM)의 기술이 급격히 발전하면서 수백만 토큰의 텍스트를 한 번에 입력받아 처리할 수 있는 ‘Long Context(거대 컨텍스트 윈도우)’ 모델들이 대거 등장했습니다. 이로 인해 방대한 문서 데이터를 잘게 쪼개어 검색엔진으로 찾아 넘겨주던 전통적인 ‘RAG(검색 증강 생성)’ 시스템의 필요성에 대한 논의가 뜨겁습니다. Long Context를 선택해야 하는 상황 전체 컨텍스트를 통째로 모델에 입력하는 … 더 읽기

Embedding 모델 선택이 검색 성능을 바꾸는 이유

6월 30, 20266월 15, 2026 작성자: HAN

Embedding 모델의 개념과 RAG 파이프라인에서의 역할 RAG(Retrieval-Augmented Generation) 시스템이나 AI 자동화 파이프라인에서 검색 성능을 결정짓는 첫 단추는 바로 임베딩(Embedding) 모델입니다. 임베딩 모델은 인간이 사용하는 자연어(텍스트)를 컴퓨터가 이해하고 연산할 수 있도록 수백에서 수천 차원의 고정된 크기의 벡터(숫자 배열)로 변환하는 역할을 수행합니다. 임베딩 과정을 거치면 텍스트는 다차원 벡터 공간의 한 점으로 좌표화됩니다. 검색 엔진은 사용자의 질문이 들어왔을 … 더 읽기

Reranker가 검색 품질에 미치는 영향

6월 30, 20266월 14, 2026 작성자: HAN

Reranker의 개념과 RAG 파이프라인에서의 역할 RAG(Retrieval-Augmented Generation) 시스템의 목적은 사용자 질문에 가장 적합한 문서를 찾아 거대언어모델(LLM)에 전달하는 것입니다. 일반적으로 대규모 문서 데이터베이스에서 1차로 관련성 높은 문서를 빠르게 선별하는 과정을 ‘리트리벌(Retrieval)’이라고 하며, 주로 고정 크기 청킹이나 하이브리드 검색이 이 역할을 수행합니다. 그러나 1차 검색 엔진은 속도를 최적화하기 위해 고안되었기 때문에, 검색된 문서들의 실제 연관성 순위가 정밀하지 … 더 읽기

Hybrid Search는 왜 Vector Search만 사용하는 것보다 유리한가

6월 30, 20266월 13, 2026 작성자: HAN

Hybrid Search의 개념과 등장 배경 RAG(Retrieval-Augmented Generation) 시스템이나 현대적인 검색 아키텍처에서 데이터 검색의 정확도를 극대화하기 위해 하이브리드 검색(Hybrid Search) 방식이 널리 채택되고 있습니다. 하이브리드 검색은 전통적인 텍스트 매칭 방식인 키워드 검색(Keyword Search 또는 Sparse Retrieval)과 인공지능 기반의 벡터 검색(Vector Search 또는 Dense Retrieval)을 결합하여 각각의 단점을 상쇄하고 장점을 극대화하는 기술입니다. 많은 시스템이 고도화된 의미 분석을 … 더 읽기

RAG 검색 정확도를 떨어뜨리는 Chunk Size 설정 문제

6월 19, 20266월 12, 2026 작성자: HAN

RAG 시스템에서 Chunk Size가 중요한 이유 RAG(Retrieval-Augmented Generation, 검색 증강 생성) 시스템의 성능은 거대언어모델(LLM)의 성능만큼이나 ‘어떤 데이터를 찾아 주느냐’에 따라 결정됩니다. 대규모 문서 데이터를 벡터 데이터베이스에 저장하기 위해 적절한 크기로 자르는 과정을 청킹(Chunking)이라고 하며, 이때 결정되는 Chunk Size(청크 크기)는 검색 정확도에 직접적인 영향을 미칩니다. Chunk Size를 어떻게 설정하느냐에 따라 임베딩 모델이 텍스트의 의미를 포착하는 방식이 … 더 읽기

광고 차단 알림