본문 바로가기

Embedding3

벡터 DB 기본 개념 : 벡터 검색의 한계와 Hybrid Search (4) 2025.12.16 - [Data Science] - 벡터 DB 기본 개념 : ANN 인덱스 (3) 벡터 DB 기본 개념 : ANN 인덱스 (3)2025.12.09 - [Data Science] - 벡터 DB 검색 기본 개념 : Embedding (2) 벡터 DB 검색 기본 개념 : Embedding (2)2025.12.08 - [Data Science] - 벡터 DB 검색 기본 개념 : Embedding, ANN 개요 (1)지난 글에서는 벡터 DB가 무엇이고devhwi.tistory.com지난 글에서 벡터 DB 내 검색에 대한 내용을 정리했다. ANN 인덱스를 이용하여 벡터 DB의 검색을 빠르게 진행할 수 있지만, 실무에서는 벡터 DB만을 단독으로 사용하지 않고, 명시적 조건 (키워드, 메타데이터)과 .. 2025. 12. 17.
벡터 DB 기본 개념 : ANN 인덱스 (3) 2025.12.09 - [Data Science] - 벡터 DB 검색 기본 개념 : Embedding (2) 벡터 DB 검색 기본 개념 : Embedding (2)2025.12.08 - [Data Science] - 벡터 DB 검색 기본 개념 : Embedding, ANN 개요 (1)지난 글에서는 벡터 DB가 무엇이고, ANN 인덱싱 구조가 어느 방식으로 의미상 유사 벡터를 빠르게 찾는지를 정리했다. 이번 글에devhwi.tistory.com지난 글에서는 벡터 DB의 기본 개념 중 Embedding의 역할과 중요성에 대해서 정리했다. 이번 글에서는 Embedding된 벡터를 어떻게 빨리 찾느냐에 대한 주제로 ANN 인덱스를 다뤄보고자 한다. ANN 인덱스란?Embedding된 벡터를 어떻게 빠르게 찾을 .. 2025. 12. 16.
벡터 DB 검색 기본 개념 : Embedding, ANN 개요 (1) 벡터 DB벡터 DB란 텍스트, 이미지, 오디오 같은 비정형 데이터들을 벡터(코드 관점에선 숫자의 배열) 형태로 저장해놓고, 이 들 사이의 유사도(similarity)를 기반으로 빠르게 검색하기 위해 특화된 데이터베이스이다.일반적으로 ML(특히 딥러닝 모델)을 이용하여 의미를 함축시켜 숫자배열로 표현하는 Embedding 과정을 거쳐 고차원 벡터로 변환한 뒤, DB에 저장된다.벡터 DB를 한 문장으로 요약하면, 비정형성의 데이터를 의미기반으로 검색하기 위해 벡터를 저장하고 탐색하는 DB이다. 벡터 DB와 기존 검색 엔진과의 차이전통 검색 엔진(Elasitcsearch의 BM25)이나 정형데이터를 처리하는 RDBMS와 다른 점은 기존 DB들이 정확히 일치하거나 범위 검색을 하는데 최적화되어 있다면, 벡터 .. 2025. 12. 8.