2024-11-26 11:18
LLM모델을 사용할 때 자주 쓰는 방법 중 하나로 RAG(Retrieval-Augmented Generation) 시스템이 있다.
이걸 이리저리 파고들다보니 단순히 문서를 업로드하는 것 뿐만 아니라, 데이터를 벡터화하여 사용하는 방법이 있다는 걸 알게 됐다.
벡터 DB를 사용하게 되면 속도와 성능 측면에서 여러 가지 이점이 있다. 벡터화를 통해 데이터는 의미와 관계를 반영하는 고차원 숫자 표현으로 변환되며, 이를 통해 검색 및 처리 속도가 크게 향상된다.
다만, 고차원의 벡터를 사용하려면 좋은 하드웨어가 필요하므로 적당한 수준의 벡터화를 진행해야 한다.
Azure의 스토리지에 파일을 업로드하면 벡터화해주는 기능이 있어서 편리하다. 근데 애저의 특징은 그 작동방식은 알 수 없다는 것..
PromptEngineering