AI / ML Research

내가 보려고 만든 페이지 - 논문 번역

(Retrieval Augmented Generation (RAG) and Beyond) A Comprehensive Survey on How to Make your LLMs use External Data More Wisely

AI Survey

Posted on December 16, 2024

이 논문은 대규모 언어 모델(LLM)을 외부 데이터로 보강하여 실제 문제 해결 능력을 향상시키는 방법과 이를 위한 기술 및 도전 과제에 대해 다룹니다. [Read More]

Tags: ai ml Retrieval Augmented Generation (RAG) LLM

Text Embeddings by Weakly-Supervised Contrastive Pre-training

AI Paper Review

Posted on December 15, 2024

이 논문은 E5(EmbEmbeddings from bidirEctional Encoder Representations)라는 새로운 텍스트 임베딩 모델에 대해 설명하며, 이 모델이 다양한 작업에서 뛰어난 성능을 보여준다고 강조합니다. [Read More]

Tags: ai ml LLM Text Embedding E5

(Template Matters) Understanding the Role of Instruction Templatesin Multimodal Language Model Evaluation and Training

AI Paper Review

Posted on December 13, 2024

이 논문은 멀티모달 언어 모델(MLM)의 평가와 훈련 과정에서 지시어 형식(instruction format)이 모델 성능에 큰 영향을 미칠 수 있다는 점을 지적하며, 이를 효과적으로 다루는 새로운 방법을 제안합니다. [Read More]

Tags: ai ml LLM instruction template MLM VLM

(SemPLeS) Semantic Prompt Learning for Weakly-Supervised Semantic Segmentation

AI Paper Review

Posted on December 13, 2024

이 논문은 Weakly-Supervised Semantic Segmentation (WSSS) 문제를 다룹니다. WSSS는 이미지 수준의 레이블만으로 세그멘테이션 모델을 학습시키는 것을 목표로 하며, 정확한 픽셀 수준의 주석 데이터가 부족한 상황에서 사용할 수 있는 접근법을 제시합니다. [Read More]

Tags: ai ml CLIP WSSS weakly-supervised semantic segmentation

(NVILA) Efficient Frontier Visual Language Models

AI Paper Review

Posted on December 10, 2024

위 논문은 NVILA라는 새로운 Visual Language Model(VLM) 가족을 소개하며, 정확도와 효율성을 동시에 최적화하는 데 중점을 둔 모델입니다. 기존의 VILA 모델을 기반으로, NVILA는 모델 구조를 개선하여 공간적 및 시간적 해상도를 확장한 후, 시각적 토큰을 압축하는 “확장 후 압축(scale-then-compress)” 접근 방식을 사용합니다. 이를 통해 고해상도 이미지와 긴 영상을 효율적으로 처리할 수 있습니다.... [Read More]

Tags: ai ml VLM VILA