集合主题趋势排行榜

#

multimodal-retrieval

adithya-s-k / VARAG

Vision-Augmented Retrieval and Generation (VARAG) - Vision first RAG Engine

multimodal-retrieval rag

Python 480

2 个月前

jolibrain / colette

#大语言模型#Multimodal RAG to search and interact locally with technical documents of any kind

大语言模型 retrieval-augmented-generation search multimodal-large-language-models multimodal-retrieval vision-language-model

HTML 251

1 个月前

naver / artemis

Official code release for ARTEMIS: Attention-based Retrieval with Text-Explicit Matching and Implicit Similarity (published at ICLR 2022)

image-retrieval multimodal-deep-learning multimodal-retrieval

Python 52

3 年前

JUNJIE99 / VISTA_Evaluation_FineTuning

Evaluation code and datasets for the ACL 2024 paper, VISTA: Visualized Text Embedding for Universal Multi-Modal Retrieval. The original code and model can be accessed at FlagEmbedding.

multimodal-retrieval vision-language-model

Python 41

10 个月前

sung-yeon-kim / GENIUS-CVPR25

Official Implementation of GENIUS: A Generative Framework for Universal Multimodal Search, CVPR 2025

multimodal-retrieval

Python 25

1 个月前

TIBHannover / cross-modal_entity_consistency

#计算机科学#This repository contains the dataset and source files to reproduce the results in the publication Müller-Budack et al. 2021: "Multimodal news analytics using measures of cross-modal entity and context...

multimodal-retrieval 深度学习

Python 24

2 年前

aimagelab / ReT

[CVPR 2025] Recurrence-Enhanced Vision-and-Language Transformers for Robust Multimodal Document Retrieval

embeddings information-retrieval multimodal-retrieval recurrent-neural-networks rag

Python 23

6 个月前

vikram-mm / Multimodal-Image-Retrieval

Explores early fusion and late fusion approaches for Multimodal medical Image Retrieval

kmeans multimodal-retrieval

Python 22

5 年前

PanguIR / MRAGSurvey

A Survey of Multimodal Retrieval-Augmented Generation

large-language-models 大语言模型 multimodal-generation multimodal-large-language-models multimodal-retrieval

19

5 个月前

Shuyu-XJTU / CMP

The official code of "Beyond Walking: A Large-Scale Image-Text Benchmark for Text-based Person Anomaly Search"

multimodal-retrieval

Python 16

1 个月前

sisinflab / Formal-MultiMod-Rec

Formalizing Multimedia Recommendation through Multimodal Deep Learning, accepted in ACM Transactions on Recommender Systems.

graph-neural-networks multimodal-deep-learning PyTorch recommender-system reproducibility multimodal-retrieval

Python 13

1 年前

noagarcia / context-art-retrieval

Multimodal retrieval in art with context embeddings.

机器视觉 art image-retrieval multimodal-retrieval

Python 11

4 年前

marialymperaiou / knowledge-enhanced-multimodal-learning

A list of research papers on knowledge-enhanced multimodal learning

image-text-matching image-text-retrieval knowledge-graph multimodal-deep-learning multimodal-retrieval vision-and-language vision-and-language-pre-training vision-language-transformer visual-commonsense-reasoning visual-question-answering multi-task-learning

7

3 年前

MMDocRAG / MMDocIR

The code used to train and run inference with MMDocIR

information-retrieval 大语言模型 multimodal-retrieval retrieval-augmented-generation vision-language-model

JavaScript 6

4 个月前

wangtong627 / COR

Official Implementation of "Composed Object Retrieval: Object-level Retrieval via Composed Expressions"

multimodal-learning multimodal-retrieval

Python 6

1 个月前

marcomoldovan / multimodal-self-distillation

A generalized self-supervised training paradigm for unimodal and multimodal alignment and fusion.

multimodal-deep-learning PyTorch self-supervised-learning multimodal-retrieval

Python 5

2 年前

aurooj / VLM_SS

Mini-batch selective sampling for knowledge adaption of VLMs for mammography.

Medical imaging multimodal-learning multimodal-retrieval vision-and-language vision-language-transformer

Jupyter Notebook 1

1 年前

TIBHannover / iPatent

iPatent - Interactive Patent Search and Analysis

clustering multimodal-retrieval

Python 1

4 个月前

catarinaopires / eval-multimodal-medical-case-retrieval

#计算机科学#Evaluating dense model-based approaches for Multimodal Medical Case retrieval.

深度学习 medical multimodal-retrieval

Python 0

1 个月前

Website
Wikipedia