video-recognition · GitHub Topics

kenshohara / 3D-ResNets-PyTorch

#计算机科学#3D ResNets for Action Recognition (CVPR 2018)

深度学习机器视觉 PyTorch Python action-recognition video-recognition

Python 4.02 k

5 年前

PaddlePaddle / PaddleVideo

基于模块化的设计，提供丰富的视频算法实现、产业级的视频算法优化与应用，包括安防、体育、互联网、媒体等行业的动作定位与识别、行为分析、智能封面、视频标注、视频打标签等，涵盖动作识别与视频分类、动作定位、动作检测、多模态文本视频检索等技术。

video-recognition tsm slowfast tsn bmn action-recognition youtube-8m kinetics400 video-understanding activitynet action-detection temporal-action-detection ava

Python 1.64 k

7 个月前

subho406 / OmniNet

#自然语言处理#Official Pytorch implementation of "OmniNet: A unified architecture for multi-modal multi-task learning" | Authors: Subhojeet Pramanik, Priyanka Agrawal, Aman Hussain

机器学习深度学习神经网络人工智能 transformer 自然语言处理 image-captioning video-recognition multitask-learning multimodal-learning

Python 513

5 年前

edenai / edenai-apis

#自然语言处理#Eden AI: simplify the use and deployment of AI technologies by providing a unique API that connects to the best possible AI engines

aggregator 人工智能 API 机器视觉 document-parsing 图像处理 machine-translation 自然语言处理 OCR optical-character-recognition pre-trained-model Python speech-recognition speech-to-text text-to-speech video-recognition

Python 456

1 天前

apoorva-dave / LicensePlateDetector

#计算机科学#Detects license plate of car and recognizes its characters

机器学习 license-plate-recognition image-recognition video-recognition

Python 355

2 年前

datamllab / autovideo

#计算机科学#AutoVideo: An Automated Video Action Recognition System

automl Video 深度学习 video-recognition automated

Python 339

2 年前

tea1528 / Non-Local-NN-Pytorch

#计算机科学#PyTorch implementation of Non-Local Neural Networks (https://arxiv.org/pdf/1711.07971.pdf)

深度学习 video-recognition

Python 251

3 年前

whwu95 / Text4Vis

【AAAI'2023 & IJCV】Transferring Vision-Language Models for Visual Recognition: A Classifier Perspective

cross-modal-learning transfer-learning video-recognition video-understanding action-recognition

Python 195

1 年前

whwu95 / GPT4Vis

GPT4Vis: What Can GPT-4 Do for Zero-shot Visual Recognition?

gpt-4-vision-preview prompt-engineering video-recognition visual-recognition

Python 185

1 年前

whwu95 / BIKE

【CVPR'2023】Bidirectional Cross-Modal Knowledge Exploration for Video Recognition with Pre-trained Vision-Language Models

action-recognition cross-modal-learning video-recognition video-understanding

Python 152

1 年前

cooperdk / YAPO-e-plus

YAPO e+ - Yet Another Porn Organizer (extended)

porn pornography tagging scene-recognition video-recognition

Python 150

3 年前

rohitgirdhar / CATER

#计算机科学#CATER: A diagnostic dataset for Compositional Actions and TEmporal Reasoning

video-recognition action-recognition 深度学习 video-understanding

Python 107

5 年前

DmitryRyumin / WACV-2024-Papers

#人脸识别#WACV 2024 Papers: Discover cutting-edge research from WACV 2024, the leading computer vision conference. Stay updated on the latest in computer vision and deep learning, with code included. ⭐ support ...

3d-computer-vision adversarial-attacks autonomous-driving biometrics 机器视觉数据集 face-recognition generative-models gesture-recognition image-recognition image-understanding low-level 机器学习 Robotics video-recognition vision-transformer 可视化

Python 96

1 年前

yanbeic / CCL

PyTorch Implementation on Paper [CVPR2021]Distilling Audio-Visual Knowledge by Compositional Contrastive Learning

distillation audio-visual-learning cvpr2021 contrastive-learning PyTorch video-recognition

Python 89

4 年前

fmahoudeau / MiCT-Net-PyTorch

Video Recognition using Mixed Convolutional Tube (MiCT) on PyTorch with a ResNet backbone

video-classification PyTorch ucf101 video-recognition action-recognition

Python 56

5 年前

BeSpontaneous / FFN-pytorch

Frame Flexible Network (CVPR2023)

action-recognition efficient-deep-learning video-recognition

Python 56

2 年前

karolzak / conv3d-video-action-recognition

#计算机科学#My experimentation around action recognition in videos. Contains Keras implementation for C3D network based on original paper "Learning Spatiotemporal Features with 3D Convolutional Networks", Tran et...

深度学习 video-recognition action-recognition Keras pipe ucf101 Tensorflow video-processing video-classification 机器学习

Python 54

1 年前

bytedance / Portrait-Mode-Video

Video dataset dedicated to portrait-mode video recognition.

video-recognition benchmark

Python 52

9 个月前

Nasdin / VideoRecognition-realtime-autotrainer-alerts

#计算机科学#State of the art object detection in real-time using YOLOV3 algorithm. Augmented with a process that allows easy training of the classifier as a plug & play solution . Provides alert if an item in an...

video-recognition image-recognition yolov2 yolo Tensorflow darknet 深度学习 convolutional-neural-networks 图像处理机器学习 real-time object-detection webscraping webcam web-scraper automatic alerts

Python 49

7 年前

martinetoering / ViCC

[WACV'22] Code repository for the paper "Self-supervised Video Representation Learning with Cross-Stream Prototypical Contrasting", https://arxiv.org/abs/2106.10137.

self-supervised-learning unsupervised-learning action-recognition contrastive-learning video-recognition

Python 36

3 年前