Cuda 로 작성된 라이브러리

instant-ngp

즉각적인 신경 그래픽 프리미티브: 번개처럼 빠른 NeRF 등.
  • 13.4k
  • GNU General Public License v3.0

deep-high-resolution-net.pytorch

이 프로젝트는 CVPR2019 논문 "인간 포즈 추정을 위한 심층 고해상도 표현 학습"의 공식 구현입니다.
  • 4.1k
  • MIT

cub

CUDA C++용 협력 프리미티브. (NVIDIA 제공).
  • 1.5k
  • BSD 3-clause "New" or "Revised"

cugraph

cuGraph - RAPIDS 그래프 분석 라이브러리.
  • 1.3k
  • Apache License 2.0

blocksparse

블록 희소 행렬 곱셈 및 컨벌루션을 위한 효율적인 GPU 커널.
  • 948
  • MIT

k2

FSA/FST 알고리즘, 미분 가능, PyTorch 호환성 포함..
  • 927
  • Apache License 2.0

nv-wavenet

실시간 autoregressive wavenet 추론의 참조 구현.
  • 700
  • BSD 3-clause "New" or "Revised"

nvParse

빠른 GPU 기반 CSV 파서.
  • 550
  • Apache License 2.0

instant-ngp-Windows

즉각적인 신경 그래픽 프리미티브: 번개처럼 빠른 NeRF 등.
  • 458
  • GNU General Public License v3.0

nccl-tests

NCCL 테스트.
  • 436
  • BSD 3-clause "New" or "Revised"

MegBA

MegBA: 대규모 번들 조정을 위한 GPU 기반 분산 라이브러리.
  • 368
  • Apache License 2.0

raft

RAFT에는 데이터 과학, 그래프 및 기계 학습을 위해 널리 사용되는 기본적인 알고리즘과 프리미티브가 포함되어 있습니다. (래피드사이).
  • 278
  • Apache License 2.0

dietgpu

HPC/ML 애플리케이션에서 숫자 및 기타 데이터 유형의 무손실 압축을 위한 확장 기능이 있는 빠른 일반화 ANS(비대칭 숫자 시스템) 엔트로피 인코더 및 디코더의 GPU 구현.
  • 247
  • MIT

TorchPQ

pytorch 및 cuda의 GPU에서 제품 양자화를 사용하여 가장 가까운 이웃 검색을 근사화합니다.
  • 173
  • MIT

Lantern

  • 163
  • BSD 3-clause "New" or "Revised"

RWKV-CUDA

RWKV 언어 모델의 CUDA 버전(https://github.com/BlinkDL/RWKV-LM).
  • 113

cuhnsw

Hierarchical Navigable Small World Graph 알고리즘의 CUDA 구현.
  • 88
  • Apache License 2.0

CUB

이 저장소는 여기에서 자동으로 미러링되는 github.com/nvidia/cub로 이동했습니다.
  • 71
  • BSD 3-clause "New" or "Revised"

array-language-comparisons

어레이 언어 및 라이브러리 비교: APL, J, BQN, Q, Julia, R, NumPy, Nial, Futhark, SaC & ArrayFire..
  • 60
  • MIT

mish-cuda

PyTorch용 Mish 활성화 기능(JunnYu 제공).
  • 48
  • MIT

rocm-examples

  • 39
  • MIT

xgboost-node

XGBoost 모델을 실행하고 Node.js에서 예측합니다.
  • 33
  • GNU General Public License v3.0

CUDA-Guide

CUDA Guide.
  • 29

kobra

최첨단 렌더링 기술을 탐구하는 연구 지향 게임 엔진(vedavamadathil 제작).
  • 21

CryptoGPU

암호화폐 가격 분석.
  • 16

LSQR-CUDA

이것은 Technische Universität Darmstadt의 GRIS 연구소의 Stefan Guthe의 감독하에 Lawrence Ayers가 작성한 LSQR-CUDA 구현입니다. LSQR 라이브러리는 Chris Paige와 Michael Saunders가 저술했습니다.
  • 11
  • MIT

SBNN

GPU 비트 연산을 기반으로 하는 단일 이진화 신경망(SC-19 문서 참조).
  • 10
  • GNU General Public License v3.0

GCGT

논문의 소스 코드: GPU 기반 압축 그래프 순회.
  • 7
  • MIT

FirstCollisionTimestepRarefiedGasSimulator

이 시뮬레이터는 입자 모델의 매우 작은 시간 단계에 대해 가능한 모든 교차점을 계산합니다.
  • 2

DOKSparse

GPU, pytorch의 희소 DOK 텐서.
  • 1
  • MIT