"데이터 과학" 태그별 라이브러리

Enterprise

🦄 Enterprise™ 프로그래밍 언어.

TileDB

유니버설 스토리지 엔진.

OSINT_Collection

OSINT 관련 리소스 모음을 유지했습니다. (모두 무료 및 실행 가능).

scanpy

Python의 단일 셀 분석. >1M 셀로 확장..
  • 1.5k
  • Python
  • BSD 3-clause "New" or "Revised"

MachineLearningStocks

파이썬과 scikit-learn을 사용하여 주식 예측을 합니다.

tidyverse

tidyverse에서 패키지를 쉽게 설치하고 로드합니다.
  • 1.5k
  • R
  • GNU General Public License v3.0

featureform

가상 기능 저장소. 기존 데이터 인프라를 기능 저장소로 전환합니다.

mlreef

기계 학습을 위한 협업 작업 공간.
  • 1.4k
  • Kotlin
  • GNU General Public License v3.0

MLBox

MLBox는 강력한 Automated Machine Learning 파이썬 라이브러리입니다.
  • 1.4k
  • Python
  • GNU General Public License v3.0

hyperlearn

2-2000배 더 빠른 ML 알고, 50% 더 적은 메모리 사용량, 모든 하드웨어(신규 및 구형)에서 작동합니다.

Knet.jl

Koç University 딥 러닝 프레임워크..

awesome-fraud-detection-papers

사기 탐지에 대한 데이터 마이닝 논문의 선별된 목록입니다.
  • 1.4k
  • Python
  • Creative Commons Zero v1.0 Universal

zenml

ZenML 🙏: 프로덕션 머신 러닝을 위한 재현 가능한 ML 파이프라인을 만들기 위한 MLOps 프레임워크입니다. [이동 위치: https://github.com/zenml-io/zenml] (by maiot-io).
  • 1.4k
  • Python
  • Apache License 2.0

Optimus

:truck: Pandas, Dask, cuDF, Dask-cuDF, Vaex 및 PySpark(ironmussa 제공)를 사용하여 애자일 데이터 준비 워크플로를 쉽게 만들 수 있습니다.
  • 1.4k
  • Python
  • Apache License 2.0

pycm

Python의 다중 클래스 혼란 행렬 라이브러리.

lifetimes

Python의 평생 가치.

tsv-utils

eBay의 TSV 유틸리티: 큰 테이블 형식 데이터 파일용 명령줄 도구입니다. 필터링, 통계, 샘플링, 조인 등..
  • 1.4k
  • D
  • Boost Software License 1.0

machine_learning_refined

교과서 "Machine Learning Refined"(Cambridge University Press 발행) 2판에 대한 참고 사항, 예제 및 Python 데모..
  • 1.3k
  • Python
  • GNU General Public License v3.0

drake

재현성 및 고성능 컴퓨팅을 위한 R 중심 파이프라인 툴킷(ropensci 제공).
  • 1.3k
  • R
  • GNU General Public License v3.0 only

budgetml

10줄 미만의 코드로 예산에 따라 ML 추론 서비스를 배포합니다.
  • 1.3k
  • Python
  • Apache License 2.0

janitor

R에서 데이터 정리를 위한 간단한 도구.
  • 1.3k
  • R
  • GNU General Public License v3.0

uncertainty-baselines

다양한 작업에 대한 표준 및 SOTA 방법의 고품질 구현..
  • 1.3k
  • Python
  • Apache License 2.0

refinery

자연어 데이터를 확장, 평가 및 유지 관리하기 위한 데이터 과학자의 오픈 소스 선택입니다. 교육 데이터를 소프트웨어 아티팩트처럼 취급하십시오.
  • 1.2k
  • Python
  • Apache License 2.0

DataProfiler

귀하의 데이터에는 무엇이 있습니까? 데이터 세트에서 스키마, 통계 및 항목을 추출합니다.
  • 1.2k
  • Python
  • Apache License 2.0

pyspark-example-project

PySpark ETL 작업 및 애플리케이션에 대한 모범 사례를 구현하는 예제 프로젝트..

DALEX

탐색 및 설명을 위한 모델 불가지론적 언어.
  • 1.2k
  • Python
  • GNU General Public License v3.0 only

ppd599

Python 및 Jupyter를 사용한 USC 도시 데이터 과학 과정 시리즈.

yt-channels-DS-AI-ML-CS

데이터 과학, 데이터 엔지니어링, 머신 러닝, 딥 러닝, 컴퓨터 과학, 프로그래밍, 소프트웨어 엔지니어링 등을 위한 180개 이상의 YouTube 채널의 포괄적인 목록입니다.

Awesome-LLMOps

개발자를 위한 최고의 LLMOps 도구 목록입니다.
  • 1.2k
  • Shell
  • Creative Commons Zero v1.0 Universal

azureml-examples

GitHub Actions로 테스트된 공식 커뮤니티 기반 Azure Machine Learning 예제..