"데이터 과학" 태그별 라이브러리

dagster

데이터 자산의 개발, 생산 및 관찰을 위한 오케스트레이션 플랫폼입니다.
  • 8.0k
  • Python
  • Apache License 2.0

machine-learning-systems-design

실습이 포함된 기계 학습 시스템 설계 소책자입니다. "기계 학습 시스템 설계"라는 책의 저장소가 아닙니다.

vaex

Out-of-Core 하이브리드 Apache Arrow/NumPy DataFrame for Python, ML, 시각화 및 초당 10억 행의 빅 테이블 형식 데이터 탐색 🚀.

data-science-interviews

데이터 과학 인터뷰 질문 및 답변.
  • 7.7k
  • HTML
  • Creative Commons Attribution 4.0

machine_learning_examples

기계 학습 예제 및 자습서 모음..

tsfresh

시계열에서 관련 기능 자동 추출:.

python-small-examples

告别枯燥,致力于打造 Python 实用小例子,更多Python良心教程见 Python中文网 http://www.zglg.work.

pycaret

Python의 오픈 소스, 로우 코드 기계 학습 라이브러리입니다.

wowchemy-hugo-themes

😍 EASILY BUILD THE WEBSITE YOU WANT - NO CODE, JUST MARKDOWN BLOCKS! 创建在线课程,学术简历或初创网站。#OpenScience.

catboost

Python, R, Java, C++에 대한 순위 지정, 분류, 회귀 및 기타 기계 학습 작업에 사용되는 빠르고 확장 가능한 고성능 Gradient Boosting on Decision Trees 라이브러리입니다. CPU 및 GPU에서 계산을 지원합니다.
  • 7.3k
  • Python
  • Apache License 2.0

pyod

이상 감지(이상 감지)를 위한 포괄적이고 확장 가능한 Python 라이브러리.
  • 7.3k
  • Python
  • BSD 2-clause "Simplified"

wandb

🔥 기계 학습 실험을 시각화하고 추적하기 위한 도구입니다. 이 저장소에는 CLI 및 Python API가 포함되어 있습니다..

akshare

AKShare is an elegant and simple financial data interface library for Python, built for human beings! 开源财经数据接口库 (by akfamily).

metaflow

:rocket: 실제 데이터 사이언스 프로젝트를 쉽게 구축하고 관리하세요!.
  • 6.9k
  • Python
  • Apache License 2.0

cookiecutter-data-science

데이터 사이언스 작업을 수행하고 공유하기 위한 논리적이고 합리적으로 표준화되었지만 유연한 프로젝트 구조..

featuretools

자동화된 기능 엔지니어링을 위한 오픈 소스 Python 라이브러리입니다.
  • 6.7k
  • Python
  • BSD 3-clause "New" or "Revised"

sktime

시계열을 사용한 기계 학습을 위한 통합 프레임워크입니다.
  • 6.7k
  • Python
  • BSD 3-clause "New" or "Revised"

deeplake

AI용 데이터베이스. 벡터, 이미지, 텍스트, 비디오 등을 저장합니다. LLM/LangChain과 함께 사용합니다. 모든 AI 데이터를 저장, 쿼리, 버전 지정 및 시각화합니다. 데이터를 실시간으로 PyTorch/TensorFlow로 스트리밍합니다. https://activeloop.ai.
  • 6.5k
  • Python
  • Mozilla Public License 2.0

machine-learning-roadmap

기계 학습에서 가장 중요한 많은 개념, 이를 학습하는 방법 및 이를 수행하는 데 사용할 도구를 연결하는 로드맵입니다.

roughViz

브라우저에서 스케치/손으로 그린 ​​스타일 차트를 만들기 위한 재사용 가능한 JavaScript 라이브러리..

imbalanced-learn

기계 학습에서 불균형 데이터 세트의 저주를 해결하기 위한 Python 패키지.

H2O

H2O는 오픈 소스, 분산형, 빠르고 확장 가능한 머신 러닝 플랫폼입니다: 딥 러닝, 경사 부스팅(GBM) 및 XGBoost, 랜덤 포레스트, 일반화 선형 모델링(GLM with Elastic Net), K-평균, PCA, 일반화 추가 모델(GAM)), RuleFit, SVM(Support Vector Machine), 누적 앙상블, AutoML(Automatic Machine Learning) 등

folium

파이썬 데이터. Leaflet.js 지도..

cleanlab

복잡한 실제 데이터 및 레이블을 사용하여 데이터 품질 및 머신 러닝을 위한 표준 데이터 중심 AI 패키지..
  • 6.3k
  • Python
  • GNU Affero General Public License v3.0

boltons

🔩 빌트인과 비슷하지만 볼튼. Python 표준 라이브러리를 확장하는 250개 이상의 구성, 레시피 및 스니펫. 마이클 볼튼 같은 건..
  • 6.2k
  • Python
  • BSD 3-clause "New" or "Revised"

darts

시계열에 대한 사용자 친화적인 예측 및 이상 감지를 위한 파이썬 라이브러리..
  • 6.1k
  • Python
  • Apache License 2.0

data-science-blogs

선별된 데이터 과학 블로그 목록입니다.

nteract

📘 당신을 위한 대화형 컴퓨팅 제품군! ✨.

dowhy

DoWhy는 인과 관계 가정의 명시적 모델링 및 테스트를 지원하는 인과 관계 추론을 위한 Python 라이브러리입니다. DoWhy는 인과관계 그래픽 모델과 잠재적 결과 프레임워크를 결합한 인과관계 추론을 위한 통합 언어를 기반으로 합니다.

autogluon

AutoGluon: 이미지, 텍스트, 시계열 및 표 형식 데이터용 AutoML.
  • 6.0k
  • Python
  • Apache License 2.0