"데이터 과학" 태그별 라이브러리

skweak

skweak: NLP 작업에 적용되는 약한 감독을 위한 소프트웨어 툴킷.

hamilton

데이터 흐름을 정의하기 위한 확장 가능한 범용 마이크로 프레임워크입니다. 이 저장소는 www.github.com/dagworks-inc/hamilton으로 이동되었습니다.
  • 878
  • Python
  • BSD 3-clause Clear

vertex-ai-samples

Google Cloud의 엔드 투 엔드 머신러닝 플랫폼인 Vertex AI용 샘플 코드 및 노트북입니다.

sematic

오픈 소스 ML 파이프라인 개발 플랫폼입니다.
  • 853
  • Python
  • GNU General Public License v3.0

rows

형식에 관계없이 테이블 형식 데이터에 대한 일반적이고 아름다운 인터페이스입니다.
  • 848
  • Python
  • GNU Lesser General Public License v3.0 only

Daft

복잡한 데이터를 위한 Python DataFrame.
  • 845
  • Python
  • Apache License 2.0

kotlin-statistics

Kotlin의 관용적 통계 연산자입니다.
  • 842
  • Kotlin
  • Apache License 2.0

MAPIE

예측 간격을 추정하기 위한 scikit-learn 호환 모듈..

explorer

Elixir에서 빠르고 우아한 데이터 탐색을 위한 시리즈(1차원) 및 데이터 프레임(2차원).

code

Data Professor YouTube 채널에서 R 및 Python 프로그래밍 코드를 편집합니다. (dataprofessor에 의해).

Deep-Learning-Machine-Learning-Stock

딥 러닝 및 머신 러닝 주식은 투자자와 거래자에게 유망한 장기 또는 단기 기회를 나타냅니다. [이동 위치: https://github.com/LastAncientOne/Deep_Learning_Machine_Learning_Stock].

mlr3

mlr3: R의 기계 학습 - 차세대.
  • 790
  • R
  • GNU Lesser General Public License v3.0 only

pyGAM

[도움 요청] Python의 일반화된 추가 모델.
  • 782
  • Python
  • Apache License 2.0

targets

R을 위한 함수 지향 Make와 같은 선언적 워크플로.
  • 771
  • R
  • GNU General Public License v3.0

plotly-resampler

plotly.py로 대규모 시계열 데이터를 시각화합니다.

LightAutoML

LAMA - 자동 모델 생성 프레임워크.
  • 767
  • Python
  • Apache License 2.0

zingg

ML을 사용한 확장 가능한 ID 확인, 엔터티 확인, 데이터 마스터링 및 중복 제거.
  • 760
  • Java
  • GNU Affero General Public License v3.0

python-crfsuite

crfsuite에 대한 파이썬 바인딩.

intro-to-python

[READ-ONLY MIRROR] 데이터 과학자 지망생을 위한 Python 및 프로그래밍 소개.

meerkat

모든 데이터 세트의 창의적인 대화형 보기..
  • 739
  • Python
  • Apache License 2.0

Senior-Dev-Roadmap

궁극의 파이썬 개발자 로드맵✨.

engsoccerdata

영국 및 유럽 축구 결과 1871-2022.
  • 727
  • R

kuwala

Kuwala는 BI 분석가 및 엔지니어를 위한 코드 없는 데이터 플랫폼으로 강력한 분석 워크플로를 구축할 수 있습니다. 우리는 Airbyte, dbt 또는 Great Expectations와 같이 여러분이 좋아하는 최첨단 데이터 엔지니어링 도구를 React Flow로 구축된 하나의 직관적인 인터페이스에 함께 제공하기 시작했습니다. 또한 지리 공간 데이터에 중점을 둔 데이터 과학 모델 및 제품에 제3자 데이터를 제공합니다. 현재 전 세계적으로 다음 데이터 커넥터를 사용할 수 있습니다. a) 고해상도 데모그래프.

python-mini-project

🙌 오픈 소스 Python 미니 프로젝트 기여를 환영합니다!.

hamilton

데이터 흐름을 정의하기 위한 확장 가능한 범용 마이크로 프레임워크입니다. 이를 사용하여 데이터 프레임, numpy 행렬, 파이썬 개체, ML 모델, LLM 워크플로 등을 구축할 수 있습니다. spark, airflow, jupyter, fastapi, python 스크립트 등. 기본적으로 계보와 함께 제공됩니다. (DAGWorks-Inc에 의해).
  • 721
  • Python
  • BSD 3-clause Clear

pdpipe

Pandas DataFrames를 위한 간편한 파이프라인..

youtube-comment-downloader

Youtube API를 사용하지 않고 Youtube 댓글을 다운로드하기 위한 간단한 스크립트입니다.

caer

Python의 고성능 Vision 라이브러리입니다. 상용구가 아닌 연구를 확장하십시오..

NIPY

신경 영상 패키지를 위한 워크플로우 및 인터페이스.
  • 695
  • Python
  • GNU General Public License v3.0

mlem

🐶 모든 플랫폼에서 모든 ML 모델을 패키징, 제공 및 배포하는 도구..
  • 693
  • Python
  • Apache License 2.0