"NLP" 태그별 라이브러리

negspacy

텍스트의 개념을 부정하기 위한 spaCy 파이프라인 개체입니다.

Indic-BERT-v1

Indic-BERT-v1: 11개의 인도어 및 인도-영어를 위한 BERT 기반 다국어 모델. 최신 Indic-BERT v2는 https://github.com/AI4Bharat/IndicBERT에서 확인하십시오.

gpl

조밀한 검색을 위한 강력한 비지도 도메인 적응 방법. 레이블이 지정되지 않은 말뭉치만 필요하고 엄청난 개선이 이루어집니다.
  • 253
  • Python
  • Apache License 2.0

wikipron

대규모 다국어 발음 마이닝.
  • 252
  • Python
  • Apache License 2.0

lemmatization-lists

23개 언어로 기계가 읽을 수 있는 기본형-토큰 쌍 목록..
  • 249
  • /DEVs
  • ODC Open Database License v1.0

zshot

Zero and Few 샷 명명된 엔터티 및 관계 인식.

kiri

Backprop을 사용하면 최신 ML 모델을 간편하게 사용, 미세 조정 및 배포할 수 있습니다. (기리 아이).
  • 240
  • Python
  • GNU General Public License v3.0

tableQA

테이블 형식 데이터에서 자연어를 쿼리하는 AI 도구..
  • 237
  • Python
  • GNU General Public License v3.0 only

spacyr

SpaCy NLP에 대한 R 래퍼.
  • 234
  • R

deepsegment

실제로 작동하는 문장 분할기!.
  • 228
  • Python
  • GNU General Public License v3.0 only

razdel

규칙 기반 토큰, 러시아어에 대한 문장 분할.

concise-concepts

이 리포지토리에는 spaCy 임베딩에 대한 가장 유사한 확장을 사용하여 퓨샷 NER에 대한 쉽고 직관적인 접근 방식이 포함되어 있습니다. 이제 엔티티 스코어링으로..

LemmInflect

영어 표제어화 및 굴절을 위한 파이썬 모듈..

bllip-parser

BLLIP 재순위 파서(Charniak-Johnson 파서, Charniak 파서, Brown 재순위 파서라고도 함) Python 모듈은 http://pypi.python.org/pypi/bllipparser/를 참조하십시오.

ocrpy

OCR, 아카이브, 색인 및 검색: 독립적인 OCR 프레임워크 구현..

laserembeddings

LASER 다국어 문장을 pip 패키지로 임베딩합니다.
  • 215
  • Python
  • BSD 3-clause "New" or "Revised"

emailGPT

ChatGPT로 이메일을 생성하는 빠르고 쉬운 인터페이스.

edenai-apis

Eden AI: 가능한 최상의 AI 엔진에 연결하는 고유한 API를 제공하여 AI 기술의 사용 및 배포를 단순화합니다.
  • 208
  • Python
  • Apache License 2.0

Multi-Type-TD-TSR

테이블 감지 및 테이블 구조 인식을 위한 다단계 파이프라인을 사용하여 문서 이미지에서 테이블 추출:.

examples

역이미지 검색, 역영상 검색, 오디오 분류, 질의응답 시스템, 분자 검색 등 비정형 데이터를 Towhee로 분석합니다(by towhee-io).

markup

GPT-4:rocket:(samueldobbie 제공)으로 구동되는 웹 기반 문서 주석 도구입니다.

wrench

렌치: 약한 감독 벤치마크.
  • 199
  • Python
  • Apache License 2.0

Cadmium

Crystal용 자연어 처리(NLP) 라이브러리.

gpt4-playground

OpenAI의 ChatGPT 및 Playground 환경을 복제하여 API 키를 실험할 수 있습니다..

DKPro Core

Apache UIMA 프레임워크를 기반으로 하는 자연어 처리(NLP)용 소프트웨어 구성요소 모음입니다.
  • 195
  • Java
  • GNU General Public License v3.0

gpt-j

python3과 함께 사용하여 텍스트, 블로그, 코드 등을 생성하는 GPT-J API입니다.

financial-news-dataset

로이터와 블룸버그.

cedille-ai

✒️ Cedille은 오픈 소스 라이선스로 출시된 대규모 프랑스어 모델(6B)입니다.

konoha

🌿 작은 코드 변경으로 토크나이저 전환이 가능한 사용하기 쉬운 일본어 텍스트 처리 도구..

quickadd

Python(Acreom 제공)에서 자연어 시간 및 날짜 표현을 구문 분석합니다.