Universe本节汇集了众多与spaCy共同开发或为其开发的优质资源。内容包括独立软件包、插件、扩展组件、教学资料、运维工具以及其他语言的绑定接口。Adept Augmentations 一个Python库,旨在针对少样本场景下的命名实体识别(NER)训练数据进行解析和增强。Aim-spaCy Aim-spaCy 是一个基于 Aim 的 spaCy 实验追踪器。alibi 用于监控和解释机器学习模型的算法AllenNLP 一个基于PyTorch和spaCy的开源NLP研究库amrlib 一个Python库,使AMR解析、生成和可视化变得简单。Asent 快速、灵活且透明的情绪分析Augmenty 您的NLP流程上的点睛之笔Bagpipes spaCy 一个包含各种NLP任务的定制spaCy管道集合。BERTopic 利用BERT和c-TF-IDF创建易于解释的主题。Blackstone 用于非结构化法律文本NLP的spaCy流程和模型Chatterbot 基于机器学习的对话引擎,用于创建聊天机器人Classy Classification 你是否曾因需要一个spaCy TextCategorizer却苦于没有时间从头训练而困扰?Classy Classification就是你的理想解决方案!CleanNLP R语言中NLP的整洁数据模型concepCy spaCy中的多语言知识图谱Concise Concepts Concise Concepts 利用基于词嵌入相似性的少样本命名实体识别(NER),让您轻松上手!Constituent Treelib 轻松提取成分!Contextual Spell Check 基于BERT(双向表征)的上下文拼写纠正cookiecutter-spacy-fastapi 基于Docker的cookiecutter模板,用于快速构建spaCy API(使用FastAPI框架)Coreferee 多语言共指消解VA COVID-19 NLP BSV 用于COVID-19监测的spaCy流程管道。跨语言共指消解 一个多语言共指消解模型统治一切!DaCy 高效的丹麦语NLP处理流程Date spaCy 使用spaCy轻松识别文本中的日期deplacy 基于CUI的通用依存关系和即时连锁分析树可视化工具Dframcy Dataframe与spaCy NLP的集成displaCy 现代化的句法依存关系可视化工具displaCy ENT 一个现代化的命名实体可视化工具Dragonfire 适用于基于Ubuntu的Linux发行版的开源虚拟助手EDS-NLP 用于从法语临床笔记中提取信息的spaCy组件。eMFDscore : 适用于Python的扩展道德基础词典评分工具 Python扩展道德基础词典评分eng_spacysentiment 使用spaCy管道进行简单情感分析explacy 一个解释spaCy解析结果的小工具Forte Forte是一个用于构建自然语言处理流程的工具包,具有跨任务交互、可适配的数据模型接口和可组合的流程特性。GLiNER spaCy Wrapper 将GLiNER的高级命名实体识别与spaCy集成gobbli 深度学习用于文本分类并不需要令人畏惧Graphbrain 自动化的意义提取与文本理解greCy spaCy的古希腊语处理管道Healthsea Healthsea: 一个端到端的spaCy流程,用于探索保健品效果Hammurabi Python 规则处理引擎 🏺Hobbit spaCy 中土世界的自然语言处理Holmes 基于谓词逻辑的英文和德文文本信息抽取HuSpaCy HuSpaCy: 工业级匈牙利语自然语言处理ipymarkup NER, 句法标记可视化Kindred 使用spaCy进行生物医学关系抽取Klayers 将spaCy作为AWS Lambda层使用LatinCy 面向拉丁语NLP的预训练spaCy管道lemminflect 一个用于英语词形还原和屈折变化的Python模块Lemmy 丹麦语词形还原器LingFeat 一种用于可读性评估和文本简化的语言特征提取(文本分析)工具Ludwig 无需代码的深度学习工具箱基于规则的匹配器探索器 通过交互式创建令牌模式来测试spaCy基于规则的匹配器medspaCy 用于临床自然语言处理的spaCy工具包。MindMeld - 对话式AI平台 面向深度领域语音界面和聊天机器人的对话式AI平台MLflow 一个面向机器学习生命周期的开源平台mordecai 基于spaCy、Geonames和Keras的全文地理解析negspaCy 基于NegEx算法用于文本中概念否定的spaCy管道对象。neuralcoref 基于神经网络和spaCy的最先进共指消解技术Neuralcoref Visualizer 基于神经网络和spaCy的最先进共指消解技术NeuralGym 一个用于训练spaCy模型的小型Windows图形界面NLP Architect Intel AI开发的用于探索深度自然语言处理与理解的Python库NLPCloud.io 面向生产环境的spaCy模型就绪APINumber spaCy 使用spaCy增强文本中的数字实体识别numerizer 将自然语言中的数字转换为整数和浮点数。OdyCy 适用于古希腊语的通用语言处理管道。parsigs 利用spaCy简化处方文本结构化处理PatternOmatic 轻松发现语言模式phruzz-matcher 使用RapidFuzz的短语匹配器pic2phrase_bot: 图片描述生成器 一个以类人方式为提交的照片生成描述的机器人。Prefect 专为现代基础设施设计的工作流管理系统Presidio 支持上下文感知、可插拔和可定制的数据保护及个人身份信息(PII)数据匿名化Presidio Research 用于开发和评估PII检测器、PII的NER模型以及生成虚假PII数据的工具箱presque 当代法语标准化工具Prodigy 由主动学习驱动的极致高效机器教学PyATE Python 自动化术语提取pyInflect 一个用于单词变形的Python模块pySBD - python 句子边界消歧 开箱即用的基于规则的句子边界检测quelquhui 当代法语分词器Rasa 将自然语言转化为结构化数据Redfield NLP Nodes for KNIME 使spaCy库的功能在KNIME分析平台中可用。RITA DSL 用于创建语言规则的领域特定语言用于罗马尼亚法律文档处理的spaCy工具包 rolegal: 用于嘈杂罗马尼亚法律文档处理的spaCy工具包RONEC - 罗马尼亚命名实体语料库 罗马尼亚语命名实体识别语料库。ruby-spacy 通过PyCall从Ruby使用spaCy的封装模块ruTS 一个用于从俄语文本中提取统计数据的库SaysWho 引文识别、归属与解析scattertext 不同文档类型间语言差异的优美可视化展示scispaCy 面向科学/生物医学文档的完整spaCy流程和模型scrubadub_spacy 使用spaCy从文本中移除个人身份信息。Berkeley Neural Parser 基于自注意力编码器的成分句法分析 (ACL 2018)sense2vec 利用NLP超越基础的word2vec英语解释句型 English interpretation for accurate translation from English to JapaneseSentimental Onix 使用onnx进行情感模型分析skweak NLP的弱监督solipCysme 用于法语小说和第一人称视角文本的spaCy处理流程。spacy_api 用于在独立专用进程中加载模型的服务器/客户端spaCy-CLD 使用CLD2为您的spaCy管道添加语言检测功能Spacy FastLang 快速语言检测spacy_readability 向Doc对象添加文本可读性元数据Spacy Syllables 多语言音节标注Spacy Annoy 集成Spacy NLP和Annoy实现基于spaCy语言标签的语义文本搜索spacy-api-docker spaCy REST API, 封装于Docker容器中spacy-api-docker-v3 spaCy v3 REST API,封装在Docker容器中spacy-clausie ClausIE信息提取系统的Python+spaCy实现spacy-cleaner 使用spaCy轻松清理文本!spacy_conll 使用`spacy`、`spacy-stanza`和`spacy-udpipe`解析CoNLL-U格式spacy-cpp C++ 封装库 for spaCyDBpedia Spotlight for SpaCy 使用DBpedia Spotlight链接SpaCy中的实体spacy-experimental 前沿实验性spaCy组件与功能spacy-graphql 使用GraphQL查询spaCy的语言学标注spacy-huggingface-hub 将您的spaCy管道推送到Hugging Face Hubspacy-iwnlp 使用IWNLP进行德语词形还原spacy-js 基于Python REST API的spaCy JavaScript接口spacy-layout 使用spaCy处理PDF、Word文档等spacy-lefff 使用Lefff进行词性标注和法语词形还原spacy-nlp 通过Socket.IO将spaCy NLP文本解析功能暴露给Node.js(及其他语言)spaCy - 部分标注器 spaCy中部分标注数据集的序列标注器PyTextRank 基于Py实现的TextRank轻量级短语抽取算法spaCy-PyThaiNLP PyThaiNLP for spaCyspacy-report 为spaCy模型生成交互式报告。spaCy - sentence-transformers 在spaCy中直接使用预训练句子转换器(BERT、RoBERTa、XLM-RoBERTa等)的管道spacy-sentiws 使用SentiWS的德语情感评分spaCy Server 🦜 面向spaCy NLP的容器化HTTP APIspacy-setfit-textcat spaCy项目:SetFit与小样本分类实验spacy-stanza 直接在spaCy中使用最新的Stanza(斯坦福NLP)研究模型spacy-streamlit 用于Streamlit应用的spaCy构建模块spacytextblob 一个用于spaCy的TextBlob情感分析管道组件。spacy-transformers 用于预训练BERT、XLNet和GPT-2的spaCy管道spacy-udpipe 直接在spaCy中使用最新的UDPipe模型spaCy - 通用句子编码器 在spaCy中直接使用谷歌的通用句子编码器spaCy Visual Studio Code 扩展 在VS Code中使用spaCy的配置文件spacy-wasm 在浏览器中使用WebAssembly运行spaCyspaCy Whisper Whisper与spaCy NLP的无缝集成spacy-wordnet WordNet 与 spaCy 相遇spaCy-wrap 用于在spaCy管道中封装微调后的transformers模型spaCy .NET 封装库 SpacyDotNet是一个基于Python.NET的.NET Core兼容封装器,用于spaCyspaCy fishing 在spaCy中使用Entity-Fishing实现维基数据的命名实体消歧与链接。spacymoji 表情符号处理与元数据作为spaCy流水线组件spaCyOpenTapioca 通过OpenTapioca在spaCy上实现维基数据的命名实体链接spacypdfreader 使用Python轻松实现PDF转文本并提取为spaCy文本。spacyr spaCy的R语言封装包spaCysee 可视化spaCy的依存句法分析、词性标注和形态学分析spaCy-SetFit 一种简单直观的方法,将SetFit与spaCy结合使用。spaczz 为spaCy提供模糊匹配等更多功能。SpanMarker 在spaCy中轻松实现最先进的命名实体识别textacy NLP, before and after spaCyTextDescriptives 提取描述性统计、可读性和句法复杂度指标Texthero 从零到英雄的文本预处理、表示与可视化。textnets 使用网络进行文本分析textpipe 清理并提取文本中的元数据tmtoolkit 文本挖掘与主题建模工具包tokenwiser 将vowpal-wabbit和scikit-learn模型连接到spaCy,以运行简单的分类基准测试。附带许多用于spaCy管道的实用功能。torchtext 面向文本和自然语言处理的数据加载器与抽象层TRUNAJOD 基于spaCy构建的文本分析复杂度库Vetiver 版本管理、共享、部署和监控模型。whatlies 制作交互式可视化,揭示词嵌入中“隐藏”的内容。WordDumb 一个生成Word Wise和X-Ray文件的calibre插件。Zshot 零样本和小样本命名实体与关系识别发现错误或某些功能无法正常工作? 如果您遇到一个无法运行或与报告的spaCy版本不兼容的universe项目,请通过 开启讨论帖告知我们。提交您的项目 如果你有一个希望spaCy社区使用的项目,可以通过向spaCy网站仓库提交pull request来推荐它。Universe数据库是开源的,并以简单的JSON文件形式收集。有关格式和可用字段的更多详情,请参阅文档。正在寻找开发自己的spaCy插件或扩展的灵感?请查看讨论区的项目创意板块。Read the docsJSON source