20.1MB
1.32MB
SpaCy是一个提供给程序员的语法解析软件。这个软件可以解析Python和Cython高级自然语言,然后我们可以快速分析这些代码语言是否存在错误和漏洞。
软件介绍
SpaCy是Python和CPython的NLP自然语言文本处理库。它基于最新的研究成果,从设计的第一天起就被用于实际产品中。SpaCy有自己的预培训管道,目前支持60多种语言的标记和培训。它拥有最先进的速度和神经网络模型,可用于标记、解析、命名实体识别、文本分类等。它使用BERT等预训练转换器进行多任务学习,以及生产就绪型培训系统和简单的模型打包、部署和工作流管理。
SpaCy软件功能
无损标记对指定实体的确认
预训练的统计模型和词向量
快速
强大且经过严格评估的准确性
简单的深度学习集成基于
部分声控标签
标签依赖性分析
方便的字符串到哈希的映射,基于
句法驱动的句子分割
内置的语法和NER可视化工具。
的高效二进制序列化
Numpy数据数组导出
简单的模型打包和部署
支持50多种语言
软件模型
En_core_web_sm:英文多任务CNN,在OntoNotes上训练,大小11 MB。En_core_web_md:英文多任务CNN,在OntoNotes上训练,嵌入在普通爬虫上训练的手套词,大小91 MB。
En_core_web_lg:英文多任务CNN,在OntoNotes上训练,嵌入在普通爬虫上训练的手套词,大小789 MB。