spacy — это пакет обработки естественного языка Python, который может выполнять анализ частей речи, распознавание именованных объектов, определение характеристик зависимостей, а также расчет и визуализацию векторов встраивания слов в тексты на естественном языке.
Если при использовании «pip install spacy» сообщается об ошибке или spacy не может быть вызван нормально после его установки, вы можете загрузить файл whl на локальный компьютер по следующей ссылке, затем перейти к пути к файлу и установить его через pip.
pip install spacy
Ссылка для скачивания:
Archived: Python Extension Packages for Windows - Christoph Gohlke (uci.edu)
Выберите соответствующую версию:
2.1: английский = python -m spacy download en_core_web_sm
2.2: Китайский = python -m spacy download zh_core_web_sm
Вы можете вручную загрузить пакет, а затем загрузить его.
Скачать адрес = https://github.com/explosion/spacy-models/releases/download/zh_core_web_sm-3.7.0/zh_core_web_sm-3.7.0-py3-none-any.whl
После загрузки выполните команду: pip install zh_core_web_sm-3.7.0-py3-none-any.whl
Загрузите файл whl на свой локальный компьютер по ссылке ниже:
zh_core_web_sm · Releases · explosion/spacy-models (github.com)
Выберите соответствующую версию:
Загрузите файл zh_core_web_sm.whl соответствующей версии, перейдите в каталог, в котором сохранен файл, а затем установите его через pip.
pip install spacy
python -m spacy download zh_core_web_sm
Советы для успешной установки:
Загрузите файл whl на свой локальный компьютер по ссылке ниже:
en_core_web_sm · Releases · explosion/spacy-models (github.com)
Выберите соответствующую версию:
Загрузите файл zh_core_web_sm.whl соответствующей версии, перейдите в каталог, в котором сохранен файл, а затем установите его через pip.
# Импортировать урок английского языка
from spacy.lang.en import English
# Создайте экземпляр объекта класса nlp, включая конвейер.
nlp = English()
# print(nlp)
doc = nlp("December is excited!")
# Перебирать токены
for token in doc:
print(token.text)
token = doc[1]
print(token.text)
Результат вывода:
December
is
excited
!
is
# Текст процесса
nlp = spacy.load('zh_core_web_sm')
doc = nlp("Nvidia готовится купить этот французский стартап за 2 миллиарда долларов.")
# Обход идентифицированных объектов
for ent in doc.ents:
# Печать текста объекта и его аннотаций
print(ent.text, ent.label_)
Результат вывода:
NVIDIA ORG
2 миллиарда долларов США MONEY
Франция NORP