トップQs
タイムライン
チャット
視点

SpaCy

自然言語処理用のソフトウェアライブラリ ウィキペディアから

SpaCy
Remove ads

spaCy ([spˈs] spay-SEE) は、高度な自然言語処理を行うためプログラミング言語PythonCythonで書かれたオープンソースソフトウェア・ライブラリである[3][4]。このライブラリはMITライセンスの下で公開されており、現在、英語、ドイツ語、スペイン語、ポルトガル語、フランス語、イタリア語、オランダ語に対する種々の解析処理と多言語固有表現抽出のための統計的ニューラルネットワークモデル、また、その他様々な言語に対する字句解析モデルを提供している[5]

概要 作者, 開発元 ...

教育や研究に広く使用されているNLTKとは異なり、spaCyは製品用途のソフトウェアを提供することに重点を置いている[6][7]。バージョン1.0の時点で、spaCyはTensorFlowKerasscikit-learnPyTorch[8]等のよく知られた機械学習ライブラリによって訓練された統計モデルが使用できるディープラーニングのためのワークフローをサポートしている[9]。spaCyの機械学習ライブラリであるThincが、個別のオープンソースPythonライブラリとして公開されている[10]。2017年11月7日にバージョン2.0がリリースされた[11]品詞タグ付け構文解析固有表現抽出のための畳み込みニューラルネットワークモデルや、およびモデルの訓練と更新、カスタム処理パイプラインの構築周りのAPIの改善を含んでいる。

Remove ads

主な特徴

拡張機能とビジュアライザ

Thumb
displaCyビジュアライザで生成された依存解析木の可視化

spaCyには、無料のオープンソースライブラリとして利用できるいくつかの拡張機能とビジュアライザが付属している。

脚注

関連項目

外部リンク

Loading related searches...

Wikiwand - on

Seamless Wikipedia browsing. On steroids.

Remove ads