MeCab: Yet Another Part-of-Speech and Morphological Analyzer

MeCab」は 京都大学情報学研究科 日本電信電話株式会社コミュニケーション科学基礎研究所共同研究ユニットプロジェクトを通じて開発されたオープンソース形態素解析エンジン。フリーソフトウェア、GPL(the GNU General Public License), LGPL(Lesser GNU General Public License)、または BSD ライセンスに従って使用、再配布することができる。

MeCabの特徴
  • 辞書、コーパスに依存しない汎用的な設計
  • 条件付き確率場(Conditional Random Fields, CRF)に基づく高い解析精度
  • ChaSen や KAKASI に比べ高速
  • 辞書引きアルゴリズム/データ構造に、 高速な TRIE 構造である Double-Arrayを採用
  • 再入可能なライブラリ
  • 各種スクリプト言語バインディング(perl/ruby/python/java/C#)

MeCab: Yet Another Part-of-Speech and Morphological Analyzer
一般ユーザ向けメーリングリスト
開発者向けメーリングリスト
[1795] Posted by kagahiro at 2010/03/26 11:30:15
オープン | 1 point | Link (0) | Trackback (0) | Comment (1)

キーワード
オープンソース 形態素解析エンジン MeCab 

kagahiroのホームページ


MeCab: Yet Another Part-of-Speech and Morphological Analyzer トラックバック

トラックバックURL :


MeCab: Yet Another Part-of-Speech and Morphological Analyzerへのコメント

1 Posted by エルメス バーキン at 2013/04/11 17:30:49
お世話になります。とても良い記事ですね。

詳細の入力フィールドを表示する

おすすめ  (チェックしてコメントすると最新情報に掲載)
コメント :

< 前の投稿      次の投稿 >

アクセスランキング

今日のアクセスランキング TOP 10

  1. SQLのSELECT文で先頭から上位(TOP)10件のレコードを取得する方法(SQL Server、Oracle、MySQL、PostgreSQL) (30 PV)
  2. [将棋]竜王戦第三局は居飛車振り飛車の対抗型で丸山忠久九段が勝利 #竜王戦 (21 PV)
  3. [食べ物]七草粥(ななくさがゆ) (21 PV)
  4. Google News (グーグルニュース)日本版 (21 PV)
  5. フリーソフトウェア/オープンソースのタブー (19 PV)
  6. グーグルニュース(Google News)日本語版が見れるURL (17 PV)
  7. 安倍内閣、内閣改造後も世論調査で支持率低迷。「首相が信頼できない」が56% (15 PV)
  8. 米国のブラックフライデー(黒い金曜日)に便乗しイオンなど流通各社がセールを開催 (10 PV)
  9. [Perl]UTF-8でエンコードされた文字列の文字数を取得するコード (10 PV)
  10. 2NN 2ちゃんねるニュース速報+ナビ (5 PV)

今月のアクセスランキング TOP 10

  1. SQLのSELECT文で先頭から上位(TOP)10件のレコードを取得する方法(SQL Server、Oracle、MySQL、PostgreSQL) (2843 PV)
  2. グーグルニュース(Google News)日本語版が見れるURL (729 PV)
  3. フリーソフトウェア/オープンソースのタブー (493 PV)
  4. [食べ物]七草粥(ななくさがゆ) (477 PV)
  5. [将棋]竜王戦第三局は居飛車振り飛車の対抗型で丸山忠久九段が勝利 #竜王戦 (473 PV)
  6. Google News (グーグルニュース)日本版 (445 PV)
  7. [将棋]将棋実況ユーチューバーのクロノさんが朝日新聞のクレームで棋譜中継を配信中止 (219 PV)
  8. グーグルニュース(Google News)のRSS/atomが取得できない (171 PV)
  9. USTREAM(ユーストリーム) 日本語版 無料のライブ映像配信サービス (157 PV)
  10. [Perl]UTF-8でエンコードされた文字列の文字数を取得するコード (137 PV)

アクセス統計

ディレクトリ

関連サイト