tfidf_ja

tfidf_jaは与えられた単語の配列の TF-IDF を算出し、単語をキー、TF-IDF値をバリューとするハッシュテーブルを返却するライブラリです。

特徴

tfidf_jaには以下の特徴があります。

インストール方法

コマンドプロンプトより以下を実行してください。

$ gem install tfidf_ja

サンプル

単語の配列からTF-IDFを取得

require 'rubygems'
require 'tfidf_ja'

ti = TfIdf::Ja.new
p ti.tfidf(['この', '文章', 'から', 'TFIDF', '値', 'を', '取得', 'する'])

インスタンスを使い回し

インスタンスを使い回すことにより、TF-IDF値は加算されていきます。 複数のテキストから連続して算出する場合に便利です。

付録

公開場所

Copyright © 2011 K.Nishi. See LICENSE.txt for further details.