リンク(まだ) |
[Filter::POPFile] |
とりあえず動かすのを目標に。
html_language Nihongoとだけ書いたファイルを準備してサーバへ転送する。
POPFile は、POPFILE_USER 環境変数を元にデータフォルダを探しにいく。CGI を動かすユーザにあらかじめ環境変数を設定しておくか、CGI 内で
$ENV{'POPFILE_USER'} = /path/to/data_folder/;という感じで設定しておく。
デフォルトではログファイルは POPFile のデータフォルダ内に保存される。この保存先を変更したい場合は、設定ファイル (popfile.cfg) の logger_logdir を編集する。
現状では、ログファイルを定期的に削除する機能がないため、ログを保存したくない場合は GLOBAL_debug オプションを 0 にするとよい。動作に問題がないことが確認できたら、無効にしてもよいだろう。
今のところ、定義している関数は classify (分類させる) と train (学習させる) のみ。
# POPFile に分類させる # %FORM にフォームの内容が保存されている use Filter::POPFile; my $bucket = Filter::POPFile::classify( -title => $FORM{'dai'}, -name => $FORM{'name'}, -body => $FORM{'t'}, -encode => 'Shift_JIS', -remote_addr => $ENV{'REMOTE_ADDR'}, -remote_host => $ENV{'REMOTE_HOST'}, -http_user_agent => $ENV{'HTTP_USER_AGENT'}, ); # POPFile に学習させる # @line に掲示板への書き込みデータが保存されている use Filter::POPFile; my $result = Filter::POPFile::train( -title => $line[3], -name => $line[4], -body => $line[7], -encode => 'Shift_JIS', -remote_addr => ( $line[13] || '' ), -remote_host => ( $line[12] || '' ), -http_user_agent => ( $line[14] || '' ), );
まだ。