0.22.2 用の日本語パッチを適用すると分類に失敗することがある問題
解決しました
- この問題は解決し、パッチの内容は POPFile 0.22.3 へ取り込まれました。
問題が発生する環境・条件
- 0.22.2 に、[日本語パッチ]を適用した環境
- ある種のメールを処理した場合に、Text::Kakasi による分かち書きを行った際に文字化けが生じる(他にも原因があるのかどうかについては不明)。
問題の原因
- Kakasi の漢字コード自動判定には問題があり、正しい漢字コードを Text::Kakasi に伝える必要があった。
問題の解決策
- 漢字コードを Text::Kakasi にちゃんと伝える。具体的には、Text::Kakasi::getopt_argv("kakasi", "-w -ieuc -oeuc"); としていた部分を、Text::Kakasi::getopt_argv("kakasi", "-w", "-ieuc", "-oeuc"); と修正した。
関連情報