phpからmecabのわかち書き

ブログ | 2009/1/10 20:04
file_put_contents($tmpfile,$str);
return shell_exec('/opt/local/bin/mecab -O wakati '.$tmpfile);
こんな感じで、ファイルを作ってみたのだけれど、
http://kudelab.com/archives/15
のソースでは、ファイル必要なし。

-O wakati を足してみよう。

$descriptorspec = array(
 0 => array("pipe", "r"),
 1 => array("pipe", "w")
);
$process = proc_open("/opt/local/bin/mecab -O wakati", $descriptorspec, $pipes);

if(is_resource($process)){
 fwrite($pipes[0], $str);
 fclose($pipes[0]);
 $result = stream_get_contents($pipes[1]);
 fclose($pipes[1]);
 proc_close($process);
 return($result);
}

「神奈川県」をどうやって検索しよう。
「神奈川県」は「神奈川 県」と分かれるから、「神奈川」ではヒットしても「神奈川県」でヒットしない。検索文字列もわかちして「+神奈川 +県」で一応ヒットするけれど、「神奈川と千葉県は東京湾を挟んでいる」がヒットしてしまってよいのだろうか。

あとで考えよう。

my.cnfに
ft_min_word_len=1
は忘れずに。
縮小 拡大

ログインしておくと、後で編集が可能です。

Rottel内コンテンツ

ユーザー一覧

Rottelとは?
利用規約
開発飲料
利用者の声
ヘルプ
close