うーん、CaboCha ってどういうしくみで動いてんねやろなあ。
これ、副詞「かなり」の係り先を調べよう思て、解析してみてん。
# ipadic
$cabocha
それはかなり昔の話です。
それは-----D
かなり-D |
昔の-D
話です。
EOS
それはかなり昔の案件です。
それは-----D
かなり---D
昔の-D
案件です。
EOS
それはかなり昔の事件です。
それは-----D
かなり---D
昔の-D
事件です。
EOS
どれも「昔」に係るはずやろ?
追記 191124
形態素解析用の辞書に UniDic を使うように設定した。
#unidic
$ cabocha
それはかなり昔の話です。
それは---D
かなり昔の-D
話です。
EOS
それはかなり昔の案件です。
それは---D
かなり昔の-D
案件です。
EOS
それはかなり昔の事件です。
それは---D
かなり昔の-D
事件です。
EOS
UniDicを使うと、「かなり昔の」と1文節になる。個人的には、揺れがなく信頼できると思ったけど、文節とは……。