アイソモカ

知の遊牧民の開発記録

開発記録 191124 Sun (100本ノック #042)

中文老師にいただいた台湾土産の乾麺「曽拌麵 香蔥椒麻」を食べた。油そば。ちょうどよい辛さとネギ油の香りがとてもよく、弾力がありピロピロした平めんも美味しかった。

100本ノック #042

42. 係り元と係り先の文節の表示

係り元の文節と係り先の文節のテキストをタブ区切り形式ですべて抽出せよ.ただし,句読点などの記号は出力しないようにせよ.

やったこと

  • Chunk クラスの __str__(self) 関数を使って、文節のテキストを表示するようにした。
  • この時に、morph.pos が '記号', '補助記号', '空白' であるものは除いた。
  • 係り先文節ID (chunk.dst) から係り先文節が分かるので、並べるだけ。
  • 結果はpython knock042.py > knock042.txt で書き出した。

メッチャ大雑把やけど、後は後で何とかなるやろ。

# knock042 8文目の結果
しかし    思わなかった
その   当時は
当時は    何という考もなかったから
何という考もなかったから     別段恐しいとも
別段恐しいとも    思わなかった

ちょっと気になったこと

係り受け、ムズカシイデスネー。

$ cabocha
朝主人が新聞を読む時は必ず彼の膝の上に乗る。
      朝主人が-------D
          新聞を-----D
          読む時は---D
            必ず彼の-D
        膝の上に乗る。
EOS