アイソモカ

知の遊牧民の開発記録

開発記録 200206 Thu (100本ノック #059 途中, Stanford CoreNLP CorefAnnotator)

Stanford CoreNLP の解析結果に句構造解析の結果が入っていなかった。アノテータオプションでルールベースの共参照解析を指定することで解決した。 言語処理100本ノック #059 Stanford CoreNLP の CorefAnnotator 結果の違い Deterministic (ルールベース) …

開発記録 200205 Wed (100本ノック #048, Stanford CoreNLP)

CoreNLP 使うとき、1文しかなくてもごっつ時間かかるねんけど、なんでやろなあ。 2020/02/06 追記:アノテータオプション付けへんと、機械学習の計算ようさんしはるからや。ルールベースの共参照解析を指定すると、そないに時間かからへんで。 isomocha.hate…

開発記録 200204 Tue (100本ノック #057, Stanford CoreNLP)

読み途中の本はあるけど(「Pythonで学ぶあたらしい統計学の教科書」と「ゼロから作る Deep Learning ❷ 自然言語処理編」)、とりあえず 100本ノックを進めよう。 言語処理100本ノック #057: 係り受け解析 有向グラフ 解答 出力

開発記録 200130 Thu (Deep Learning)

「ゼロから作る Deep Learning ❷ 自然言語処理編」(斎藤康毅著、オーム社、オライリージャパン発行)を読みながら、ディープラーニングのコードを書いた。 絵が描けた(お魚の本を見ながら) pic.twitter.com/vOgvO5BSEZ— ξ ピージェイ 𐀠𐀋𐀂 (@xiPJ) 2020年1…

開発記録 200128 Tue (100本ノック #056)

前回 の続き。 言語処理100本ノック #056 続き 解答 結果

開発記録 200127 Mon (100本ノック #054, #055, #056途中)

言語処理100本ノック #054 解答 出力 言語処理100本ノック #055 解答 出力 言語処理100本ノック #056 解答は次回

開発記録 200126 Mon (100本ノック #053)

今回は、Stanford CoreNLP という言語処理ツールを使う。Java で CoreNLP を動かす際にヒープスペースのエラーが出て対処した。それから、Python で XML 形式を読むためのライブラリ ElementTree を初めて使った。 言語処理100本ノック #053 Java をインスト…

開発記録 200113 Mon (Stemming, 100本ノック #052)

前回 #051 は空白を単語の区切りとみなしていたが、hand-written rules などの - でつながった単語がある場合、-も単語の区切りを表しているよな? と今回解きながら思った。 あと、( ) , . " などの記号も単語に含めるべきではないのではないだろうか。 し…

開発記録 200113 Mon (100本ノック #050, #051)

唐突に変な話ですが、「エロ本」の形態素解析、unidic では「エロボン」として登録されているので1語になるんですが、ipa辞書を使うと「エロ」「ホン」と2語になるんですね。 さて、今回から言語処理100本ノック第6章に入ります。 調べたことメモ 関数とかの…

開発記録 200112 Sun (100本ノック #049)

今回は重めかと思ったけど、やってみたらできないことはなかった。自分比で以前より関数が使えるようになってきた気がする。 言語処理100本ノック #049 ノート 完成 結果