いきなり寒くなったせいか、先週ちょっと仕事が忙しかったせいか、なんか体調がいまいち。はっきりとした症状はないが、だるすぎて午前休を取ってしまった。
今日やったこと
副詞についてちょっと調べたメモ
- 文体による差が大きく、BCCWJで多いレジスターも異なる。(中俣尚己, 『コーパスとクラスター分析を用いた副詞の文体調査』, 日本語学会 2019 年度春季大会 口頭発表要旨 )
- 話し言葉と書き言葉で使用される頻度が違う。(島崎 英香, 『中上級日本語学習者のための副詞選定 ―「現代日本語書き言葉均衡コーパス(BCCWJ)」・「名大会話コーパス」を基に―』2018, 日本語教育方法研究会誌, 25(1), 62-63)
- 読みたい👉石黒圭, 『書き言葉・話し言葉と「硬さ/軟らかさ」 : 文脈依存性をめぐって』,2015, 日本語学 34(1), 14-24
BCCWJで副詞を探す
中納言をいろいろ検索してた。
コアデータ
コアデータ(形態素解析の精度が高い)分だけ使うのはどうやろか。
コアデータ | 延べ語数 |
---|---|
検索対象 | 1,290,060 |
記号・補助記号・空白を除いた検索対象 | 1,098,511 |
副詞 | 14,897 |
副詞 + の | 233 |
副詞 + の + 名詞 | 208 |
「副詞 + の + 名詞」やとひとつひとつの副詞で数が少なすぎるかなあ。とりあえずこれでやってみようか。
ダウンロード
こんな感じで検索結果をダウンロードした。
「インラインタグを使用」にチェック入れとくと、前後文脈も合わせて形態素情報取得できるんやな。
ざざっと見てたら、「ファミ○ン」みたいな伏せ字もちゃんと復元されてるの、しんせつすぎへん?すげえ。
気づいたこと:前回の検索で抜けとったん
上の表でいうと、233 - 208 = 25
- いささかの後ろめたさ:いささか[副詞]|の[助詞]|後ろめたい[形容詞]|さ[接尾辞]
- やっとのお休み:やっと[副詞]|の[助詞]|御[接頭辞]|休み[名詞]
ちょっと気ぃつけなあかんなあ。