アイソモカ

知の遊牧民の開発記録

ことば

Does the 6-month-old Japanese eat rice with chopsticks?

下書きだけ書いていて公開するのを忘れていました。何度かゲスト出演させてもらってるあらBさんのポッドキャストあらB.fmで、「Twitterのスペースで公開収録するのはどう!?」というアイデアが出たので、やってみました。 初の試みでしたが、あらBさんが雑…

Twitter @xiPJ モーメント一覧

作ったモーメントがPCの自分のアカウントからしか見えなさそうなので、一覧を作っておきます。 twitter.com twitter.com twitter.com twitter.com twitter.com Pythonでつくる対話システム作者:竜一郎, 東中,通将, 稲葉,雅博, 水上オーム社Amazon Echo Dot (…

Eating persimmons 「ば」 rings the bell 補足&ひとり反省会

あらBさんのポッドキャストにモラズさんとレギュラーメンバー出演しました。ひとり反省会と補足記事です。 Ep. 56-1 Eating persimmons rings the bell ピージェイさん@xiPJ 、モラズさん@morazumorazu と福岡方言「あってる」、言語学フェス2022、なろうレ…

お母さん、彼女と食事に行くよ

日本語教育、第二言語としての日本語の補助教材でこの課を勉強しようとして、あーヤベッってなった話。 このブログの読者は日本語ネイティヴかネイティヴ並みに日本語を読めるひとたちだと思うので、この問題は簡単に解けるだろう。じゃあ、どうやって解くん…

疑問に思ったことを聞いただけなのに、怒られがち

やっちまった。 問題点を指摘するとその人の意見に反対していると受け取られがち & 意見に反対するとその人自身を軽んじてると受け取られがち、のダブルコンボをやってしまった……— ピジェ/𐀠𐀋 ピージェイ (@xiPJ) 2020年5月5日 どうやらこのダブルコンボに、…

はじめての語用論 第1章〜第3章

文脈や場面なしにことばを理解することはできないのではないかと思い、語用論に興味を持ち、教科書を読んでいます。端的にいうと空気が読めたい。 章末の練習問題の解答を書いてみます。問題を解くと、さらさらっと読んだだけではあまり理解できていなかった…

開発記録 200113 Mon (Stemming, 100本ノック #052)

前回 #051 は空白を単語の区切りとみなしていたが、hand-written rules などの - でつながった単語がある場合、-も単語の区切りを表しているよな? と今回解きながら思った。 あと、( ) , . " などの記号も単語に含めるべきではないのではないだろうか。 し…

開発記録 191213 Fri (マスターテクストアプローチ、Pandas と Matplotlib)

なぜ物理を勉強し、今は言語とデータ分析を学ぼうとしているのかという問いには、日常のいろいろな現象を理解したいという共通の動機があると思う。 研究と人生 マスターテクストアプローチ 気になることば 「語り」「自分語り」 勉強会の宿題② dat ファイル…

開発記録 191108 Fri(かなり昔の事件です)

うーん、CaboCha ってどういうしくみで動いてんねやろなあ。 これ、副詞「かなり」の係り先を調べよう思て、解析してみてん。 # ipadic $cabocha それはかなり昔の話です。 それは-----D かなり-D | 昔の-D 話です。 EOS それはかなり昔の案件です。 それは-…

開発記録 191105 Tue(BCCWJと副詞)

いきなり寒くなったせいか、先週ちょっと仕事が忙しかったせいか、なんか体調がいまいち。はっきりとした症状はないが、だるすぎて午前休を取ってしまった。 今日やったこと 今日やったこと 副詞についてちょっと調べたメモ BCCWJで副詞を探す コアデータ ダ…

開発記録 191104 Mon(副詞の『の』度をはかる)

昨年書いた記事をQiitaから移植し、読み返しながら、続きをやろうと思った。 isomocha.hatenablog.com やったこと やったこと 副詞分析の準備 matplotlib 分析ファイルの場所 何をするかというと 『の』度のヒストグラム 『の』度 ヒストグラム 例 上位と下…

「はじめての言語ゲーム」、DIY: モニタ台作成

3連休にやったこと 3連休にやったこと 「はじめての言語ゲーム」を読んだ 感想 モニタ台材料の塗装

「肉のアスパラ巻き」は逆なのか?

「アスパラの肉巻き」と「肉のアスパラ巻き」はどちらが多いのか、BCCWJで調べてみました。

見せたいところと見せたくないところ、ことば。

自分のなかに、見せたいところと、見せたくないところがある。 隠しているわけじゃないけど、わざわざ見せないところもある。 考えていることは、たくさんあるはずなんだけど、 ことばで表現しようとすると、手が動かなくなる。 孤独の中で、書物から安らぎ…

名詞を「の」で修飾する副詞を探す (BCCWJ と 中納言 と Python)- 前半

Qiita からの移植記事です。移植に伴い、少々加筆修正しました(2019.11.4)。 前半の後の話 isomocha.hatenablog.com 元記事 qiita.com 計量国語学屋さんが使うという『現代日本語書き言葉均衡コーパス』(BCCWJ)を、言語学初心者のぼくも使ってみようと思っ…

MeCab のユーザー辞書を作る(UniDic)

MeCabのユーザー辞書を作って解析に使えるようにします。

「在」と「有」

中国語を勉強し始めてしばらく悩んだのが、「在」と「有」だった。 どちらも日本語の「います」「あります」なんだけど、主語と目的語が反対のものをとるので、どうやって使い分ければいいのかよく分からなかった。なんとなく慣れてきたんだけど、日本語の勉…

同じじゃないもの、正しくないもの

このまえ、多文化共生の話を聞いていた時に、「違い」を漢字で書くと正しくないという意味に見えるからひらがなで「ちがい」と書きますと言っている人がいて、「違い」は「間違い」や「誤り」とは違うよ!!と思った。