アイソモカ

知の遊牧民の開発記録

重箱隅突きぃ

ええかっこしぃ(ええ格好したがりな人)、緊張しい(緊張しがちな人)みたいに、重箱隅突きぃ(重箱の隅を突きがち)なピジェです。 もし自分が求めるほどのタスク処理能力が自分にないなら、人生をやるためにはあらゆるものを諦めるしかないのか? ぼくの…

新しいことに飛びつく自分と、日常をやりたい自分のケンカ

じぶんのなかの、面白そうな/新しいことにどんどん飛びついて取り入れてスケジュールをミチミチにしてしまう部分と、日常をやりながら物事にじっくり取り組みキッチリやりたい部分が、激しくケンカしてる。(さっき、後者が負けた音がした) どうやら、どっ…

擬態とジェンダー

読み始めました。面白そうな本なのにタイトルで「自分はこの『女の子』にあてはまらないのは?と躊躇ってしまうんだよな。中を見てみると、生まれた時に「女の子です」って言われた人、自分は女の子だ/かもしれない?と思う人は、あてはまるっぽいので、よ…

開発記録 210917 Fri BertJapaneseTokenizer でトークン化(気になったこと)

『Pytorch自然言語処理プログラミング』の5章を引き続きやっていきます。 isomocha.hatenablog.com 気になったこと。 BertJapaneseTokenizer.encode() に『分かち書きした形態素リスト』を入力すると、どうやら WordPiece によるサブワード分割が働かないっ…

BERT は毎朝味噌汁を作るか 【BertForMaskedLM】

BertMaskedLMで遊んでいて「毎朝あなたのために[MASK]を作ります。」で[MASK]部分に入る語を予測したら 1位が「詩」(確率0.078)、2位が「番組」(確率0.077) …ってなってて、えーそうなん???となった。Wikipediaで学習したBERTは味噌汁作れへんねや。https…

開発記録 210916 BertJapaneseTokenizer をさわってみる

『Pytorch自然言語処理プログラミング』の1章が終わって、間を飛ばして5章をやってます。 book.impress.co.jp 東北大BERT cl-tohoku/bert-base-japanese · Hugging Face と BertJapaneseTokenizer を使って文を単語列に分割していきましょう。 ... ModuleNot…

怠け者の根性なしではなかったっぽい

この記事は7月上旬〜8月上旬に下書きしたものを少し編集し、8月下旬に投稿したものです。 6月末に文字通り泣きながらこの一連のツイートを書き、自分にとって自分の不得意な部分の何が問題なのか改めて考え、カウンセリングルームと精神科に行き、服薬と検査…

疑問に思ったことを聞いただけなのに、怒られがち

やっちまった。 問題点を指摘するとその人の意見に反対していると受け取られがち & 意見に反対するとその人自身を軽んじてると受け取られがち、のダブルコンボをやってしまった……— ピジェ/𐀠𐀋 ピージェイ (@xiPJ) 2020年5月5日 どうやらこのダブルコンボに、…

はじめての語用論 第1章〜第3章

文脈や場面なしにことばを理解することはできないのではないかと思い、語用論に興味を持ち、教科書を読んでいます。端的にいうと空気が読めたい。 章末の練習問題の解答を書いてみます。問題を解くと、さらさらっと読んだだけではあまり理解できていなかった…

麻辣燙(麻辣湯、まーらーたん)を食べましょう

昨年末に初めて食べてから、麻辣燙が好きです。 ぼくはまだ日本でしか食べたことがないので、日本のお店の話です。 どんな食べ物? どうやって注文するの? 中国語分からないんですけど? どこにあるの? 王道鸭脖 池袋店(池袋) 無限麻辣湯 食べる薬膳スー…