アイソモカ

isomocha: 知の遊牧民の開発記録

ChatGPT Deep research を数回試した感想とメモ

結論:まだ使いこなせてないが、気をつけたほうがいいポイントは少し見えたかも…
というのは、調査とは何をすることなのかを具体的に明示すること?

(2025/03/23 編集&追記)

最近、ChatGPT の月額 $20 のプランでも Deep research が使えるようになった。  

DeepResearch が進行する様子を見ていたら、ChatGPTは論文速く読めてうらやましいなという気持ちになってきた。ChatGPTになって一生論文読んだりコード書いたりして暮らしたい。(・ξ・)

— ピジェ (@xipj.bsky.social) Mar 18, 2025 at 20:06

DeepResearch、まだ数回しか使っていないが、「そこらへんの適当なまとめブログ読むより全然いいな」という印象だが、比較対象がブログだというような微妙なラインな感じがし、使い手の問題なのかもわからんが、やはりおれが大規模言語モデルになるしかないなという気持ちを新たになる。(・ξ・)

— ピジェ (@xipj.bsky.social) Mar 19, 2025 at 1:04

 

昨日の Deep research で何をしたかというと、
最近の自分が AI/LLM の哲学について興味あることを ChatGPT にたくさん話して、
そのあと「自分と似たことを言っている研究を探して」的なことを言って Deep research で調査したのだった。

ChatGPT の報告を見て、見つかった AI/LLM の哲学の論文をいくつかざっと読んでみた。

  • 👍 良かったこと:重要ぽい論文が見つかった(4つぐらい)(既に知っていたものもある /10個ぐらいのリンク)
  • 👎 イマイチだったこと1:「自分と似たことを言っている研究はあるか?」→「はい、あります!以下がその研究のリストです」(実際引用された文献を読んでみると、そんなに似ているわけでもない)
  • 👎 イマイチだったこと2:見つかったものの中にはAI 生成されたブログ記事もあり、「お、おぉ」となった(エコーチェンバーや視点の偏りといったものを懸念している)(もしその記事が「ChatGPT が書いた」ものだとすると、ChatGPT にとって説得力があるのだろうか…?)

イマイチだったこと1について、もう少し考えてみる。

これはたぶん、半分は指示(プロンプト)のせいだ。
改善するなら、
調査とは何をすることなのかを具体的に、
たとえば、「『アプローチ、類似点、相違点、解かれたこと、課題』を抽出して整理して」みたいに言うのがいいのだろう。

というのは、ChatGPT はユーザに YES と言う強い傾向があるので、

  • 「自分と似たことを言っている研究を探して」→ YES 見つかった論文はすべてこじつけて似てると言う
    • ↔︎「NO 見つかりませんでした」とは言わないだろう
  • 「『…』を抽出して整理して」→ YES、抽出して整理する

(「指示は具体的に!」みたいな話、結局 GPT-3.5 時代から変わってねーのな)(永遠に変わらんかもな)

この点について Claude に聞いたら、LLMはポジティブなフレーミングと同調を好むのだと言っていた。charitable な表現だな。

もうひとつの要素として、ユーザに YES と言う傾向は、ChatGPT-4.5 のほうが(ユーザに寄り添うことを最適化した、みたいな印象なので)他のモデルよりももっと強いかもしれなくて、
だとすると、Deep research では 4o (? o1?) とかを使うほうがマシなのかもしれない。

まあ、まだ試してないので、うまくいくかどうかは分からんが。

調査とは何をすることなのかを具体的に言う

(2025/03/23 追記)

調査とは何をすることなのかを具体的に言うことで、かなり満足度が上がった。
どう言うかというと、トピックや内容によるが、たとえば:

Please summarize each with:
- Approach
- Methodology and evaluation metrics
- What aligns with our discussion
- What diverges
- Key findings and future directions

以前書いた「何ができたら論文読んだことになる?」とも共通するところがある。
関連記事:

isomocha.hatenablog.com

つまり、2025年、自分が知りたいポイントについて抽出する作業は、ある程度は自動化できるってことだろうか。
(どの程度?)

それと、パソコンのブラウザからは、 Deep research が進行する/した様子を見ることができる。(スマホでは見れないっぽい)
それを見ると、どんなキーワードで検索したかや、ChatGPTの着眼点が大体わかるので、
次の調査で活かせそう(切り口を変えてみるとか、焦点を絞ってみるなど)。

メモ:さらに "Focus on content extraction - I don't need your speculation. とか加えたほうがいいのかもしれない。

みんな、 Deep research 使ってる? どんなふうに使ってる?