メインコンテンツへスキップ
  1. ブログ/

紅楼夢シミュレーター:社会科学の聖杯、大規模言語モデルによる讖判詞

QQder 核舟記部落格
著者
QQder 核舟記部落格
8本の iOS アプリを公開中。すべて無料、広告なし、トラッキングなし——気になるものをぜひ試してみてください。同時に、文系出身の Sysadmin が AI vibe coding でゼロから App Store に届けるまでの記録も綴っています。

はじめに
#

未来の吉凶、ひいては人類の運命を予測することは、古来より人類社会の大きな命題であり、LLM(大規模言語モデル)はその解決の糸口を見せてくれる。

本稿では、LLMを最新のツールとして用い、紅楼夢をサンドボックスとして、後四十回を予測する方法を探る。

先に断っておくが、筆者はまだそれを成し遂げてはいない。いつの日か実現したとき、この文章が検索されることだろう。

本稿はむしろ、文字そのものについての思索である。文字は物理の公式のように明確ではないが、

人類が現実を把握し未来を推測するためのツールとして、我々が想像する以上に重要なものである。

文字は単なる「想像上の」現実ではなく、決して主観的でもない。それは最もコスト効率の良い方法で客観的事実を映し出しているのだ。

そしてLLMは、文字を予測する自動化メカニズムとして、この現実の抽出・生成・客観的事実への写像のコストを極限まで圧縮する。

最新の実装はiOSアプリ「紅楼夢シミュレーター」で更新している。

APP: Link

紅樓夢模擬器

人生の三大恨事:一に鰣魚(ヒラ)は骨が多いこと、二に海棠に香りがないこと、三に『紅楼夢』が未完であること。

張愛玲(ちょうあいれい)


天文:単なる言葉の連想ゲームではない
#

未来を予測することは常に人類社会の一大事であった。あらゆる古代文明には星を観測する専門の祭司や官職が存在した。

天文・水文などの記号体系は、自然現象や物理法則を文字化してきた。最も典型的な例は経緯度であり、文字は人類が客観的環境を理解し影響を与えるための重要なツールとなった。

文字と世界の写像がもたらす実用性は、大規模言語モデル(LLM)の能力が爆発的に発展したここ数年で実証された。

かつて言語というツールは、十分に決定論的(deterministic)でないという理由から、科学が第一の生産力となった産業革命以降、序列の下位に置かれてきた。

LLMの時代は、ついに文字の消化と生成をミリ秒単位の領域に引き上げ、人間の読解速度・タイピング速度・誤字脱字といった障壁から解放した。

かつて極度に知力と時間を消耗していた作業が、今や生産ラインのように組み立て・配置できる可能性が生まれた。

では、その生産ラインが生み出すものは何か? LLMの本質は「次の文字を予測する」ことだが、これは生産性があると言えるのか? LLMは自分が何を言っているのか「理解している」と言えるのか?

Ilya(元OpenAI共同創業者兼チーフサイエンティスト)はこんな例を挙げた:

say you read a detective novel, and on the last page, the detective says “I am going to reveal the identity of the criminal, and that person’s name is ……” ――推理小説の最後のページで、探偵が「犯人の正体を明かそう、その名は……」と言う場面を想像してほしい。

もしLLMが常に安定的かつ正確に犯人を当てることができるなら、少なくともそれは小説を「理解した」と言えるだろう――推理を外した多くの読者以上には。

そして我々は「理解」というものを正しく評価しなければならない。理解とは本質的に未来を予測するためのものである。各古代文明が一様に天文・水文を研究したのも、

次なる気候変動・河道の変化・旱魃や洪水を予測し、客観的環境の中でより良く生存するためであった。

極言すれば、正しく予測できることは、理解することよりも重要かもしれない。


人文:人間もエージェントもブラックボックス
#

未来を予測することは、自然科学の追求であり必要条件(再現性)であるが、社会科学にとってはまさに聖杯である。

これは確かにSF的に聞こえる。アイザック・アシモフの『ファウンデーション』シリーズでは、未来を予測するこの学問は「心理歴史学」として描かれている。

経済学者、歴史学者、心理学者、社会科学者……誰もが個人と社会が特定の事象にどう反応するかを知りたがっている。

特に金融は、おそらくソフトウェア業界以外でAIが最も力を入れて活用されている分野だろう。

終着点はまだ見えないが、この実現可能性はすでに著しく向上している。

その向上と限界は次のように言える。我々は優れたブラックボックス(LLMエージェント)を手に入れた。

人間と同等レベルの特定のタスクにおいて、超高速かつ超低コストで、人間の代替に適している。

一方で限界は、現在の使い方がスロットマシンに似ていることだ。いくつかのテクニック(prompt/context engineering)で当選確率を上げることはできるが、それ以上ではない。

ブラックボックスを開けることは難しく、複数のブラックボックスを直列に繋げても効果の向上は限定的である(multi-agent)。

現状、単一エージェントでこなせるタスクは速く正確にこなせるが、より抽象的なタスクの性能を線形に向上させることは困難である。

社会科学に応用する場合、一つのエージェントですら一個人の記憶と感情を完全にシミュレートすることはできず、ましてやmulti-agentで集団をシミュレートすることは言うまでもない。

楽観的に見れば、これはパフォーマンスの問題に近く、このパラダイムの性能は今後も向上し続けるだろう。


サンドボックス:一撃必殺にこだわるな
#

ブラックボックスであるならば、直感的な発想は、より小さな箱で試みることだ。

現在のモデル能力のベースラインが前述の通り――任意の推理小説をLLMというスロットマシンに投入すれば、ワンショットで正しく犯人を吐き出せる――と仮定しよう。

このベースラインの上に、さらに地道な作業を重ね、足場を組み、LLMと何度もやり取りし、成果を各議論の中で線形に蓄積していけば、理論上はより高難度の予測が可能になるはずだ。

紅楼夢は完璧な目標である。前八十回の内容に基づき、後四十回をある程度予測させる。

この予測は難易度が非常に高いが、筆者の研究目標にとってはちょうどよい。理論上は可能性がゼロではなく、実際にはほぼ不可能――LLMの能力成長をここ数年で観測するのに最適である。

ここまで書いて、ようやく二つの研究目標を提示できる:

  1. ワンショットでは得られない答えに、どのような追加の工夫で近づけるか。
  2. どのように戦場を選べば、我々の成果がより強力なモデルに直接取って代わられず、将来のモデル進歩に伴い我々のアーキテクチャも恩恵を受けるか。

以下、紅楼夢とLLMの特性に基づいて研究方法を検討する。

前提
#

紅楼夢の結末は確かにかつて存在し、前八十回とその後の結末は有機的かつ意識的な連続した執筆であった――前八十回同士の内在的な連関と同様に――と仮定する。

もし実際には存在しなかったとすれば、予測の難易度はさらに上がり、パラレルワールドの予測に近づく。問題は「もし曹雪芹が結末を書き上げていたなら、『必ず』どのようなものになっていたか」となる。

この「必ず」が肝心である。その確信の度合いに達してこそ、無から有を生み出すことに意味がある。

紅楼夢の成立
#

おおよそ1750年代に成立。当時は親族や友人の間で回覧されていたが、1791年に程偉元(ていいげん)が木活字版で出版して初めて広く世に知られることとなった。

紅学とAI支援研究
#

王国維(おうこくい)と胡適(こてき)が紅学の先駆者であり、紅学は発展を続け、近年では大衆化・娯楽化の傾向がある。探佚学(たんいつがく=失われた部分を探る学問)と癸酉本(きゆうぼん)への関心の高さは、大衆の結末への好奇心の表れである。

最新技術を活用した研究成果は主に以下の通り:

  • 機械学習により、後四十回が原作者の著作ではないことが再度証明された
  • LLMを用いてテキストのより精緻な意味ベクトル化(Word Embedding)を実施
  • LLMを用いてドメイン固有の知識グラフ(Domain-specific Graph)を構築
  • 前八十回および清代の古典籍を入力データとして訓練されたモデルが存在

LLMの特性
#

LLMとこのタスクに関連する特性は、既存のインターネット上のあらゆるデータ、およびこれらの最先端AI研究機関が入手し得るあらゆる有価値な資料によって訓練されている点である。

既知の情報に対する予測能力と傾向は非常に高い。例えば、ハリー・ポッターの一節を入力すれば、続きの段落を暗唱できる。

しかし紅楼夢の後四十回は伝わっておらず、モデルの訓練データに含まれていないため、暗唱することはできない。

問題一:ウィンドウの制限
#

第一回から第八十回までの内容を直接入力し、LLMに後四十回を出力させることは可能か。

入力側については、現在の第一線のモデル(Gemini 3.1 / GPT-5.4 / Opus 4.6)のAPI使用時に1Mトークンまで対応できれば問題ない。

しかし現行モデルのパラダイムでは、出力トークンのウィンドウは入力よりはるかに小さく、出力は最大でも四千から八千字の中国語に制限される。おおよそ一回分の内容しか出力できない。

問題二:流し書きと品質低下
#

それでは、LLMへの入力を変えて「第八十一回の内容を出力せよ」とすれば可能か。

大量のテキスト入力に「汚染」され、文体は曹雪芹に非常に似たものになり、前の既知の筋書きを合理的に継続できるが、流し書きのようになってしまう。

そして同様の操作を繰り返し、第八十二回、第八十三回と進むにつれ、品質は急激に低下する。

問題三:モデルの事前知識による汚染
#

もう一つの問題は、モデルが訓練時にすでに高鶚(こうがく)版を読んでおり、各種論文の推測も取り込んでいることだ。これらの情報が真の原本と異なれば、出力が偏向してしまう。

続く
#

篇幅が長くなったため、ここで一区切りとし、次回の予告とする。

我々はLLMに単純に未知の情報を吐き出させることはできない。

したがって、より伝統的で、機械的あるいはプログラム的な手法が依然として必要である。

朗報は、筆耕怠りなき文史哲の研究者諸氏に告ぐ――我々は耕運機を手に入れたのだ!

紅楼夢は高度に構造化された特性を持ち、重要な登場人物にはそれぞれ判詞(はんし=人物の運命を暗示する詩)があり、

かつ前八十回同士で相互に検証が可能である。ゆえに他の多くのフィクション作品よりも予測に適している。

登場人物が多く背景が複雑ではあるが、実際に我々が予測するのは曹公(曹雪芹)の構想であり、彼の芸術的意志は全書を貫いている。これは結末の予測に大きな助けとなる。

次回:紅楼夢の熱力学
#

次回は実験の方法を紹介する。テキストの内容を構造的に抽出し、反復実験で書中の法則を抽出し、プログラムで繰り返し実験を行う。

最も理想的なケースは、熱力学系のように、初期条件(前提。例:人物、家族の財産、社会的地位、人間関係ネットワーク等)に加え、システムの運行メカニズム(人間心理、社会階級、経済動態、文化規範、因果応報等)を与えれば、任意の時点におけるシステムの状態を予測できることである。