機械学習の熱力学は,量子重力理論の歴史におけるブラックホール熱力学と同じような歴史的位置にあるのかもしれない.ベッケンシュタイン・ホーキング公式の発見がブラックホール熱力学を生み出し,ホログラフィー原理(場の量子論と重力理論の対応)の原型となったように,機械学習の新しい見方が生まれる可能性がある.ただし,量子重力理論の歴史的経緯とは逆さまに,機械学習の場合は,先に機械学習と場の量子論の対応関係がみつかり,そこからホログラフィー原理を経由して機械学習の熱力学が導かれるのではないか.そう思わせる研究が最近出てきている1K. Hashimoto, S. Sugishita, A. Tanaka and A. Tomiya, “Deep learning and the AdS/CFT correspondence”, Phys. Rev. D 98, 046019 (2018).
1. 量子重力理論の歴史
1−1. 量子重力理論の歴史
ブラックホール熱力学の発見からホログラフィー原理,
対応までの歴史的経緯を概説.
1−2. ブラックホール熱力学
Schwarzschildブラックホールの計量は
(1) ![]()
ただし,
.また,地平線近傍ではこの計量を
(2) ![]()
と近似できる.半径方向の座標を
と置き直し,時間をユークリッド化
するとこの計量は
(3) ![]()
となる.ここでこの計量が特異性をもたないという要請を課すと
は
の周期をもつことが導かれる.更に,この周期は逆温度に比例するため,ブラックホールの温度
がわかる.ここからブラックホールの熱力学
(4) ![]()
が導かれる.ブラックホールの地平線の表面積は
となるので,次のBekenstein-Hawking(BH)公式2J. D. Bekenstein, “Black holes and entropy”, Physical Review D. 7 (8): 2333–2346 (1973).3S. W. Hawking, “Black hole explosions?”, Nature, 248, 30 (1974).が導かれる.
(5) ![]()
ブラックホールの表面積がエントロピーと比例することを発見.
1−3. ホログラフィー原理
次元の重力理論は,重力を含まない
次元の量子系と物理的に等価になるというホログラフィー原理の仮説を,
次元のバルク時空上の重力理論
とその境界上の共形場理論
の対応(
対応)とみなして具体的に計算していく.

次元の反ドジッター時空上のSchwarzschildブラックホールの計量は
(6) 
この計量をPoincaré座標で書き直し,時間をユークリッド化
すると
(7) 
となる.バルク時空上の重力理論の分配関数と境界上の共形場理論の分配関数が一致することを要請する
対応の原理,バルク/境界対応を使ってBH公式を一般化した公式を導く.
(8) 
重力理論を古典重力で近似できる場合,次が成り立つ.
(9) ![]()
ユークリッド化した時空上での作用
は
(10) 
となるので,次のHubeny-Rangamani-Ryu-Takayanagi(HRRT)公式4S. Ryu and T. Takayanagi, “Holographic derivation of entanglement entropy from the anti–de sitter space/conformal field theory correspondence”, Physical review letters 96 (18), 181602 (2006).5V. E. Hubeny, M. Rangamani and T. Takayanagi, “A Covariant holographic entanglement
entropy proposal”, JHEP 07 062 (2007).が導かれる.
(11) 
エンタングルメントエントロピーによるBH公式の一般化.
2. 機械学習の熱力学?
深層学習を含む様々な機械学習アルゴリズムが,マルコフ確率場の枠組み=場の量子論の枠組みで記述できることを紹介する.その後,機械学習のホログラフィー原理を使って,機械学習の場の量子論から古典的な時空を創発させる.このときあらわれる古典時空の熱力学が,機械学習の熱力学になる.
2−1. 機械学習の場の量子論
最近,場の量子論で記述されるダイナミクスを使って推論や学習を行うことができるということがわかってきた6D. Bachtis, G. Aarts and B. Lucini, “Quantum field-theoretic machine learning”, Phys. Rev. D 103, 074510 (2021)..具体的には,
-スカラー場の理論が Hammersley-Clifford 定理を満たすことがわかるので,深層学習を含む様々な機械学習アルゴリズムをマルコフ確率場の枠組みの中で再構成できる.
-スカラー場のラグランジアン
(12) ![]()
格子上の作用
(13) 
非等方
-スカラー場の作用

(14) ![]()
ポテンシャル関数
(15) ![]()
-スカラー場の理論はマルコフ性を満たす.
(16) ![Rendered by QuickLaTeX.com \begin{eqnarray*} & \displaystyle p(\phi ; \theta) = \frac{\exp \left[\sum_{c \in C} \ln \psi_{c}(\phi)\right]}{\int_{\boldsymbol{\phi}} \exp \left[\sum_{c \in C} \ln \psi_{c}(\boldsymbol{\phi})\right] d \boldsymbol{\phi}}=\frac{1}{Z} \prod_{c \in C} \psi_{c}(\phi) \end{eqnarray*}](https://i0.wp.com/hayashiyus.jp/wp-content/ql-cache/quicklatex.com-922d934215cefdbe6bd18725ab4f122d_l3.png?resize=418%2C54&ssl=1)
真のモデル
とのKL-ダイバージェンス
(17) ![]()
変分ベイズ自由エネルギー ![]()
(18) ![]()
ただし,
,![]()
2−2. 機械学習の熱力学
ヒントン場が共形不変性をもつ場合について,ヒントン場を重力理論で記述されるバルク時空の境界に対応する量子多体系とみなし,バルク/境界対応
からヒントン場の分配関数
を計算する.このときあらわれるバルク時空をヒントン時空と呼ぶ.
ヒントン時空上のSchwarzschildブラックホールの計量
(19) 
1−3. の手順に従ってヒントン場のエンタングルメントエントロピーを次のように導出する.

(20) 
ただし,
は単位
次元球の体積.
相対エントロピー
(21) ![]()
を熱平衡状態のカノニカル分布の密度行列
(22) ![Rendered by QuickLaTeX.com \begin{eqnarray*} & \displaystyle \rho_{0} = \frac{e^{-H / T}}{\operatorname{Tr}\left[e^{-H / T}\right]} \end{eqnarray*}](https://i0.wp.com/hayashiyus.jp/wp-content/ql-cache/quicklatex.com-e5aa0c047762f58a1941275859b2b714_l3.png?resize=135%2C51&ssl=1)
とし,
を一般の非平衡状態の密度行列とすると
(23) ![]()
ただし,
.今度は全系が基底状態にあるときの部分系の密度行列
と全系が任意の励起状態にあるときの部分系の密度行列
を考えると
(24) ![]()
ただし,
.
エンタングルメント熱力学(機械学習の熱力学)の導出(エンタングルメント熱力学第1法則)
(25) 
Appendix.
もう一つの機械学習の場の量子論.
3−1. 深層学習の場の量子論
画像や時系列などの連続的な入力信号は,不規則にサンプリングされていたり,値が欠損していたりするため,既存の深層学習モデルの適用が難しい場合がある.こうした問題に対処するため,特徴量をガウス過程(
)として表現し,離散化誤差を確率的に記述する「確率的数値計算畳み込みニューラルネットワーク(PNCNN)」が提案された7M. Finzi, R. Bondesan and M. Welling, “Probabilistic Numeric Convolutional Neural Networks” (2020).このPNCNNを量子ニューラルネットに拡張し,深層学習が場の量子論になる例8R. Bondesan and M. Welling, “The Hintons in your Neural Network: a Quantum Field Theory View of Deep Learning”, Proceedings of the 38th International Conference on Machine Learning, PMLR 139:1038-1048 (2021).を紹介する.

ここでは入力信号を
とし,各位置
に対応する輝度
を持つ有限グリッドの画像のようなデータ
を想定する.この離散的な入力信号を連続的な信号の確率場
で補完し,それぞれの画像が持つラベルを予測するタスクを考える.また,入力信号の各位置に対応する信号
を集めたベクトルを
とあらわすことにする.ここで入力信号をガウス過程
でエンコードしたとき,中間層の信号が
(26) ![]()
で与えられる確率的ニューラルネットを考える.ただし,
は信号の非線形変換,
は信号にバイアスを加える操作,
は信号の線形変換をあらわしている.また,このモデルでは最終層の手前で1度だけプーリング操作 ![]()
(27) 
を行う(添字の
は画像のカラーチャンネルをあらわしている).このときバイアスと線形変換の部分を
と書くことにすると,この確率的ニューラルネット(PNCNN)が行う操作をまとめて
(28) ![]()
とあらわすことができる.この一連のプロセスを量子化する.つまり,PNCNNを量子ニューラルネットに拡張する.これは(5)式を,ユニタリー演算子の積
(29) 
で書き直すことに対応する.このときあらわれる量子化された信号の確率場(量子場)
をヒントン場と呼ぶ.(6)式のユニタリー演算子で時間発展させて期待値をとれば,画像のラベル
に応じた出力信号(予測ラベル)を得ることができる.
(30) ![]()
また,古典的なPNCNNがきちんとこの量子ニューラルネットに含まれていることも確認できる.
(31) ![]()
ヒントン場の生成消滅演算子は以下で与えられる.
(32) ![]()
基底状態として平均が
・単位共分散のガウス状態
を仮定すると
,また
でカラーチャンネル
の画像の位置
に
個のヒントン粒子を生成する.
全系のハミルトニアンは次のように書ける.
(33) ![]()
実は,2−1. の場の量子論と3−1. の場の量子論は関係がある.