相転移とは、温度や外部磁場の変化に応じて物質の秩序が急激に変化する現象である。 特に磁性体においては、強磁性相(自発磁化あり)から常磁性相(自発磁化なし)への 相転移が典型例として知られる。
強磁性体では秩序パラメータは磁化であり、 温度 \(T\) が臨界温度 \(T_c\) を下回ると \[ M \neq 0 ,\qquad (T < T_c) \] 上回ると \[ M = 0 ,\qquad (T > T_c) \] となる。
臨界温度付近では物理量はべき乗則に従い、 \[ M \propto (T_c - T)^{\beta},\quad \chi \propto |T - T_c|^{-\gamma},\quad \xi \propto |T - T_c|^{-\nu} \] のように振る舞う。
ニューラルネットワークを多数の自由度からなる「スピン系」とみなし、 学習率・正則化・データ量などのパラメータが 温度や外部磁場に対応しうる。 臨界点付近での高感度応答は、AI の最適化性能と関係づけられる場合がある。
ランダウ理論では秩序パラメータ \(M\) の自由エネルギーを 低次の多項式として展開する:
\[ F(M) = a(T - T_c) M^2 + b M^4 - H M. \]
\[ \frac{\partial F}{\partial M} = 0 \quad\Rightarrow\quad a(T - T_c) M + 2b M^3 - H = 0. \]
\(H=0\) のとき、\(T < T_c\) で \[ M = \pm \sqrt{\frac{a(T_c - T)}{2b}} \] が現れ、相転移の様子をよく再現する。
損失関数 \(L(w)\) と秩序パラメータの類似から、 学習が進むにつれて「対称性が破れる」状況が、 ランダウ自由エネルギーの形で解釈されうる。
イジング模型は、スピン \(S_i = \pm 1\) が格子点に並び、 隣接スピン間の相互作用によりエネルギーが決まる模型である。
\[ H = -J \sum_{\langle ij\rangle} S_i S_j - H \sum_i S_i. \]
1D イジングモデルでは熱揺らぎにより秩序が保てず、 \(T>0\) では相転移は起きない。
固有の解析解が存在し、磁化は \[ M(T) = \left[1 - \sinh^{-4}\!\left(\frac{2J}{k_B T}\right)\right]^{1/8} \] となる。
スピン変数 \(S_i\) をニューラルネットの状態変数に、 相互作用 \(J\) を重み \(w\) に対応させることで、 ニューラルネットワークの学習ダイナミクスを イジング的に理解する試みがある。
イジング模型を平均場的に扱うと、隣接スピンを平均磁化 \(M\) で置き換え、 次の自己無撞着方程式が得られる:
\[ M = \tanh(\beta J z M + \beta H), \quad \beta = \frac{1}{k_B T}. \]
右辺を \(M\approx 0\) で線形化すると \[ M \approx \beta J z M \quad\Rightarrow\quad T_c = J z / k_B. \]
教師なし学習や Hopfield ネットワークでは、 平均場方程式が学習則や記憶保持能力を決める。
臨界点付近の物理量は \[ f(t, H) = |t|^{2-\alpha} F(H/|t|^{\Delta}), \quad t=\frac{T-T_c}{T_c} \] のような形で記述される。
空間スケールを \(b>1\) 倍に粗視化し、 物理量がどのように変化するかを追う。
くりこみ変換の流れが固定点に向かうことで、 臨界指数が決まり、イジング・XY などの普遍性クラスが分類される。
ネットワークサイズや深さを変えたときの汎化誤差のスケーリング、 重みの粗視化(量子化、剪定)などを RG 的に理解しようとする試みがある。
\[ H = -J\sum_{\langle ij\rangle} \cos(\theta_i - \theta_j) \] で記述される 2D 系。
温度上昇により渦対が解離し、長距離秩序のない位相乱れ状態となる。
KT 転移点 \(T_{KT}\) 付近で \[ \xi \sim \exp\!\left(\frac{b}{(T-T_{KT})^{1/2}}\right) \] のように発散する。
トポロジカル欠陥(渦)を学習阻害モードとみなし、 ネットワーク構造の変化を位相解離現象に対応づけるモデルが提案されている。
結合 \(J_{ij}\) がランダムなスピンガラスでは、 エネルギー地形が複雑で、多数の局所極小が存在する。
\[ q = \frac{1}{N}\sum_i \langle S_i \rangle^2 \] が秩序パラメータ。
ニューラルネットの重み空間も多重極小構造を持ち、 スピンガラスとの類似が深い。 誤差関数の「谷」の多様性を表すモデルに利用される。
低温展開と高温展開が数学的に対応し、 双対変換により臨界点を交換できる。
トレーニング ↔ テスト、 過学習 ↔ 汎化、 などの双対的関係が磁性系の双対性と対応づけられる。