2020-02-01

Python YAML形式でKeyでソートさせない

Python

import yaml
from collections import OrderedDict
def represent_odict(dumper, instance):
    return dumper.represent_mapping('tag:yaml.org,2002:map', instance.items())
yaml.add_representer(OrderedDict, represent_odict)
obj = OrderedDict()
yaml.dump(obj, ...)

とかあるけど

import oyaml as yaml

が一番簡単な気がする。

2020-01-31

Python: 正規表現ライブラリを使って、グループ化による置換

Python

以下のような、核種を表す表記を、LaTeXで使えるような表記に置換したい。

He4 → \Nuc{He}{4}{}
He5L → \Nuc{He}{4}{\Lambda}

シンプルなコードだと以下の通り。グループ化という機能を使って、正規表現側で () で囲むと、囲んだところが \1 \2 と番号が振られるので、それを使って置き換えると良い。使っている正規表現についてのみ説明しておくと、 [A-Z] で大文字のアルファベット、 [a-z] で小文字のアルファベット ? はその前の文字があるかないか、 \d は数字 {1,3} はその前の文字を1回~3回繰り返す。

import re
print(re.sub(r'([A-Z][a-z]?)(\d{1,3})', r"\\Nuc{\1}{\2}{}", "He4"))
# \Nuc{He}{4}{}
print(re.sub(r'([A-Z][a-z]?)(\d{1,3})L', r"\\Nuc{\1}{\2}{\\Lambda}", "He4L"))
# \Nuc{He}{4}{\Lambda}

ファイル内の全ての核種を表す表記を置き換えてみる。置換が起きなくなるまでループしている。

import re

with open("text.txt",encoding="utf-8") as f:
    lines = f.readlines()
    for i in range(len(lines)):
        while True:
            buf = lines[i]
            lines[i] = re.sub(r'([A-Z][a-z]?)(\d{1,3})L', r"\\Nuc{\1}{\2}{\\Lambda}", lines[i])
            lines[i] = re.sub(r'([A-Z][a-z]?)(\d{1,3})', r"\\Nuc{\1}{\2}{}", lines[i])
            if buf == lines[i]:
                break

with open("text_sub.txt","w",encoding="utf-8") as f:
    f.writelines(lines)

ちなみにtex側はこうしてる。

\newcommand{\Nuc}[3]{$^{#2}_{#3}{\rm #1}$}

f:id:onsanai:20200131085905p:plain

2020-01-25

単スリットのフラウンホーファー回折のシミュレーション

数学/物理

http://www.sci.keio.ac.jp/gp/87B7D75A/A6070F75/6E345155.pdf

単スリットについて考えてみた。スリット幅が波長に比べて十分広いか、スクリーンの位置が十分遠い場合には、回折による干渉模様を観察できる。

数式をPDFファイルからパクって書いておく。

$\displaystyle \begin{eqnarray} \frac{xd'}{l\lambda} = \begin{cases} 0, \pm\frac{3}{2}, \pm\frac{5}{2}, \pm\frac{7}{2},\cdot\cdot\cdot のとき明線 \\ \\ \pm 1, \pm 2, \pm 3 \cdot\cdot\cdot のとき暗線 \end{cases} \end{eqnarray}$

$x$ : スクリーン中央を0としたときの各干渉模様の位置
$d$ : スリット間隔今回は0.01 mm、0.1 mm、1 mmを試してみる
$l$ : スリットからスクリーンまでの距離干渉模様の位置を同じにするため、10 mm、100 mm、1000 mmを試してみる
$λ$ : レーザー光の波長そんなのないけど500 nmの波長とする

シミュレーションではスクリーンの空間で2ミクロンごと(画像の1ピクセルが2ミクロン相当、縦横2048ピクセル)に計算させた。最小のスリット間隔 10ミクロンの1/5なので十分だと思う(たぶん)。

f:id:onsanai:20200125031334j:plain — 左から順にスリット間隔0.01mm、0.1mm、1mm

f:id:onsanai:20200125031337j:plain — 左から順にスリット間隔0.01mm、0.1mm、1mm

フラウンホーファー回折が成り立つ条件は、ざっくり

$\displaystyle \frac{d^2}{l\lambda}\ll1$

らしい。各条件での左辺の値は0.02、0.2、2、であり、確かに一番右の画像ではきれいな回折像が確認できなくなっている。同じスリット幅でも、スリットとスクリーンまでの距離を10倍に離すと、以下の像が得られる。

f:id:onsanai:20200125033639j:plain:w220

ただし、横方向の干渉模様の位置を同じにするため、画像の1ピクセルを20ミクロン相当にした。そのため、縦方向にも縮んでしまっているが、横方向の回折像はくっきり確認できる。

2020-01-24

Pythonでscipyを使わず一次関数(y=ax+b)でフィッティングし係数と係数の誤差を得る

Python

参考にした解説:

http://www.cc.u-ryukyu.ac.jp/~fukami/p0.pdf

及び岐阜大学教育学部の物理学実験及びコンピュータ処理の解答例

ある二次元(x,y)の点列で与えられるデータ群を、一次関数 (=直線)

$\displaystyle y=a x + b$

でフィッティングするとき、カイ二乗を最小にすればよい。yにつく誤差が同じだとすると最小二乗法で解けて、残差

$\displaystyle S = \sum(ax_i+b-y_i)^{2}$

を最小にするのと同等になる。それぞれの係数の偏微分を $\frac{\partial S}{\partial a}, \frac{\partial S}{\partial b}$ を0にすればよいので、

$\displaystyle a = \frac{N\sum x_i y_i - \sum x_i \sum y_i}{N\sum x^{2}_i - (\sum x_i)^{2}},$

$\displaystyle b = \frac{\sum x^{2}_i \sum y_i - \sum x_i \sum x_i y_i}{N\sum x^{2}_i - (\sum x_i)^{2}}$

と得ることが出来る。

係数2つの自由度を加味した $y$ の誤差 $\sigma_y$ は

$\displaystyle \sigma_y = \sqrt{\frac{1}{N-2}\sum(ax_i+b-y_i)^{2}}$

となる。

誤差伝搬により、係数 $a, b$ の誤差は、

$\displaystyle \sigma_a = \sigma_y \sqrt{\frac{N}{N\sum x^{2}_i-(\sum x_i)^{2}}}$

$\displaystyle \sigma_b = \sigma_y \sqrt{\frac{\sum x^{2}_i}{N\sum x^{2}_i - (\sum x_i)^{2}}}$

となる。

さて、これをPythonで実装してみる。

import numpy as np

# 再現性を確保するために乱数のSEEDを固定
np.random.seed(1)

# データ生成
x = np.arange(6, dtype=float)
y = 3*x + 2
# 乱数で誤差を付与する
x += np.random.normal(loc=0, scale=0.1, size=6)
y += np.random.normal(loc=0, scale=0.1, size=6)

# 頻出する総和を先に計算
N   = len(y)
Nxy = np.sum([xi*yi for xi,yi in zip(x,y)])
Nx  = np.sum([xi    for xi,yi in zip(x,y)])
Ny  = np.sum([yi    for xi,yi in zip(x,y)])
Nx2 = np.sum([xi*xi for xi,yi in zip(x,y)])

# 係数
a = (N   * Nxy - Nx * Ny )/(N * Nx2 - Nx**2)
b = (Nx2 * Ny  - Nx * Nxy)/(N * Nx2 - Nx**2)

# Yの誤差
sigma_y = np.sqrt(1/(N-2) * np.sum([(a*xi+b-yi)**2 for xi,yi in zip(x,y)]))

# 係数の誤差
sigma_a = sigma_y * np.sqrt(N   / (N * Nx2 - Nx**2))
sigma_b = sigma_y * np.sqrt(Nx2 / (N * Nx2 - Nx**2))

# グラフ生成
import matplotlib.pyplot as plt

xx=np.linspace(0,5,100)
yy=a*xx+b

plt.plot(x,y,'ro',label='data')
plt.plot(xx,yy,label="y = {:.3f} $\pm$ {:.3f} x + {:.3f} $\pm$ {:.3f}\nsigma$_y$={:.3f}".
         format(a,sigma_a,b,sigma_b,sigma_y))
plt.xlabel("x")
plt.ylabel("y")
plt.legend()
plt.show()

上記の数式を愚直に実装したが、numpyにはN次元関数でフィッティングする関数が用意されているので、もっと簡単に記述できる。係数の誤差は、分散共分散行列 ${\rm cov}$ で与えられる。

${\rm cov}= \begin{pmatrix} \sigma_a^{2} & \sigma_a \sigma_b \\\ \sigma_b \sigma_a & \sigma_b^{2} \end{pmatrix}$

この、対角成分だけ使って、係数の誤差 $\sigma_a, \sigma_b$ を計算した。

import numpy as np

# 再現性を確保するために乱数のSEEDを固定
np.random.seed(1)

# データ生成
x = np.arange(6, dtype=float)
y = 3*x + 2
# 乱数で誤差を付与する
x += np.random.normal(loc=0, scale=0.1, size=6)
y += np.random.normal(loc=0, scale=0.1, size=6)
N   = len(y)

# np.polyfitで係数と係数の誤差を計算
p, cov =np.polyfit(x,y,1, cov=True)
a = p[0]
b = p[1]
sigma_a = np.sqrt(cov[0,0])
sigma_b = np.sqrt(cov[1,1])

# Yの誤差
sigma_y = np.sqrt(1/(N-2) * np.sum([(a*xi+b-yi)**2 for xi,yi in zip(x,y)]))

# グラフ生成
import matplotlib.pyplot as plt

xx=np.linspace(0,5,100)
yy=np.polyval(p,xx) #結果からyを計算

plt.plot(x,y,'ro',label='data')
plt.plot(xx,yy,label="y = {:.3f} $\pm$ {:.3f} x + {:.3f} $\pm$ {:.3f}\nsigma$_y$={:.3f}".
         format(a,sigma_a,b,sigma_b,sigma_y))
plt.xlabel("x")
plt.ylabel("y")
plt.legend()
plt.show()

3次関数でも4次関数でも、全て線形なので同様に解ける。

誤差付きのデータの場合は以下のようにすればよい

import numpy as np

# データ生成
x = np.array([0,1,2,3,4,5])
y = np.array([0,4,6,8,10,15])
yerr = np.array([0.4,1,1,1,1,0.4])
N   = len(y)

# np.polyfitで係数と係数の誤差を計算.誤差はw=1/sigmaで与える
p, cov =np.polyfit(x,y,1, w=1.0/yerr,cov=True)
a = p[0]
b = p[1]
sigma_a = np.sqrt(cov[0,0])
sigma_b = np.sqrt(cov[1,1])

# グラフ生成
import matplotlib.pyplot as plt

xx=np.linspace(0,5,100)
yy=np.polyval(p,xx) #結果からyを計算

plt.errorbar(x,y,yerr=yerr,fmt='o',label='data',capsize=5,ecolor='black',markeredgecolor="black",color='w')
plt.plot(xx,yy,label="y = ({:.3f} $\pm$ {:.3f}) x + ({:.3f} $\pm$ {:.3f})".format(a,sigma_a,b,sigma_b))
plt.xlabel("x")
plt.ylabel("y")
plt.legend()
plt.grid()
plt.show()

メモ: 線形回帰 line fit

2020-01-23

はてなブログにおける数式の謎

他のソフトウェア

はてなブログのmarkdown形式は、数式を書くのに不完全なのでおすすめできない。

下線はメタ文字になる

ハットもメタ文字になる

行列は記述できない & が必ずエスケープされるので注意。

$\begin{pmatrix} 1 & 0 & 0 \\\ 0 & 1 & 0 \\\ 0 & 0 & 1 \end{pmatrix}$

$\begin{aligned} \sum_{i=1}^n i &= \frac{n(n+1)}2 \\ \sum_{i=1}^n i^2 &= \frac{n(n+1)(2n+1)}6 \\ \sum_{i=1}^n i^3 &= \left(\frac{n(n+1)}2\right)^2 \end{aligned}$

はてなブログで数式を書く - 七誌の開発日記

easy-copy-mathjax.xxxx7.com

物理の駅 Physics station by 現役研究者

テクノロジーは共有されてこそ栄える

Python YAML形式でKeyでソートさせない

Python: 正規表現ライブラリを使って、グループ化による置換

単スリットのフラウンホーファー回折のシミュレーション

Pythonでscipyを使わず一次関数(y=ax+b)でフィッティングし係数と係数の誤差を得る

はてなブログにおける数式の謎