Selbergの篩 - プライムス

Selbergの篩について解説します。
応用として双子素数の個数を計算します。

参考文献
篩法の問題設定
Selbergの上界篩
双子素数への応用

参考文献

リンク

篩法の問題設定

$\mathcal{A}$ を整数列とし
\begin{equation*}
\mathcal{A}_d =\{ a \in \mathcal{A} \; | \; a \equiv 0 \; (\text{mod} \; d ) \}
\end{equation*}とします。さらにパラメータ $z \ge 2$ に対し
\begin{equation*}
P(z) = \prod_{ p < z } p \quad (p \text{は素数})
\end{equation*}とし $S(\mathcal{A}, z) = \# \{ a \in \mathcal{A} \; | \; (a,P(z))=1 \}$ とします。

目標は $S(\mathcal{A},z)$ の評価です。今回はSelbergによって導入された $S(\mathcal{A},z)$ の上からの評価の方法を紹介します。

もちろん $\mathcal{A}$ に対してなんら仮定なしに計算することはできないので、任意の $d|P(z)$ に対して
\begin{equation}
{|}\mathcal{A}_d |= \frac{\rho(d)}{d} X +R_d \label{hypo}
\end{equation}と書けるものと仮定して計算を行います。ここで $\rho(d)$ は $0<\rho(p) < p$ を満たす乗法的関数とし、 $X>0$ かつ $|R_d| \le \rho(d)$ が成り立っているものとします。

なぜ $S(\mathcal{A}, z)$ を、またなぜこのような設定で計算するかは以下の記事にて詳しく解説しています。
mathnote.info

注意としてMöbius関数 $\mu(d)$ の基本公式
\begin{equation*}
\sum_{d|n} \mu(d) =
\begin{cases}
1 \quad &(n=1) \\
0 \quad &(n\neq 1)
\end{cases}
\end{equation*}を用いると
\begin{equation}
S(\mathcal{A},z) = \sum_{\substack{a \in \mathcal{A} \\ (a,P(z))=1}} 1 =\sum_{a \in \mathcal{A}} \sum_{d| (a, P(z))} \mu(d) \label{S(A,z)}
\end{equation}と書くことが出来ます。

Selbergの上界篩

Selbergの篩はそれ単体では $S(\mathcal{A},z)$ の上界のみを与えますが、特徴はその簡明さにあります。実際、Selbergの篩は次の(ほぼ)自明な不等式を基礎としています。

Lemma1

$\lambda_d$ を $\lambda_1=1$ を満たす任意の実数列とする。このとき
\begin{equation*}
\sum_{d|n} \mu(d) \le \left( \sum_{d|n} \lambda_d \right)^2
\end{equation*}が成立する。

証明 $n=1$ のときは両辺1となり、 $n\neq 1$ のときはMöbiusの基本公式から左辺が0なので自明に成立する。(QED)

Lemma1から $S(\mathcal{A},z)$ を計算する方法がSelbergの篩です。 $S(\mathcal{A},z)$ の計算に入る前に一つ有用な反転公式を用意しておきます。

Lemma2

$z>0$ とし数論的関数 $f(d)$ は $f(d)=0 \; (d\ge z)$ を満たすとする。このとき
\begin{equation*}
g(d)=\sum_{d|n} f(n) \; \Rightarrow \; f(d) = \sum_{d|n} \mu\left(\frac{n}{d} \right) g(n)
\end{equation*}が成立する。

証明整数 $d$ に対して
\begin{align*}
\sum_{d|n}\mu\left( \frac{n}{d} \right) g(n) &= \sum_{d|n}\mu \left( \frac{n}{d} \right) \sum_{n|m} f(m) \\
&= \sum_{d|m}f(m) \sum_{d|n, n|m} \mu \left( \frac{n}{d} \right) \\
&= \sum_{l} f(ld) \sum_{d|n , n|ld}\mu \left(\frac{n}{d} \right) \\
&= \sum_{l}f(ld) \sum_{m|l} \mu(m)
\end{align*}ここで3行目の和において $m=dl$ 、4行目の和において $n=dm$ と変数変換した。最後の和はMöbius関数の基本公式から $l=1$ のとき1となりそれ以外は0なので最後の行は $f(d)$ に一致する。(QED)

Theorem3 (Selbergの篩)

$g(d) , G(z)$ を
\begin{equation*}
g(d) = \prod_{p |d} \frac{\rho(p)}{p-\rho(p)}, \; G(z) = \sum_{\substack{d|P(z) \\ d {<}z}} g(d)
\end{equation*}と定める。このとき\eqref{hypo}の下で
\begin{equation*}
S(\mathcal{A},z) \le \frac{X}{G(z)} + \sum_{\substack{d_1,d_2 | P(z) \\ d_1,d_2 {<} z}} \rho([d_1,d_2])
\end{equation*}が成立する。

証明 Lemma1と\eqref{S(A,z)}から $\lambda_1=1, \lambda_d=0 \; (d\ge z \; \text{or} \; \mu(d) =0)$ を満たす任意の実数列 $\lambda_d$ に対し
\begin{align}
S(\mathcal{A},z) &\le \sum_{a\in \mathcal{A}} \left(\sum_{d|a,P(z)} \lambda_d \right)^2 \notag \\
& = \sum_{d_1, d_2} \lambda_{d_1}\lambda_{d_2} |\mathcal{A}_{[d_1,d_2]}| \notag \\
&= XS + R \label{equation1}
\end{align}
が成立。ここで
\begin{equation*}
S = \sum_{d_1,d_2} \lambda_{d_1}\lambda_{d_2}\frac{\rho([d_1,d_2])}{[d_1,d_2]}
\end{equation*}\begin{equation*}
R=\sum_{d_1,d_2} \lambda_{d_1} \lambda_{d_2} R_{[d_1,d_2]}
\end{equation*}とおいた。 $\rho(d)$ は乗法的関数なので
\begin{align*}
S &= \sum_{d_1,d_2} \frac{\lambda_{d_1}\rho(d_1)}{d_1} \frac{\lambda_{d_2}\rho(d_2)}{d_2} \frac{(d_1,d_2)}{\rho({(}d_1,d_2){)}} \\
&= \sum_{d_1,d_2} \frac{\lambda_{d_1}\rho(d_1)}{d_1} \frac{\lambda_{d_2}\rho(d_2)}{d_2} \prod_{p|d_1,d_2} \left( 1+g(p)^{-1} \right) \\
&= \sum_{d_1,d_2} \frac{\lambda_{d_1}\rho(d_1)}{d_1} \frac{\lambda_{d_2}\rho(d_2)}{d_2}\sum_{d|d_1,d_2} g(d)^{-1} \\
&= \sum_{\substack{d|P(z) \\ d{<}z}} g(d)^{-1} \left( \sum_{d|e} \frac{\lambda_{e} \rho(e)}{e} \right)^2
\end{align*}
が成立。そこで
\begin{equation*}
\xi_d= \sum_{d|e} \frac{\lambda_e \rho(e)}{e}
\end{equation*}とおくとLemma2から
\begin{equation}
\frac{\lambda_d \rho (d)}{d} = \sum_{d|e} \mu \left( \frac{e}{d} \right) \xi_e \label{weight}
\end{equation}が成立する。したがって $\lambda_d$ を決めるためには\eqref{weight}の下で
\begin{equation*}
S= \sum_{\substack{d|P(z)\\ d {<} z}} \frac{\xi_d^2}{g(d)}
\end{equation*}を最小にする $\xi_d$ を決定すればよい。\eqref{weight}で $d=1$ のときの場合にコーシー・シュワルツの不等式を用いると
\begin{align*}
1&= \left( \sum_{e}\mu (e) \xi_e \right)^2 = \left( \sum_{e} \frac{\mu(e) \xi_e}{\sqrt{g(e)}} \sqrt{g(e)} \right)^2 \\
& \le \left(\sum_{\substack{e|P(z) \\ e {<}z }}\frac{\xi_e^2}{g(e)} \right) \left(\sum_{\substack{e|P(z) \\ e {<} z}}g(e) \right) = SG(z)
\end{align*}したがって $\xi_d$ の選び方に依らず $S \ge G(z)^{-1}$ が成立するが、この不等式が等式になるように $\xi_d$ を選べば最良になる。再び\eqref{weight}の $d=1$ のときを用いると
\begin{align*}
S - G(z)^{-1} &= G(z)^{-1} \left(G(z) \sum_{d{<}z} \frac{\xi_d^2}{g(d)} -1 \right)\\
&= G(z)^{-1} \left(G(z) \sum_{d{<}z} \frac{\xi_d^2}{g(d)} -\sum_{d{<}z} \mu(d)\xi_d \right) \\
&= \sum_{d{<}z} \frac{\xi_d}{g(d)} \left( \xi_d - \frac{\mu(d)g(d)}{G(z)} \right)
\end{align*}
したがって $d|P(z), d{<}z$ に対し
\begin{equation*}
\xi_d = \frac{\mu(d)g(d)}{G(z)}
\end{equation*}すなわち
\begin{align}
\lambda_d &= \frac{d}{\rho(d)}\sum_{ \substack{e {<} z \\ d|e }} \mu\left( \frac{e}{d} \right) \frac{\mu(e)g(e)}{G(z)} \notag \\
&= \frac{\mu(d)}{G(z)} \prod_{p|d} \frac{p}{p-\rho(p)} \sum_{\substack{m {<} z/d \\ (m,d)=1 }} \mu(m)^2 g(m) \label{lambda}
\end{align}とすれば\eqref{equation1}から
\begin{equation*}
S(\mathcal{A},z) \le XS+R = \frac{X}{G(z)} + R
\end{equation*}が得られる。もし $|\lambda_d| \le 1$ が成立すれば明らかに
\begin{equation*}
R \le \sum_{\substack{d_1,d_2 | P(z) \\ d_1,d_2 {<} z}} \rho ([d_1,d_2])
\end{equation*}が成立しTheorem3が成り立つことが確かめられるので、以下 $|\lambda_d| \le 1$ を示す。
$\mu(d) \neq 0, d{<}z$ に対し
\begin{align*}
G(z) &= \sum_{n{<}z} \mu(n)^2 g(n) \\
&= \sum_{l|d} \sum_{\substack{n {<} z \\ (n,d)=l}}\mu(n)^2 g(n)\\
&= \sum_{l|d} \mu(l)^2 g(l) \sum_{\substack{ m{<}z/l \\ (m,d)=1}}\mu(m)^2 g(m) \\
& \ge \sum_{l|d} \mu(l)^2 g(l) \sum_{\substack{ m{<}z/d \\ (m,d)=1}}\mu(m)^2 g(m) \\
& = \prod_{p|d} \frac{p}{p-\rho(p)} \sum_{\substack{m{<}z/d \\ (m,d)=1}} \mu(m)^2 g(m)
\end{align*}となるが最後の式は\eqref{lambda}から $G(z) |\lambda_d|$ に一致する。すなわち $|\lambda_d| \le 1$ が得られる。(QED)

双子素数への応用

Selbergの篩の応用として(ちょっと一般化して)正整数 $a$ に対して
\begin{equation*}
\pi_{2a}(x)= \# \{ p\le x-2a \; | \; p+2a : \text{素数} \}
\end{equation*}の上からの評価を計算してみます*1。もちろん $a=1$ の場合が双子素数問題に対応します。

以前、当ブログにてBrunの純正篩を紹介しました。
mathnote.info

この記事ではBrunの純正篩を用いて
\begin{equation*}
\pi_2(x) \ll \frac{x}{(\log x)^2} \log \log x \quad (x\to \infty)
\end{equation*}を証明しましたが、同様の手順で
\begin{equation*}
\pi_{2a}(x) \ll H(a) \frac{x}{(\log x)^2} \log \log x
\end{equation*}を示すことができます。ここで $H(a)$ は
\begin{equation*}
H(a)= \prod_{2{<}p|a} \frac{p-1}{p-2}
\end{equation*}と定義されます。Hardy-Littlewood予想によると任意の $a$ に対して
\begin{equation*}
\pi_{2a}(x) = \frac{x}{(\log x)^2} \left( {\frak{S}}(a)+o(1)\right) \quad (x\to \infty)
\end{equation*}が特異級数と呼ばれる定数
\begin{equation*}
{\frak{S}}(a)=2H(a)\prod_{p>2} \left(1-\frac{1}{(p-1)^2} \right)
\end{equation*}に対して成り立つと予想されています。
Selbergの篩を用いるとBrunの純正篩を用いるよりも強い $\pi_{2a}(x)$ の上界を導くことが出来ます。

Theorem4

$a {>}0$ について一様に
\begin{equation*}
\pi_{2a}(x) \ll H(a) \frac{x}{(\log x)^2} \quad (x\to \infty)
\end{equation*}

Hardy-Littlewood予想を鑑みるとこれはOrder不等式としては最良の評価*2です。

Theorem4を証明するために
\begin{equation*}
\mathcal{A} = \{ n(n+2a) \; | \; n \le x -2a \}
\end{equation*}とします。 $2a \ge x$ のとき $\pi_{2a}(x)=0$ よりTheorem4は自明なので $2a < x$ とします。 $z\le x$ に対して $S(\mathcal{A},z)$ で数えられる元は $n,n+2a$ のどちらも $z$ より大きい素数になるものを含むので
\begin{equation}
\pi_{2a}(x) \le S(\mathcal{A},z) + \pi (z) \le S(\mathcal{A},z) +z \label{twin prime}
\end{equation}が成立します。またこのとき\eqref{hypo}が
\begin{equation*}
X=x-2a, \; \rho(p)=
\begin{cases}
1 \quad (p\; | \; 2a) \\
2 \quad (p\nmid 2a)
\end{cases}
\end{equation*}で成立することが簡単に確かめられます。この設定でTheorem3を用いれば\eqref{twin prime}から $z\le x$ に対して
\begin{equation}
\pi_{2a}(x) \le \frac{X}{G(z)} + \sum_{\substack{d_1,d_2 | P(z) \\ d_1,d_2 {<} z}}\rho([d_1,d_2]) +z \label{twin prime2}
\end{equation}なので以下右辺を計算していきます。

Lemma5

\begin{equation*}
\sum_{\substack{d_1,d_2 | P(z) \\ d_1,d_2 {<} z}}\rho([d_1,d_2]) \ll z^2(\log z)^2
\end{equation*}

証明 $\tau(d)$ を約数個数関数、 $\nu(d)$ を $d$ の素因数の個数としたとき $\mu(d) \neq 0$ なら $\tau(d) = 2^{\nu(d)}$ が成立する。従って $d_1,d_2|P(z)$ のとき
\begin{equation*}
\rho([d_1,d_2]) \le 2^{\nu( [d_1,d_2])} \le 2^{\nu(d_1)+\nu(d_2)} =\tau(d_1) \tau(d_2)
\end{equation*}が得られる。これより
\begin{equation*}
\sum_{\substack{d_1,d_2 | P(z) \\ d_1,d_2 {<} z}}\rho([d_1,d_2]) \le \left( \sum_{d{<} z} \mu(d)^2\tau(d)\right)^2
\end{equation*}となるが約数個数関数の平均値評価より右辺は $\ll z^2(\log z)^2$ である。(QED)

$G(z)$ の評価のために一つ補題を用意します。

Lemma6

ある定数 $A{>}0$ が存在して任意の自然数 $n \ge 1$ に対して
\begin{equation*}
\sum_{p{<}z} \frac{\rho(p)}{p} (\log p)^n \le \frac{2}{n}(\log z)^n +A (\log z)^{n-1}
\end{equation*}が成立する。

証明 $n=1$ のとき $2 \ge w \ge z$ に対して
\begin{equation*}
\sum_{w\le p {<} z} \frac{\rho(p)}{p}\log p \le 2\sum_{w \le p {<} z} \frac{\log p}{p}
\end{equation*}であるがMertensの第一定理から右辺は
\begin{equation*}
=2\log z - 2\log w +O(1) = 2\log \frac{z}{w} +O(1)
\end{equation*}となる。特にある定数 $A>0$ が存在して
\begin{equation}
\sum_{w\le p {<} z} \frac{\rho(p)}{p}\log p \le 2\log \frac{z}{w} +A \label{dim}
\end{equation}が成立する。 $w=2$ とすれば $n=1$ の場合が得られる。
$n\ge 2$ のときAbelの公式を適用すると
\begin{align*}
\sum_{p {<} z} \frac{\rho(p)}{p}(\log p)^n & = \left( \sum_{p {<} z} \frac{\rho(p)}{p}\log p \right) (\log z)^{n-1} \\
& \quad - \int_1^z \left(\sum_{ p {<} t } \frac{\rho(p)}{p} \log p \right) \frac{d(\log t)^{n-1}}{dt}\; dt \\
&= \int_1^z \left( \sum_{t \le p {<} z} \frac{\rho(p)}{p}\log p \right) \frac{d (\log t)^{n-1}}{dt} \; dt
\end{align*}と書ける。従って\eqref{dim}を用いれば
\begin{align*}
\sum_{p {<} z} \frac{\rho(p)}{p}(\log p)^n & \le \int_1^z \left( 2\log \frac{z}{t} +A \right) \frac{d (\log t)^{n-1}}{dt} \; dt \\
& = \frac{2}{n}(\log z)^n +A (\log z)^{n-1}
\end{align*}が得られる。(QED)

Lemma7

$z\ge2$ に対して
\begin{equation*}
W(z) = \prod_{p{<}z} \left(1-\frac{\rho(p)}{p}\right)
\end{equation*}と定める。このとき
\begin{equation*}
\frac{1}{G(z)} \ll W(z)
\end{equation*}が成立する。

証明 $2\le z \le x$ *3に対し
\begin{equation*}
G(x,z)=\sum_{\substack{d|P(z) \\ d {<} x}}g(d)
\end{equation*}とする*4。定義から
\begin{equation*}
\frac{1}{W(z)} = \prod_{p {<} z} \left( 1+g(p) \right) =\sum_{d|P(z)} g(d)
\end{equation*}なので
\begin{equation*}
\frac{1}{W(z)} - G(x,z) = \sum_{\substack{d \ge x \\ d|P(z)}} g(d)
\end{equation*}が得られるがパラメータ $0 {<} s {<} 1$ に対して右辺の和において $(d/x)^{1-s} \ge 1$ が成り立つことに注意して右辺を
\begin{equation*}
\le \sum_{d|P(z)} g(d) \left(\frac{d}{x}\right)^{1-s} = x^{s-1} \prod_{p {<} z} \left( 1+ g(p)p^{1-s} \right)
\end{equation*}と評価する。得られた不等式の両辺に $W(z)$ をかけて整理すれば
\begin{align}
1-W(z)G(x,z) &\le x^{s-1}W(z) \prod_{p {<} z} \left( 1+ g(p)p^{1-s} \right) \notag \\
&=x^{s-1} \prod_{p {<} z} \left(1-\frac{\rho(p)}{p} + \frac{\rho(p)}{p^s} \right) \notag \\
&=\text{exp} \left( -(s-1)\log x +\sum_{p{<} z} \log \left( 1+\frac{\rho(p)}{p^s} - \frac{\rho(p)}{p} \right) \right) \notag\\
&\le \text{exp} \left( -(s-1)\log x +\sum_{p{<} z}\rho (p) \left( \frac{1}{p^s}-\frac{1}{p}\right) \right) \label{eq lem7}
\end{align}と評価できる。ただし最後の行で不等式 $\log (1+x) \le x \; (x>0)$ を用いた。ここで指数関数のマクローリン展開を用いて
\begin{align*}
\frac{1}{p^s} -\frac{1}{p} &= \frac{1}{p} \left( \text{exp} \left( (1-s)\log p \right) -1 \right) = \frac{1}{p} \sum_{n=1}^{\infty} \frac{(1-s)^n (\log p)^n}{n!}
\end{align*}と書けることとLemma6を用いると
\begin{align*}
\sum_{p {<} z} \rho(p) \left( \frac{1}{p^s} - \frac{1}{p} \right) &= \sum_{n=1}^{\infty} \frac{(1-s)^n }{n!} \sum_{p {<} z} \frac{\rho(p)}{p}(\log p)^n \\
&\le \sum_{n=1}^{\infty} \frac{(1-s)^n }{n!}\left( \frac{2}{n} (\log z)^n + A (\log z)^{n-1} \right)
\end{align*}さらに $1-s = (\log z)^{-1}$ とすると最後の式は
\begin{align*}
&\le 2 \sum_{n=1}^{\infty} \frac{1}{n!n} + \frac{A}{\log z} \sum_{n=1}^{\infty} \frac{1}{n!} \\
&\le 4 \sum_{n=1}^{\infty} \frac{1}{(n+1)!} + \frac{A}{\log 2} \sum_{n=1}^{\infty} \frac{1}{n!} \\
&\le 4 \sum_{n=0}^{\infty} \frac{1}{n!} + \frac{A}{\log 2} \sum_{n=0}^{\infty} \frac{1}{n!} =4e +\frac{Ae}{\log 2}
\end{align*}と評価できる。ただし二行目で不等式 $n^{-1} \le 2(n+1)^{-1}$ を用いた。この不等式を\eqref{eq lem7}に代入すれば $2\le z \le x$ で
\begin{align*}
1-W(z)G(x,z) \le \text{exp} \left( -\frac{\log x}{\log z} +4e +\frac{Ae}{\log 2} \right)
\end{align*}が得られる*5。この評価において
\begin{equation*}
c= 4e +\frac{Ae}{\log 2} + \log 2 , \; x= z^c
\end{equation*}とすれば
\begin{equation}
W(z)G\left( z^c, z\right) \ge \frac{1}{2} \gg 1 \label{eq2 lem7}
\end{equation}が成立する。
ここから $G(z)^{-1}$ を評価する。自明に $G(z) \ge G(z,z^{1/c})$ なので \eqref{eq2 lem7}を用いれば
\begin{equation*}
\frac{1}{G(z)} \le \frac{1}{W(z^{1/c})G(z.z^{1/c})}\frac{W(z^{1/c})}{W(z)}W(z) \ll \frac{W(z^{1/c})}{W(z)}W(z)
\end{equation*}
が成立。 $\rho(p) \le 2$ に注意して
\begin{align*}
\frac{W(z^{1/c})}{W(z)} &\le \prod_{z^{1/c} \le p {<} z} \left(1-\frac{2}{p} \right)^{-1} \ll \prod_{z^{1/c} \le p {<} z} \left(1-\frac{1}{p}\right)^{-2}
\end{align*}と評価できるが最後の積はMertensの第三定理から $O(1)$ である。したがって
\begin{equation*}
\frac{1}{G(z)} \ll W(z)
\end{equation*}が得られる。(QED)

以上で準備完了です。Theorem4を証明します。

Theorem4の証明不等式\eqref{twin prime2}及びLemma5とLemma7から
\begin{equation*}
\pi_{2a}(x) \ll XW(z)+z^2(\log z)^2
\end{equation*}が成立。 $W(z)$ は定義から
\begin{align*}
W(z) &=\frac{1}{2} \prod_{\substack{2{<} p {<} z \\ p|2a}} \frac{p-1}{p-2} \prod_{2 {<}p {<} z} \left(1-\frac{2}{p}\right) \\
&\ll \prod_{2 {<} p|2a}\frac{p-1}{p-2} \prod_{2 {<} p {<} z} \left(1-\frac{1}{p}\right)^2
\end{align*}なので再びMertensの第三定理より $W(z)\ll H(a)(\log z)^{-2}$ と評価できる。すなわち
\begin{equation*}
\pi_{2a}(x) \ll H(a)\frac{X}{(\log z)^2} +z^2(\log z)^2
\end{equation*}が得られる。 $z=x^{1/4}$ とすれば
\begin{equation*}
\pi_{2a}(x) \ll H(a) \frac{X}{(\log x)^2} +x^{1/2}(\log x)^2 \ll H(a) \frac{x}{(\log x)^2}
\end{equation*}となりTheorem4が示される。(QED)