PS를 위한 정수론 - (4) 이항 계수 (nCr mod P) 구하는 다양한 방법

이항 계수 $_{n}C_r$ 을 소수 $p$ 로 나눈 나머지를 빠르게 구하는 다양한 방법들을 알아보자.

기본적으로 특정 $n$ 과 $r$ 에 대해서 이항 계수 $_{n}C_r$ 을 구하는 시간은 $O(1)$ 이 되어야 할 때,

즉, 많은 쿼리가 들어와도 문제가 없는 경우를 고려한다.

지금부터 소개하는 방법들의 시간복잡도는 전처리하는데 필요한 시간을 의미한다.

너무 작은 $n$ 과 $r$ 에 대해서 직접 분자와 분모를 모두 곱하는 경우는 생략한다.

1. $O(n^2)$

www.acmicpc.net/problem/11051

11051번: 이항 계수 2

첫째 줄에 $N$ 과 $K$ 가 주어진다. (1 ≤ $N$ ≤ 1,000, 0 ≤ $K$ ≤ $N$ )

www.acmicpc.net

파스칼의 삼각형을 이용하는 방식이다.

이항 계수에 대한 성질로 매우 잘 알려져있는 $_{n}C_r = \;_{n-1}C_{r-1} +\; _{n-1}C_r$ 을 이용해서 dp table을 만든다.

따라서 이를 전처리하기 위해서는 $O(n^2)$ 에 해당하는 시간과 메모리가 필요하다.

가장 단순한 방법이지만, $n$ 과 $r$ 이 10000 이상 커진다면 이용하기 힘든 방식이다.

물론 $n$ 과 $r$ 이 충분히 작다면 이 방식을 이용하지 않을 이유가 없다.

[소스 코드]

#include<bits/stdc++.h>
using namespace std;
using ll = long long;
const int MOD = (int)1e9 + 7;

ll C[1000][1000];
int main(void) {
	int n, r;
	for (int i = 1; i <= 1000; i++) {
		for (int j = 0; j <= i; j++) {
			if (j == 0 || j == i) C[i][j] = (C[i - 1][j - 1] + C[i - 1][j]) % MOD;
		}
	}
	cout << C[n][r];
}

2. $O(nlogp)$

www.acmicpc.net/problem/11401

11401번: 이항 계수 3

자연수 $N$ 과 정수 $K$ 가 주어졌을 때 이항 계수 $\binom{N}{K}$ 를 1,000,000,007로 나눈 나머지를 구하는 프로그램을 작성하시오.

www.acmicpc.net

이처럼 $n$ 과 $r$ 이 400만인 경우는 어떻게 구할까?

위의 방식으로는 400만 x 400만의 배열 크기와 시간이 필요하므로 불가능하다는 것을 당연히 알 수 있다.

페르마의 소정리를 떠올려보자. (링크 : rebro.kr/105)

n이 10000보다 커진다면, 파스칼의 삼각형을 이용하는 방식을 사용할 수 없으므로

$_{n}C_r = n! / (r!(n-r)!)$ 식을 이용해서 분모와 분자를 직접 계산하는 방식을 이용해줘야 한다.

다만, 우리가 구하는 이항 계수는 $p$ 에 대한 나머지를 구하는데, 분모가 존재하므로 계산하기가 쉽지 않다.

따라서 페르마의 소정리인 $a^{p-1} \equiv 1\;(mod\;p)$ 를 이용한다.

이 식을 이용하면 $a^{p-2} \equiv a^{-1}\;(mod\;p)$ , 즉 $a$ 의 $mod\;p$ 에 대한 곱셈의 역원이 $a^{p-2}$ 인 것을 알 수 있다.

따라서 $mod\;p$ 에 대해서 $r!(n-r)!$ 을 나누는 것이 아니라, $r!(n-r)!$ 의 역원인 $(r!(n-r)!)^{p-2}$ 을 곱하는 방식이다.

$a^k$ 를 구하는데 필요한 시간은 $O(logk)$ 이면 충분하다. "분할 정복을 이용한 거듭제곱" 방식이다.

혹시 이를 모른다면 꼭 공부를 하는 것을 권장한다.

예를 들어서 $a^{58}$ 을 계산해야 한다고 가정하자. $58$ 을 이진수로 나타내면 $111010$ 로 나타난다.

따라서 $a^{58}$ 의 지수를 $2^5 + 2^4 + 2^3 + 2^1$ 로 표현하면 $a^{58} = a^{32}\times a^{16}\times a^8 \times a^2$ 와 같이 표현이 가능하고,

이진수의 오른쪽 끝부터 시작해서 매번 a를 제곱시켜가면서, $1$ 인 자릿수인 경우에는 결괏값에 곱해주면 된다.

여기까지는 하나의 $_{n}C_r$ 을 구하는 과정이고, 최종적으로 우리가 원하는 경우는 많은 쿼리가 들어와도 문제가 없는 경우이다.

www.acmicpc.net/problem/13977

13977번: 이항 계수와 쿼리

$M$ 개의 자연수 $N$ 과 정수 $K$ 가 주어졌을 때 이항 계수 $\binom{N}{K}$ 를 1,000,000,007로 나눈 나머지를 구하는 프로그램을 작성하시오.

www.acmicpc.net

매번 $_{n}C_r$ 을 $O(1)$ 만에 구하기 위해서는 팩토리얼(factorial) 값에 대해서 미리 전처리를 해두어야 한다.

$1!$ 부터 $n!$ 까지 배열에 계산을 해두고, 각 팩토리얼값마다 역원을 계산 $((O(logp))$ 해두면 $_{n}C_r$ 을 $O(1)$ 만에 계산할 수 있다.

코드는 3번에서 확인하자.

3. $O(n + logp)$

2번 방식에서 약간만 변형시킨 것이다.

원래는 각 팩토리얼값마다 역원을 각각 계산해주었는데, 잘 생각해보면 팩토리얼의 역원에도 점화식이 생긴다.

$((n-1)!)^{-1} = n*(n!)^{-1}$ 을 만족하기 때문에, 처음에 $1!$ 부터 $n!$ 까지의 값과 $n!$ 의 역원을 미리 계산해두면

$1!$ 부터 $(n-1)!$ 의 역원까지는 모두 $O(1)$ 에 계산할 수 있다.

사실 작정하고 이항계수에 대해서 낸 문제가 아니라면 기본적으로 N이 1000만 이상 주어지지 않기 때문에 보통 대부분의 문제들은 여기까지만 알아도 다 해결할 수 있다.

[소스 코드]

#include<bits/stdc++.h>
using namespace std;
using ll = long long;
const int MOD = (int)1e9 + 7;

#define MN 4000000
ll fac[MN+10], facinv[MN+10];
ll mpow(ll a, ll x) {
	ll res = 1;
	while (x > 0) {
		if (x % 2) res = (res*a) % MOD;
		a = (a*a) % MOD;
		x /= 2;
	}
	return res;
}
void fac_init() {
	fac[0] = 1;
	for (int i = 1; i <= MN; i++) fac[i] = fac[i - 1] * i % MOD;
	facinv[MN] = mpow(fac[MN], MOD - 2);
	for (int i = MN - 1; i >= 0; i--) facinv[i] = facinv[i + 1] * (i + 1) % MOD;
}
ll C(ll n, ll r) {
	return ((fac[n] * facinv[r]) % MOD) * facinv[n - r] % MOD;
}
int main(void) {
	ll n, r;
	fac_init();
	cout << C(n, r);
}

4. $O(n)$

$O(n + logp)$ 와 비교해서 시간적인 부분은 거의 동일하다.

(실제로 코드 구현에 있어서는 추가적인 연산들로 인해 $O(n + logp)$ 의 시간이 덜 소모된다)

다만 구하는 과정이 짧고 꽤나 참신해서 살펴볼만하다.

3번에서 $O(logp)$ 가 필요한 이유는 처음에 $n!$ 에 대한 역원을 직접 구해줘야 했기 때문이다.

이를 어떻게 $O(1)$ 만에 구할 수 있을까?

정수 $k$ 에 대한 역원은 DP로 간단하게 구할 수 있고, 점화식은 다음과 같다.

$1^{-1} \equiv 1$ 이고, $k^{-1} \equiv -(p / k) \times (p\%k)^{-1} \; (mod\;p)$

증명 과정을 살펴보자.

먼저 $p = (p/k)*k + p\%k$ 를 만족한다.

양변에 $mod\;p$ 를 씌워주면 $0 \equiv (p/k)*k + p\%k\;(mod\;p)$ , $(-p/k)*k \equiv p\%k \;(mod\;p)$ 가 된다.

따라서 $((-p/k)*k)^{-1} \equiv (p\%k)^{-1} \;(mod\;p)$ 를 만족하고,

양변에 $(-p/k)$ 를 곱해주면 최종적으로 $k^{-1} \equiv (p\%k)^{-1} \times (-p/k)$ 가 나온다.

여기서 나오는 $(p/k)$ 는 정수이고, $p\%k$ 는 항상 $k$ 보다 작기 때문에 이전의 dp값으로 계산해줄 수 있다.

[소스 코드]

#include<bits/stdc++.h>
using namespace std;
using ll = long long;
const int MOD = (int)1e9 + 7;

#define MN 4000000
ll fac[MN+10], facinv[MN+10], inv[MN+10];
void fac_init() {
	fac[0] = facinv[0] = inv[1] = 1;
	for (int i = 1; i <= MN; i++) {
		inv[i+1] = (MOD - MOD / (i+1)) * inv[MOD%(i+1)] % MOD;
		fac[i] = fac[i - 1] * i % MOD;
		facinv[i] = facinv[i-1]* inv[i] % MOD;
	}
}
ll C(ll n, ll r) {
	return ((fac[n] * facinv[r]) % MOD) * facinv[n - r] % MOD;
}
int main(void) {
	ios::sync_with_stdio(false); cin.tie(nullptr); cout.tie(nullptr);
	fac_init();
	ll n, k; cin >> n >> k;
    cout << C(n, k) ;
}

5. $O(p)$

www.acmicpc.net/problem/11402

11402번: 이항 계수 4

첫째 줄에 $N$ , $K$ 와 $M$ 이 주어진다. (1 ≤ $N$ ≤ 1018, 0 ≤ $K$ ≤ $N$ , 2 ≤ $M$ ≤ 2,000, M은 소수)

www.acmicpc.net

이처럼 $n$ 이 매우 큰 경우에는 위에서 설명한 어떤 방법으로도 $O(n)$ 보다 작게 계산할 수 없다.

이때, Lucas Theorem (뤼카의 정리)이라는 정리를 사용할 수 있다.

뤼카의 정리는 이처럼 $n$ 이 크고 $p$ 가 작은 경우에 이항계수를 $O(p)$ 만에 구할 수 있는 방법이다.

- Lucas Theorem (뤼카의 정리)

음이 아닌 정수 $n$ 과 $r$ , 소수 $p$ 에 대해서 $n$ 과 $r$ 를 $p$ 진법으로 나타내면 다음과 같다.

$n = n_kp^k + n_{k-1}p^{k-1} + n_{k-2}p^{k-2} + ... + n_1p + n_0$

$r = r_kp^k + r_{k-1}p^{k-1} + r_{k-2}p^{k-2} + ... + r_1p + r_0$

이때, $_{n}C_r \equiv \prod_{i=0}^{k} {_{n_i}C_{r_i}} \;\; (mod\;p)$ 가 성립한다는 것이 뤼카의 정리이다.

증명과정은 다음과 같다.

$\sum_{r=0}^{n} {_{n}C_r} x^r$ 의 전개과정을 살펴보자.

$\sum_{r=0}^{n} {_{n}C_r} x^r \equiv (1+x)^n \equiv (1+x)^{n_k p^k + n_{k-1}p^{k-1} + ... + n_1p + n_0} \equiv \prod_{i=0}^{k} [(1+x)^{p^i}]^{n_i}$ 를 만족한다.

이때, $(1+x)^{p^n}$ 은 이항정리에 의해서 $_{p^n}C_0 x^0 + _{p^n}C_1 x^1 + ... + _{p^n}C_{p^n} x^{p^n}$ 을 만족하고, $p$ 가 소수이므로 모든 $1\leq i \leq p^n-1$ 에 대해서 $_{p^n}C_i$ 는 $p$ 로 나누어 떨어진다.

따라서, $(1+x)^{p^n} \equiv 1+x^{p^n} \;\;(mod\;p)$ 를 만족한다.

그러므로 $\prod_{i=0}^{k} [(1+x)^{p^i}]^{n_i} \equiv \prod_{i=0}^{k} [1+x^{p^i}]^{n_i} \;\; (mod \;p)$ 로 만들어진다.

여기서 다시 안의 식에 이항 정리를 이용하면 $\prod_{i=0}^{k} \,[\,\sum_{r_i = 0}^{n_i} \;{_{n_i}C_{r_i} x^{r_ip^i}}\,]$ 가 되고,

$[ \,\,]$ 안의 식을 전개한 후 정리하면 $\sum_{r=0}^{n} [\,(\prod_{i=0}^{k} {_{n_i}C_{r_i}}) x^r\,]$ 로 만들어진다.

따라서, $_{n}C_r \equiv \prod_{i=0}^{k} {_{n_i}C_{r_i}} \;\; (mod \;p)$ 가 성립한다.

증명 과정은 복잡하지만, 정리를 코드로 구현하면 생각보다 간단하다.

쿼리당 걸리는 시간은 $O(logn \;/\; logp)$ 이므로 상수와 다름없게 생각해도 된다.

[소스 코드]

#include<bits/stdc++.h>
#define MAX_P 2001
using namespace std;
using ll = long long;
const int MOD = 7;
ll fac[MAX_P];

ll mpow(ll a, ll k, ll mod) {
	ll res = 1;
	while (k > 0) {
		if (k % 2) res = (res * a) % mod;
		a = (a*a) % mod;
		k /= 2;
	}
	return res;
}

int main(void) {
	ll n, r; 
	ll ans = 1;
	while (n || r) {
		int N = n % MOD;
		int R = r % MOD;
        if(R > N) {
            ans = 0;
            break;
        }
		ans *= fac[N] * mpow(fac[R] * fac[N - R], MOD - 2, MOD) % MOD;
		ans %= MOD;
		n /= MOD;
		r /= MOD;
	}
	cout << ans;
}

6. 연습 문제

[BOJ 13977] 이항 계수와 쿼리 Gold I

[BOJ 11402] 이항 계수 4 Platinum V

[BOJ 15791] 세진이의 미팅 Gold I

[BOJ 16134] 조합 Gold I

[BOJ 20296] 폰친구 Platinum IV

[Codeforces 1462E2] Close Tuples (Hard version)

[Codeforces 1445D] Divide and Sum

본 글은 구사과님의 블로그 (koosaga.com/63)에서 영감을 받은 글입니다.

PC로 보시는 것을 권장합니다.

피드백은 언제나 환영입니다. 댓글로 달아주세요 ^-^

저작자표시 비영리 동일조건

'알고리즘 > 수학' 카테고리의 다른 글

PS를 위한 정수론 - (3) 페르마의 소정리와 활용 (이항 계수, 밀러-라빈) (32)	2021.01.08
PS를 위한 정수론 - (2) 유클리드, 확장 유클리드 호제법 (0)	2020.12.29
PS를 위한 정수론 - (1) 에라토스테네스의 체 활용 (9)	2020.12.28
소수 판별법 - 에라토스테네스의 체, 밀러-라빈(Miller-Rabin) 소수판별법 (4)	2020.05.19

내 블로그 - 관리자 홈 전환	`Q` `Q`
새 글 쓰기	`W` `W`

글 수정 (권한 있는 경우)	`E` `E`
댓글 영역으로 이동	`C` `C`

이 페이지의 URL 복사	`S` `S`
맨 위로 이동	`T` `T`
티스토리 홈 이동	`H` `H`
단축키 안내	`Shift` + `/` `⇧` + `/`

Rebro의 코딩 일기장

PS를 위한 정수론 - (4) 이항 계수 (nCr mod P) 구하는 다양한 방법

1. $O(n^2)$

2. $O(nlogp)$

3. $O(n + logp)$

4. $O(n)$

5. $O(p)$

6. 연습 문제

'알고리즘 > 수학' 카테고리의 다른 글

티스토리툴바

개인정보

단축키

내 블로그

블로그 게시글

모든 영역

PS를 위한 정수론 - (4) 이항 계수 (nCr mod P) 구하는 다양한 방법

1. O(n2)O(n^2)

2. O(nlogp)O(nlogp)

3. O(n+logp)O(n + logp)

4. O(n)O(n)

5. O(p)O(p)

6. 연습 문제

'알고리즘 > 수학' 카테고리의 다른 글

'알고리즘/수학' Related Articles

티스토리툴바

개인정보

단축키

내 블로그

블로그 게시글

모든 영역

1. $O(n^2)$

2. $O(nlogp)$

3. $O(n + logp)$

4. $O(n)$

5. $O(p)$