最近、Pythonが流行っている。以前はコンテンツの扱いに優れているとかで流行ったようだが、今は人工知能関連で流行っているようだ。
といっても、Python自体はAI関連の処理をどんどんできるほど高速な処理系ではない。
実はいくつかの拡張モジュールが用意されていて、それを使うことで高速性が要求されるAIを実装可能にしている。
その1つというか、ベースになっているのがNumpyで、配列が導入され、かつ計算処理でよく出てくる処理が一発でできるようになっている。
今回は、その一端をちょこっと紹介しておこうと思う。
しかし、こういう新しい分野は、なかなか日本語の情報が出てこなかったり、古い情報だったりするので、そういうことに煩わされないためには、はじめから英語で読んでしまったほうが楽になる。それに、しっかりしたドキュメントが無料で入手できる可能性も高くなる。
それで見つけたのが、これ。
Scipy Lecture Notes 2015 Edition
Numpy, Scipy, プロッティングなどまとめて書かれていて、360ページ以上ある。
そのなかのNumpyのところを読んでいたら、練習問題に素数を求めるのがあったので、その解説を元に書いてみた(prime.py)。
import sys
import numpy as np
np.set_printoptions(threshold=np.inf) # 配列の ... 表示を抑制
N = int(sys.argv[1])+1 # 引数の上限値を含める
is_prime = np.ones((N,), dtype=bool)
is_prime[:2]=0
N_max = int(np.sqrt(N))
for j in range(2,N_max+1):
if(is_prime[j]):
is_prime[j*j::j] = False # 素数jの間隔で消していく
primes = np.arange(N)[is_prime]
print(primes,'\ncount:',primes.size)
コマンドレベルから直接実行してみた。引数に、調べる上限数を指定する。
$ python prime.py 1000
[ 2 3 5 7 11 13 17 19 23 29 31 37 41 43 47 53 59 61
67 71 73 79 83 89 97 101 103 107 109 113 127 131 137 139 149 151
157 163 167 173 179 181 191 193 197 199 211 223 227 229 233 239 241 251
257 263 269 271 277 281 283 293 307 311 313 317 331 337 347 349 353 359
367 373 379 383 389 397 401 409 419 421 431 433 439 443 449 457 461 463
467 479 487 491 499 503 509 521 523 541 547 557 563 569 571 577 587 593
599 601 607 613 617 619 631 641 643 647 653 659 661 673 677 683 691 701
709 719 727 733 739 743 751 757 761 769 773 787 797 809 811 821 823 827
829 839 853 857 859 863 877 881 883 887 907 911 919 929 937 941 947 953
967 971 977 983 991 997]
count: 168
もし、printoptionsの指定がないと、
# np.set_printoptions(threshold=np.inf) # 配列の ... 表示を抑制
こんな風になってしまう。
$ python prime.py 1000
[ 2 3 5 ..., 983 991 997]
count: 168
つまり、長い大量の情報は、 … に置き換えてコンパクトに表示してくれる。
これが、大きなお世話になることも多々ある。
一番Numpy的な個所は、コメントに「
素数jの間隔で消していく
」と書いたところ。普通だったらループを回るところだが、Numpyでは、素数jの間隔で配列要素の値を書き換えることができる。このおかげで、ループ1階層分の時間短縮ができているとも言える。