今は昔、チームメンバーがPython3で書いたコードありけり。コード、AWS Lambdaにデプロイされて動作しつつ、ときたまエラーを吐きてバグりけり。
……しかし、このPythonプロジェクト、テストコードがない(古文調は諦めた)。
そこで、ただバグを直しても芸がないと思い、ついでにPythonのテストコードの書き方を学びつつ、テスト駆動開発(TDD)を実戦投入してみることにした。
以下、Python初心者によるTDDの記録である。
- [DynamoDBへのアクセス時エラーをテストする]
- [MagicMockでDynamoDBへのアクセスをモックする]
- [モックした関数呼び出しをテストする]
- [MagicMockのアサートを利用する]
- [引数リストのアンパックを利用してリファクタ]
- [まとめ]
[DynamoDBへのアクセス時エラーをテストする]
問題のエラーはAmazon DynamoDBにアクセスする際に発生しており、エラー処理が適切に行われていなかった。
このエラー処理のテストを書くには、3つの選択肢がある。
- 実物のDynamoDBを利用する
- DynamoDBLocalやLocalstackなどDynamoDB APIと互換性のあるミドルウェアを利用する
- テストライブラリを利用してDynamoDBへのアクセスをモックする
今回は選択肢3を採用した。理由は以下の通り。
選択肢1については、以下の理由で断念した。
- DynamoDBへのアクセス権限を各開発者ローカル環境やCI環境毎にセットアップするのが面倒
- 微々たる額ながらDynamoDBの利用料金がかかる
- インターネット経由でのDynamoDBへのアクセスによりテスト実行にかかる時間が長くなる
選択肢2については、以下の理由で断念した。
[MagicMockでDynamoDBへのアクセスをモックする]
Pythonでテストコードを書いたことがなかったので、適当に検索して公式ドキュメントにたどり着いた。このモックオブジェクトライブラリーが利用できるのはPython 3.3以降らしい。
MagicMock
クラスを使えば、どの関数でもモックすることができる。ということは、これを使えばDynamoDBに限らず、boto3が対応している他のAWSサービスへのアクセスも同じようなやり方でテストを記述することができる。
ローカルでの動作確認は今回Python 3.7.1を利用した。
$ python --version Python 3.7.1
バグを修正する前のテスト対象のファイルは、擬似的な表すと次のようになっていた。
[myfunc.py]
import boto3 def lambda_handler(event, context): table = boto3.resource('dynamodb').Table('my_awesome_table') update(table, event['id'], event['count_up']) def update(table, id, count_up):
# call DynamoDB API table.update_item( Key={ 'id': id }, UpdateExpression='SET #count = #count + :count_up', ExpressionAttributeNames={ '#count': 'count' }, ExpressionAttributeValues={ ':count_up': count_up } ) return True # Success
本当はハンドラ関数()の外でtable
を初期化する方がパフォーマンスが良いのだが、このラムダ関数にはパフォーマンスはあまり求められていないので無視した。
これをモックしたテストコードを書きはじめる。とりあえずはDynamoDBのUpdateItemが呼ばれていることをアサートする。
[test_myfunc.py]
import myfunc import boto3 import unittest from unittest import TestCase from unittest.mock import MagicMock table = boto3.resource('dynamodb').Table('my_awesome_table') class TestUpdate(TestCase): def setUp(self): # prepare the test table.update_item = MagicMock() def test_update_normal(self): # call the function calling DynamoDB API myfunc.update(table, 'dummy_id', 1) # assert DynamoDB API is called table.update_item.assert_called_once() def tearDown(self): # clean up if __name__ == '__main__': unittest.main()
[モックした関数呼び出しをテストする]
ラムダ関数本体のコードとテストコードは、以下のように同じディレクトリに置かれている。
$ ls myfunc.py test_myfunc.py
このとき、Pythonのunittestを実行するには、python -m unittest discover
というコマンドを実行すれば良い。しかし、普段Pythonを使い慣れていないので、この長ったらしいコマンドをこの先もずっと覚えていられる気がしない。
そこで、以下のようにMakeファイルを書いて、make test
コマンドでテストを実行できるようにしておいた。
[Makefile]
.DEFAULT_GOAL := help help: ## show help text @echo "Description:" @echo " Run tests." @echo "Commands:" @echo " test Execute unittest" test: python -m unittest discover
コマンドを実行すると以下のようにテストが実行され、結果が表示される。
$ make test python -m unittest discover . --------------------------- Ran 1 tests in 0.05s OK
無事にテストが通った。
[MagicMockのアサートを利用する]
先ほど利用したassert_called_once()以外にも、MagicMockにはいくつかのアサート用関数が用意されている。
- assert_called(*args, **kwargs):最低1回はモックが呼び出されたことをアサートする
- assert_called_once_with(*args, **kwargs):指定の引数で1回だけモックが呼び出されたことをアサートする(2回以上呼ばれた場合はテストが失敗する)
- assert_not_called():モックが呼び出されていないことをアサートする
また、MagicMockにはcall_count
というプロパティがある。これを利用することで、次のようにモックの呼び出し回数をアサートすることができる。
# import文は省略 table = boto3.resource('dynamodb').Table('my_awesome_table') class MyTest(TestCase): def test_mock_call_count(self): table.update_item = MagicMock() table.update_item() table.update_item() table.update_item() self.assertEqual(table.update_item.call_count, 3) # True
これらを活用して、次のような形でいくつかの引数のパターンのテストを拡充していく。
# 色々省略。 def test_normal_argument(self): table.query = MagicMock() table.update_item = MagicMock() myfunc.update(table, 'new_test_id', 100) table.query.assert_not_called() table.update_item.assert_called_once_with( Key={ 'id': 'new_test_id' }, UpdateExpression='SET #count = #count + :count_up', ExpressionAttributeNames={ '#count': 'count' }, ExpressionAttributeValues={ ':count_up': 100 } )
[引数リストのアンパックを利用してリファクタ]
順調にテストケースを追加していったところ、下記のように、似たような引数での関数呼び出しに対するアサートがいくつも並んでしまった。
# 色々省略。 def test_2(self): # 色々省略。 table.update_item.assert_called_once_with( Key={ 'id': 'test_2' }, UpdateExpression='SET #count = #count + :count_up', ExpressionAttributeNames={ '#count': 'count' }, ExpressionAttributeValues={ ':count_up': 2 } ) def test_3(self): # 色々省略。 table.update_item.assert_called_once_with( Key={ 'id': 'test_3' }, UpdateExpression='SET #count = #count + :count_up', ExpressionAttributeNames={ '#count': 'count' }, ExpressionAttributeValues={ ':count_up': 3 } def test_4(self): # 色々省略。 table.update_item.assert_called_once_with( Key={ 'id': 'test_4' }, UpdateExpression='SET #count = #count + :count_up', ExpressionAttributeNames={ '#count': 'count' }, ExpressionAttributeValues={ ':count_up': 4 }
これでは、例えばtest_5
のような新しいテストケースを作る際に、コピペが発生してしまう。
何かいい方法はないかと考え、Google先生に尋ねたところ(検索キーワードは忘れてしまったが)、以下の公式ドキュメントにたどりついた*1。
公式ドキュメントで上げられている例に少し追加して使い方をメモしておく。
キーワード引数でない通常の引数をアンパックする場合には、*
演算子を用いる。
>>> list(range(3, 6)) # 別々の引数での通常呼び出し [3, 4, 5] >>> args = [3, 6] >>> list(range(*args)) # リストからアンパックされた引数での呼び出し [3, 4, 5]
キーワード引数をアンパックする場合には、**
演算子を用いる。
>>> def parrot(voltage, state='a stiff', action='voom'): ... print("-- This parrot wouldn't", action, end=' ') ... print("if you put", voltage, "volts through it.", end=' ') ... print("E's", state, "!") ... >>> parrot(voltage="three million") # 別々のキーワード引数での通常呼び出し -- This parrot wouldn't voom if you put three million volts through it. E's a stiff ! >>> d = {"voltage": "four million", "state": "bleedin' demised", "action": "VOOM"} >>> parrot(**d) # 辞書からアンパックされたキーワード引数での呼び出し -- This parrot wouldn't VOOM if you put four million volts through it. E's bleedin' demised !
このキーワード引数のアンパックを利用して、先ほどのコードを次のようにリファクタした。
# 色々省略。 def get_args(count_up): return { 'Key': { 'id': 'test_' + str(count_up) }, 'UpdateExpression': 'SET #count = #count + :count_up', 'ExpressionAttributeNames': { '#count': 'count' }, 'ExpressionAttributeValues': { ':count_up': count_up } } class MyTest(TestCase): def test_2(self): # 色々省略。 table.update_item.assert_called_once_with(**get_args(2)) def test_3(self): # 色々省略。 table.update_item.assert_called_once_with(**get_args(3)) def test_4(self): # 色々省略。 table.update_item.assert_called_once_with(**get_args(4))
この後、本題であるエラー発生時のテストコードを書き、それに合わせてLambda関数本体のコードを修正した。その後、同様のエラーの発生は確認されていない。
[まとめ]
- Python3.3以降では標準のモックオブジェクトライブラリ
unittest.mock
が使える - とりあえず
MagicMock
を使っておくと良い - 同一あるいは類似の引数での関数呼び出しを複数回アサートする際は
*
演算子や**
演算子で引数リストをアンパックすると便利
力尽きたので長くなってしまったので、この記事はここまでにして、TDDの本題であるエラー処理とそのテストについては、後日別記事を書く予定。