QAエンジニアがテスト自動生成に興味をもってゆるふわチャレンジしてみた！第一弾

2025年3月29日 22:07

わたしは普段テスト開発や実行を担当しています。
業務の過程で「テストケース作成って自動化できないのかな？」と疑問に思いました。

ちょっと試してみたいなー。
やってみよっかな？
仕組みを知るだけでも、きっと有意義なはず！
ただ私はプログラミング経験がなく、なんも書けません。
でも機械学習的なやつを試すならPythonが必要そうかも？（勝手なイメージ）と考えちょびっと学習してみました。

自分の忘備録のためにブログを書いてみます！

私と同じように「Python？知らんけど？」「機械学習ってなあに？」というQAエンジニアの方に読んで頂けたらうれしいです❤️
超初心者向けだよー。

もし間違いなどがあれば指摘や、もっとこんなこともやってみるといいよ！など、アドバイス頂けたらとてもよろこびます！

1. なぜ機械学習でテストを自動生成したいのか？

テスト開発をしていると、こんな気持ちになりました。

● テストケース作成に時間がかかる（つらい）
・仕様書を読み、どんなテストが必要か考えるのは手間がかかる
・同じようなテストケースを何度も作っている気がする

● 十分なテストケースの考慮がむずかしい（つらい）
・必要なケースを洗い出したつもりでも、抜け漏れがあるかもしれない
・人間が手作業で考えると、バイアスがかかる気がする

● 仕様変更のたびに修正が必要（つらい）
・変更があると、テストケースの見直しが大変

そこで、機械学習を使ってテストケースを自動生成できないか？と考え、お試しでやってみることにしました！
実験！実験！GO!GO!

2. 使った書籍とツール＆最初に知っておいて良かったこと

①今回のチャレンジに使ったもの

🤩 書籍：入門 Python3
🤩 Google Colab（無料のPython実行環境）
🤩 scikit-learn サイキット・ラーン（Pythonの機械学習ライブラリ）

②書籍「入門Python3」を使った学習

書籍を使って、実際に手を動かして書いて試すを実施しました。

③Google Colabの使い方

1.以下のリンクからアクセース

2.ノートブックを新規作成
3.空白の「コードセル」が表示されているので、ここにコードを書く

④scikit-learn 基本的な使い方を知る

1.インストール方法
（Google Colabを使う場合は不要だったけど一応記録しておく）

pip install scikit-learn

2.共通的な使い方例
ざっくり言うと「データを準備 → 分ける → モデルを学習 → 予測する」と言う流れ。
最初はこの流れを理解するように試してみたりしました。
（でも今もあんまり理解できていない、今後がんばる！）

【ステップ1】必要なライブラリを読み込む

from sklearn.model_selection import train_test_split
from sklearn.ensemble import RandomForestClassifier

【ステップ2】データを準備する

# 説明変数（X）と目的変数（y）を用意する
X = [[5, 3], [10, 2], [2, 8], [9, 7]] 
y = [0, 0, 1, 1] # 0と1のラベル

【ステップ3】データを学習用とテスト用に分ける

X_train, X_test, y_train, y_test = train_test_split(
    X, y, test_size=0.25, random_state=42
)

【ステップ4】モデルを作成して学習する

model = RandomForestClassifier() # ランダムフォレストモデルを使う
model.fit(X_train, y_train) # 学習データでモデルを訓練する

【ステップ5】テストデータで予測する

predictions = model.predict(X_test) # 予測を実行
print(predictions) # 結果を表示

※上記はchatGPTに教えてもらったコードのためRandomForestを使用しています。次のセクションで実際にやってみる際はわかりやすそうなKNeighborsClassifierを使用しています。

3. 胸アツ！実際にやってみた！「ユーザーストーリーからテストケース自動生成」

① ありそうなイマジナリーテストケースのデータを準備

実際のプロジェクトではなく、よくありそうな簡易的ユーザーストーリーと、それに対応するテストケースをCSVでまとめました。
これをGoogle Colab の左メニューの「ファイル」にアップロードします。

test_cases.csv（テストケースデータ）

ユーザーストーリー,テストケース,期待結果
"ユーザーがログインする","正しいパスワードを入力する","ログイン成功"
"ユーザーがログインする","間違ったパスワードを入力する","エラーメッセージを表示"
"ユーザーがログインする","未登録のメールアドレスでログインする","エラーメッセージを表示"
"ユーザーがログインする","パスワードを空のままログインする","エラーメッセージを表示"
"商品をカートに追加する","商品をカートに追加する","カートに商品が追加される"
"商品をカートに追加する","在庫がない商品をカートに追加する","エラーメッセージを表示"
"商品をカートに追加する","同じ商品を複数回カートに追加する","カート内の数量が増加"
"商品をカートに追加する","カートに追加後、カートページを開く","商品情報が正しく表示される"
"決済を行う","クレジットカード情報を正しく入力する","決済が成功"
"決済を行う","クレジットカード情報を誤って入力する","エラーメッセージを表示"
"決済を行う","残高が不足しているプリペイドカードで決済する","エラーメッセージを表示"
"決済を行う","支払い方法を選択せずに進む","警告メッセージを表示"
"注文履歴を確認する","注文履歴ページにアクセスする","過去の注文情報が表示される"
"注文履歴を確認する","過去に注文がない状態でアクセスする","履歴がない旨のメッセージを表示"

② scikit-learnでCSVを読み込んでテストケースと期待結果を予測

「ユーザーがパスワードを変更する」という新しいユーザーストーリーに対して、どんなテストケースと期待結果が予測されるかを試してみました。

import pandas as pd
from sklearn.feature_extraction.text import TfidfVectorizer
from sklearn.neighbors import KNeighborsClassifier

# CSVファイルを読み込む
data = pd.read_csv("test_cases.csv")

# 学習データをリスト化
stories = data["ユーザーストーリー"].tolist()
test_cases = data["テストケース"].tolist()
expected_results = data["期待結果"].tolist()

# TF-IDFでユーザーストーリーを数値化
vectorizer = TfidfVectorizer()
X = vectorizer.fit_transform(stories)

# テストケース予測モデルを作成・学習
model_test = KNeighborsClassifier(n_neighbors=1)
model_test.fit(X, test_cases)

# 期待結果予測モデルを作成・学習
model_result = KNeighborsClassifier(n_neighbors=1)
model_result.fit(X, expected_results)

# 新しいユーザーストーリーを用意
new_story = ["ユーザーがパスワードを変更する"]
new_X = vectorizer.transform(new_story)

# 予測を実行
predicted_test_case = model_test.predict(new_X)
predicted_expected_result = model_result.predict(new_X)

# 結果を表示
print(f"予測されたテストケース→ {predicted_test_case[0]}")
print(f"予測された期待結果→ {predicted_expected_result[0]}")

実行結果

予測されたテストケース→ 正しいパスワードを入力する  
予測された期待結果→ ログイン成功

③考察

めちゃくちゃシンプルな類似度をもとにした分類でも、「パスワード変更」という新しいユーザーストーリーに対して、「ログイン」に関連するテストケースと期待結果の予測が引き出すことができました。
（十分なテストケースとは言えないけど）
こんなに少ないデータでも「それっぽい」テストのヒントを与えてくれるのは面白いです！ワクワクです！胸アツ！！

でも、もっと高精度な予測を行うためには、
・データの量と多様性を増やすこと
・自然言語処理（NLP）を活用した文脈理解
・テストケースと期待結果を一体として扱えること

などが今後の課題になるのかな？と感じました。

4. まとめ

今回のチャレンジを通じて、Python初心者でも以下のことができました🙌

・「入門Python3」で文法の基礎をちょっと理解
・Google ColabでPythonコードを実行
・scikit-learnで簡単な機械学習モデルを構築
・ユーザーストーリーからテストケースと期待結果を予測

今後は、

・より高性能なモデル（BERTは前後の文脈を読んで、単語の意味を理解しようとするらしい！すごい！）の使用
・LLMを使って、ゼロからテストケースを生成してみる
・自分専用のモデルをファインチューニングして育てる
・GUIをつけて、ツールっぽくしてみる
・自動生成されたテストケースを評価する仕組みをつくる

をやってみたい気持ちがあります。
でも難しそう。

最後まで読んでいただきありがとうございました！
機械学習なんもわからんnacoのゆるふわチャレンジはつづく……（かも？）

またね👍

いいなと思ったら応援しよう！

ログインまたは会員登録するとコメントできます。

QAエンジニアがテスト自動生成に興味をもってゆるふわチャレンジしてみた！第一弾

1. なぜ機械学習でテストを自動生成したいのか？

2. 使った書籍とツール＆最初に知っておいて良かったこと

①今回のチャレンジに使ったもの

②書籍「入門Python3」を使った学習

③Google Colabの使い方

④scikit-learn 基本的な使い方を知る

3. 胸アツ！実際にやってみた！「ユーザーストーリーからテストケース自動生成」

① ありそうなイマジナリーテストケースのデータを準備

② scikit-learnでCSVを読み込んでテストケースと期待結果を予測

③考察

4. まとめ

いいなと思ったら応援しよう！

コメント

ニューラルネットワークを動かしてみよう：Colabで初挑戦【2】

🚀【保存版】Pythonエンジニア必見！GWで始める機械学習入門ロードマップ

実験ノート：ChatGPT（無料版)で、データ分析(チャットセッションのみ)

【完全保存版】Google公式MLリソース×ChatGPT活用術──基礎から生成AI・安全性・プロジェクト化まで手を動かして学ぶ最速ロードマップ

機械学習を基礎から勉強1-2

Pythonで始める機械学習：Scikit-learnで最初のモデルを作ろう（Pythonで始める機械学習第三回）

Pythonで株の予測モデル作成(続きます)

本「Kaggle実験管理術」要点。概要と例

#78 Cursorで作成するポータブル統計解析アプリ（動作チェック）、チャレンジ AI×100業務（製造業）

#2. Generative AI Leader 試験完全攻略！非エンジニアでも合格できる！

100日後に生成AIエンジニアになる筋肉人事の学習録【7/100】

ITコンサルタントという肩書きの錆びついたエンジニアが100日でAIエンジニアに生まれ変わろうとする勉強ログ (Day1-7)

初学者の機械学習モデル紹介①

Colabで求人分析をしたい。

14週目：今更ながらKaggleに手を出して思い知った限界と挫折

生成AIパスポート試験 用語解説 - 新人エンジニア向け丁寧ガイド

【Python入門者向け】初心者がkaggle Titanicコンペに挑戦！〜挑戦日記４：アンサンブル編

【DMM学習記録④】独学では気づけなかった、Pythonの“入り口の設計”

専門学校183日目/5月9日(金)

非エンジニアでも簡単！Google ColabとPythonで始める業務自動化と転職エージェント

【楽天ROOM自動化シリーズ 第1巻】導入：自動化の魅力と環境構築のはじめの一歩

AIで開発してて気づいた“よくある失敗”とその対策（SESシステム開発3日目）

データ処理

kaggleをはじめる

【学習記録】Python基礎試験の勉強①

バラバラな表をデータベース形式へ自動変換【ChatGPT】

ChatGPTの試験学習資料にChatGPTを活用する

準備9割、コーディング1割。順番を間違えると心が折れる話

【ChatGPT PROユーザーへ】【実験】ChatGPT o3にo1 proっぽく回答してもらうプロンプトを考えてもらった【生成AI・AIArt】

8）「AIツールの活用と実践｜初心者でも使えるノーコードAIツールとはを受講してみた

光速PubMedサーチ step-by-step ～生成AIによる必要情報の網羅的抽出～

2. コード品質 ―― “動く” だけで満足しないための 3 点セット

アンケートの“読んで考える”作業、AIにおまかせ

AIに頼んでデータ分析できちゃうためのガイド――Cursor×RAPIDS NotebooksでVibe機械学習！！

機械学習とは何！？AI初学者の観点から解説！🚀

Kaggleメダル獲得への挑戦 Vol.2

生成AIパスポート試験用語解説 - 新人エンジニア向け丁寧ガイド

【楽天ROOM自動化シリーズ第1巻】導入：自動化の魅力と環境構築のはじめの一歩

【ChatGPT PROユーザーへ】【実験】ChatGPT　o3にo1 proっぽく回答してもらうプロンプトを考えてもらった【生成AI・AIArt】

光速PubMedサーチ step-by-step　～生成AIによる必要情報の網羅的抽出～