2018-01-02

オオカミ少年　ベイズ更新（理論の手書き）

年末にちょっと触れたオオカミ少年の考え方にちょっとふれてみた。

okandayo.hatenablog.com

シミュレーションすると、わかりやすい。

でも、全部手書きｗ

便図をつかって表現

f:id:okandayo:20180102114501j:plain

f:id:okandayo:20180102114512j:plain

ベイズの定理をつかってみる

f:id:okandayo:20180102114533j:plain

f:id:okandayo:20180102114539j:plain

シミュレーションするとこうなる

f:id:okandayo:20180102114554j:plain

次回は本当にscarabつかってやってみようかな。

2017-12-31

ベイズ統計、小並感導入編

このエントリは、以下の本を参考に書きました。

「岩波データサイエンス vol1」

https://www.amazon.co.jp/岩波データサイエンス-Vol-1-岩波データサイエンス刊行委員会/dp/4000298518

わかりやすくて、薄くて内容の濃いとてもいい本です♪

今回は、数式は書かずに導入だけ触れることにします。

自分の頭の整理のために・・・。

ベイズ統計とほかの統計の大きな違い

簡単に言うと、下のようなイメージになる。

ベイズ統計・・・・仮定が多い
普通の統計学・・・頻度主義の統計学

ベイズ統計は、データだけではなくてデータの背後にある要素も確率的に生成されると仮定する。

オオカミ少年

ベイズ統計を理解するのによく使われる例は、

「オオカミ少年」の事例でしょうか。

少年が嘘つきである
少年が正直者である

上記を「仮定」の条件にして、次に起こりうることを推定する。

嘘つきならば、次に本当のことを言う確率や、うそをつく確率などを用いて求める。

これを考えると、「人狼」というゲームがありますが、データを取得していけば、予測できそうですね～。

結局、一般化すると、

「母数の事前分布」＋「検査データ」　⇒　「母数の事後分布」

ということになります。

予告

2018/2/17に、川崎でベイズ統計の勉強会をひらこうかなと思っております。

ご興味のある方は、connpass立てますので、ぜひご検討くださいませ♪

では、よいお年を～。

2017-12-30

2017 振り返り（NaITE＆ちょっと個人）

もう２０１７年もあと1日と半分。

はやいなぁ、と・・・。

NaITEのスタッフになってから2年がたとうとしています。はやいなぁ。

ということで、個人的に振り返ります！

年間振り返り

今年は、勉強会を7回も開いていました。２か月に1回のペースで企画していたのですが、なんだかんだで7回。スタッフも頑張っています！

NaITEは、AgileJapan長崎サテライトや、秋～冬にかけて長崎QDGという大きなイベントも開催しています。

主査の池田さんをはじめ、スタッフのしょーごさん、くまきちさん、つのだくん、ふじさわくん、まつやまくん、てしまくん、うじたくんと皆でがんばっています。

みんな、それぞれの想いを持って活動をしています。

仲もよいけど、礼節もきちんとしている。そんな仲間と出会えてよかったです。

個人的にも、数学勉強会を開いていくことにしました。

ただ数式を追いかけるだけだとただの苦行にしかならない。どうすれば数学を楽しめるかな？これは何に使われているんだろう？どうつながっているんだろう？

そんな目線から、いろいろとご紹介していけるといいなぁとおもっています。

一緒に勉強したい方、声をかけてくださいね！

2017年1月

2017/1/21　NaITE#19 「数学を学ぼう～数学の知識を利用したソフトウェアテスト～」勉強会

数学のパート。ただ、数式を展開するだけの勉強会ではなく、何に使うのか、どういう場面で何（数式・考え方）が使えるのか、というアプローチでの勉強会を開催しました。

naite.swquality.jp

2017年2月

JaSST TOKYO　2017　で、コミュニティブースをだしました！

こういう試み初めてでした。NaITEを多くの人に知ってもらえる機会を得ることができて、本当に感謝です。

JaSSTソフトウェアテストシンポジウム-JaSST'17 Tokyo

ちなみに、ここで事例発表を行いました！（自社の事例発表です）

「品質予測モデルの構築およびプロジェクト管理への適用事例」

2017年4月

2017年4月8日　NaITE#20「プロセスモデル CMMI にまつわるちょっと深イイ話」　勉強会

CMMIというプロセス参照モデルのご紹介をしました。

プロセス参照モデルを使うには、道具（CMMI）を知っている必要があり、詳細を中村こーじくんが紹介してくれました。そして、そのプロセス参照モデルを組織でちゃんとまわしていくためにはどうするか？という視点でのご紹介もさせていただいております。

naite.swquality.jp

2017年4月22日　NaITE#21「PSP概説&体験ワーク（おかわり）」　勉強会

メトリクスのすべての親となるフレームワーク、PSP。

これをしっているかしらないか、で、業務の改善度は格段に違うと思います。

その内容のご紹介を、くまきちさんがしてくれています。

naite.swquality.jp

2017年5月

2017年5月20日　NaITE#22「はじめてのバグ票システム～導入実践ガイド」　勉強会

ソフトウエア開発にかかわる人は、バグとはきっても切り離せない。そんな情報を取り扱うためには、何が大切なの？バグ票ってなんのためにあるの？といったところからも、バグ票システム導入実践ガイドご紹介しています。

この回には、細川さんが来てくださいました！

医療とソフトの近さを感じるご講演をいただきました。

naite.swquality.jp

2017年7月

2017年7月16日　NaITE#23　「Scrum入門＆Agile Japan 2017 長崎サテライト参加報告」　勉強会

アジャイルしばりの勉強会。AgileJapanの参加報告と、Scrumとは？について、きんじさんにご紹介いただきました！

naite.swquality.jp

2017年9月

2017年9月17日　NaITE#24 「テストカタマリー　ワークショップ＆解説」勉強会

テストカタマリーのワークショップを、みずのりさん、くっきーさんに開催していただきました。

テスト設計時にモデリングをして、テストをする人・開発をする人・顧客の視点などからの気がかりなところもそのモデルに関連付けておけば、なんでそのテストをしたの？というところの根拠にもなるなぁと個人的には思っております。

naite.swquality.jp

2017年11月

2017年11月11日　NaITE#25「欠陥モデリングワークショップ＆解説」　勉強会

森りゅうじさんに、欠陥モデリングのワークショップをしていただきました。

5月に開催いたバグ票とあわせて、バグの内容をモデリングして抽象化すると組織の資産としてかなり有用性の高いものになるので、両方をしっておくとすごくいいなぁと思います。

naite.swquality.jp

来年に向けて

来年は　1/20にNaITE#26、2/2に長崎QDGを開催予定しています。

ぜひぜひご参加下さい！

来年もどうぞよろしくお願いいたします。

2017-12-25

ワークプロダクトレビューの技術とプロセス～レビュー技術・事例と標準化最新動向の紹介～

2ヶ月ほどまえに参加したセミナーについて、ブログってみました。

有料だったのでどうかなと思ったのですが、にしさんから許可（？）もらったので、掲載しちゃいます。

www.ipsj.or.jp

所感

非常に費用対効果が高いセミナーでした。こんなセミナー、もうないんじゃないかなぁと思うほどの満足度の高さです。ありがとうございました。

森崎さんの講演で、「チェックリストは「やり方が」書かれていない。どうやってそれを確認するのか？が書かれていない。」というお話がありました。

社内でも、「ツール」を使った、そのツールが＊＊です、という報告はあるが「どう使われたのか、使った目的は何か」というところに触れられていないことがあるのとリンクするなぁと思いました。手段・方法は、プロセス・目的と一緒にセットで情報を持っていないと意味がない。そう思いました。

細谷さんの講演では、グランドルールありき、チームビルディングありきの改善かもしれない、とおしゃっられていたことが印象的でした。

個人ではなくチームでルールを作り、自分たちで決めたことは守る、ということを厳しく貫いているところがおおきな成功要因なんだなぁ、と思います。

パネルディスカッションを見ることが一番の目的でした。ここだけで、もう本1冊分の価値があったのではないかなぁと思うような内容でした。「レビュー」と「テスト」って、似て非なるもの。そこを痛感するパネルでした。

開催概要

タイトル：ワークプロダクトレビューの技術とプロセス　~レビュー技術・事例と標準化最新動向の紹介~
日時: 2017年 10月18日(水) 13:15～18:00
会場: 機械振興会館地下3階研修1号室
概要：

ソフトウェアの品質向上のため、要件定義書や設計書などワークプロダクトのレビューは重要です。2017年2月にISO/IEC 20246:2017 (ワークプロダクトレビュー)がレビュー技術やプロセスを定義する国際標準として発行されました。
　本セミナーでは、このISO/IEC 20246:2017発行を機会に、レビュー技術や事例、また標準化最新動向を紹介・解説します。まず、レビューの技術やプロセスについて一般的なものから最新情報など、また、産業界での適用事例を紹介します。さらに、ISO/IEC 20246:2017の解説を行います。最後に、パネルディスカッションを行い、レビュー技術の事例や国際標準の意見交換を行います。

●ソフトウェアプロダクトレビューの基礎と研究動向（森崎さん（名古屋大学））

ソフトウェアプロダクトレビューは実行可能なプログラムが存在しない時点でも実施できる欠陥検出技法です。本講演では、ソフトウェアプロダクトレビューの基礎と研究動向を紹介します。ソフトウェアプロダクトレビューの基礎として、目的、参加者の役割、欠陥の検出例を示し、ソフトウェアプロダクトレビューの原理を理解いただきます。次に、検出した欠陥を早期に修正することによって得られる欠陥の修正コストや欠陥の見逃しリスクの低減といった効果を解説します。最後に、これまで研究分野で議論されてきたソフトウェアプロダクトレビューの技法や技術を紹介した上で、近年注目を浴びているModern Code ReviewやArchitecture Tradeoff Analysis Methodを紹介します。

レビューは、ソースコードがない状態でも欠陥を検出できる。
だれがやっても同じようにできる必要がある。レビューは準備が大事。
レビューは、「どのような条件がそろうと、達成されるとやった意味がある、と思われるか」を考えよう。
テストの場合は、あまり属人性があると聞いたことがないけど、レビューは人のスキルに依存することが非常に多い。
レビューで、特殊なタイミングや競合、バッファオーバフローやセキュリティなどはレビュー時点で検出したほうが良い。⇒　病気と一緒
チェックリストは「やり方が」書かれていない。どうやってそれを確認するのか？が書かれていない。
モダンコードレビューというものがグーグルで行われている。
目的は協調であり、欠陥検出ではない。ペアプログラミングの代替手段となっている。

●狙いの明確化によるレビュー改善事例（細谷さん（三菱電機（株）））

ソフトウェア開発において、ドキュメントやコードのレビューは、品質向上のために重要な活動ですが、開発現場では、レビューに投入したコストに見合った効果が得られている実感がないという課題がありました。そこで、レビューで検出したい欠陥を明確化し狙いに合わせたレビューの実施時期、実施方法を定めることにより、開発現場が効果を実感できるレビューに改善しました。本セッションでは、レビュー観点の分類、レビュー技法の使い分け、実施シナリオなど改善活動の中で定めた実施方法について紹介します。

産学連携して行ったカイゼンで、Melcoグループ内のガイドラインとして作成した内容を紹介。
レビュー技法は使い分ける。
序盤は、例えば運用シナリオ、ユースケースなど、多く記述しそうなものであれば、最初でやり方・書き方の合意をレビュー内で行う。
残りのものに水平展開する。後半は工数を削減することができる。
中盤は、重要と思われる機能の部分など、ピンポイントで見るべきものに絞ってレビューを行っていく。
レビュー観点とレビューの仕方を関連付ける。
4象限で観点を明確化することは効果がある。
プロジェクト内で合意を得ながら実施する。
ナレッジメンバーを任命。ナレッジメンバー＝レビューの有識者。
有識者だからといって、レビューができるとは限らないので教育をする。教育の中には、演習も入っている。
いくつかシナリオを用意して、人格攻撃をしない、とかディスカッションを交えた教育を行っている。
グランドルールありきの改善かもしれない。チームビルディングありき。

●パネルディスカッション「レビュー技術の研究と活用」

パネラー：森崎さん（森）/増田さん（増）/細谷さん（細）/西さん（西）

１．V&V　V字の左側でもやるべきだということが言われているが、妥当性確認について　どう考えているのか？レビューで妥当性確認ができるか？どうやればいいのか？

森：最後に言われても困るので、途中でいうことに意味がある。スクリプトテスト・探索的テストに代わるものがレビューにもあると思っている。終盤にいわれても直せない、ということになってしまう。どのタイミングでどういう指摘を行っていくか、をレビュー計画で合意することは大事。 ⇒細谷さんの事例に重なる
細：事前にレビューしてほしい観点を渡してレビューしてもらったりした。
増：ただしくつくったか？つくったものはただしかったか？を確認するのがV&V。正しく作っているか？というところにたいして、定義しているのが20246である。つくったものはただしいか？という観点でのチェックまでは言及していない。
西：V&Vは時代遅れ。妥当性確認としてどういう観点で確認したらいいかを分解しておいて、テストでは何を確認すればいいのか、を合意していくべきである。

２．オフショア・ニアショア　品質確保（検証）の良いやり方を教えてほしい。

森：共同研究内容。発注工程の前工程でのQ&A（＝ドメイン知識）の内容に着目する。前提知識が同じになっているかどうかでわかってくる。受注側からの質問の質で受注側のスキルを測るとよい。実績も大事。技術力がない受注側をレビューで何とかするのはむり。発注先を変える勇気も必要。ドメイン知識と技術両方ないとうまくいかない。オープンクエスチョンで聞いてくる人は、ちょっと危ない。YES/NOで聞いてくるところは安心できるかも。
細：契約の序盤でレビューしたりする仕組みを入れないと難しいと思う。そういうことを盛り込めるような契約にしていくべきだと思う。ワークショップ的なものを一緒にやる。ユースケース的なものを一緒に作ったりして、やり方を教えたりしている。内部品質に着目するのであれば、機能設計を一緒にやるとかを考えないといけない。
増：レビューのトレーニングとしてレビューを捉えることも大事。有効な手段。ツールで効率化するなども、選択肢の一つである。国際標準規格は、受注側の技術力が低い場合にも、「こうやるとうまくいくよね」というものを想定して作られている。重量級の国際標準は発注側の視点で考え方や技術などが細々と書かれているので有用である。

３．再現性・・・属人性排除、次回も同じようにできる、などについて

増：できる。そのために規格を作成している。再現性があるのか、品質があがるのか、という条件に関しては、組織それぞれでの前提条件などがあるとおもうので、それを文書化していくとよい。
細：属人性の排除。レビューの仕方はやり方があるので、できる。役割の設定、レビュー技法も取り入れられるはず。その人たちの能力の範囲でできると思う。能力の質の属人性は別の話。組織としてのいいところは狙えるけど、ひとのスキルに依存するばらつきは排除できないと思う。「組織のスキルの限度において」よい仕事ができる。
森：着眼点が一緒、属人性の排除。前提条件の抜けが認識できていなければ無理。　結果を予測できるようなものになるというのも、属人性の排除には重要。技術力が低いのであれば、「ないものねだりをしない」のが大事。

文化、マインド・・・の話：

森：素質、再現性、プロセスを定義する、マインドの話・スキルの話。マインドがあるけどスキルがないからうまくいかない、スキルがあるけどマインドが低いからうまくいかない・・四象限的。
細：細かく繰り返すというのに重要視している。どこを目的としていて、どう改善していくか、が大事と思っている。　　
増：F2Fでやったほうが効率が高いと聞いて、実行している。すべてがトップダウンで行っているわけではなく、プロジェクトのアウトプットが高まる行為であればOK。ツールであろうが、マインドにかかわる話であろうが、上記の効果が期待できるものであれば実施する。

４．レビュー文化：個人主義の国（欧米とか）・組織・エンジニアは、レビューのような皆のための仕事はしないので、枠や型が必要なのではないか？

森：レビューを手伝った人は人事評価をよくするなどの仕組み的対処が必要。レビューで後ろから打たれるような状況を作ってはいけない。
増：自分が書いた試験に自分で回答して自分で丸付けして100点というのは本当かどうかわからないから、確認が必要。欧米ではテスト専門の職業などがあるけど、日本ではなかなか受け入れられない。　　　
西：組織の方針と仕組みは国とか個人の考えをオーバーライドするので、そういうマネジメントをしてしまっているだけなので、マネジメントの怠慢だと思います。

　　　⇒森：レビューは社風が出る。けん制しあって向上するという文化とか。文化が異なる同士のレビューはそれぞれ違和感を感じるだろう。

５．改善内容の適用スコープは、全プロジェクトに共通というわけではないとは思う。レビューの目的やプロダクトの特性などによって改善内容を変えるべきか？レビュー設計はしているのか？

細：変えているが、全プロジェクトに適用しているものもある。（インスペクションに有識者を入れるというのは100％）。レビュー設計としては、目的・観点を決めるなどのレビュー計画は行っている。
森：細かいレビュー設計は、細かくすればするほど形骸化しやすい。コストが下がらなくなる。
増：チェックリストはどうやってつくるの？⇒過去の障害を一般化する一般化抽象化して、全プロジェクトに適用、とか。

６．国際規格などを隠れ蓑にして形式的に仕事に文句をいうひとにはどう対応すべきか

細：内部品質に対する意識を組織的に共通にしていくとかに使う。レビューのタイプで使い分けましょう。
森：バディチェックで回避できる。
増：標準は厳密に従うものではない。良いところどりをすればよい。特に20246は意識を高めてやっていこうというもの。

７．この30年間でレビューは何が変わったのか？一言で。

増：ほとんど変わっていない。ソフトウエアの複雑度・テクノロジーが高度になっているので、相対的には変わっていない。
細：若い人に「変わっていない」ということが伝わっていない。若い人は、「はじめてききました」という。それを伝えていく手段として、標準化された規格は使えると思う。
森：本質は変わっていないが、対象範囲が広くなり、考え方もいろいろ出てきている。反復型の開発が一般敵になってくると、レビューの役割も変わるだろう。未熟な自分を理解していこう。
西：テストも同じ状況だった。この先、おカネや技術が流入してきたら、変わると思う。

以上！

2017-12-21

バグの妥当な検出率？〜IPAのデータ白書と信頼区間とR〜

ソフトウェアテスト　アドベントカレンダー　12/21担当のあさこです。

qiita.com

はじめに

テスト実施時には、バグが想定通り（？）に出ているかどうかのメトリクス分析を行う方は多いと思います。

割と、そこでベンチマークとして使われるのが、IPAから発行されているデータ白書。

参考：SEC BOOKS：ソフトウェア開発データ白書2016-2017：IPA 独立行政法人情報処理推進機構

ここで多く使われているのが、二つのメトリクス（変数）を散布図で表し、回帰分析結果とその信頼区間（５０％、９５％）を算出したグラフです。

多くの企業が協力しているデータなので、ベンチマークには最適です。

以下例です。

f:id:okandayo:20171221060150p:plain

出典：https://sec.ipa.go.jp/files/secbooks/000057880.pdf

自社にて、部門間ベンチマークを行う際にも同じようにできるといいですよね。

Excelで分析のできるツールがIPAで公開されており、サイトからダウンロードできますが、ツール内でどんなことをやっているか、気になりませんか？

内容を一部ご紹介します。

ぜひ、自社のデータでも試していただけると幸いです。

基本のおさらい

メトリクスを取得する目的と、メトリクスの間の関係式を微分方程式で示すことを簡単にまとめたブログです。

okandayo.hatenablog.com

IPAのデータ白書で散布図を用いて分析・表現されているものには、いろいろなものがあります。

基本的には以下のメトリクスが挙げられます。

工数
工期
製造量（SLOC実績値）
累積不具合検出率

これらそれぞれの数値同志の相関をみて、その相関係数にて、上記ブログ内にある４つのタイプからその現象を説明する式を選択します。

今回ご紹介しようとする例は、

累積不具合検出率
製造量（SLOC実績値）

を使って考えていきましょう。

考え方

対象の二つのメトリクスの関係性をみる
1で求めた関係性を使用して回帰分析を行い、近似式を求める
2で求めた近似式をもとに、信頼区間式を求める

１．対象の二つのメトリクスの関係性をみる

「基本のおさらい」で取り上げました内容に従い、メトリクス同士がどの微分方程式の関係性の時が相関が高いかを見ます。

自社のデータをもとに試したときは、以下の４タイプのうち、４のものが多かったので、それをとりあげます。

f:id:okandayo:20171221042927p:plain

２．1で求めた関係性を使用して回帰分析を行い、近似式を求める

回帰分析して求めた結果を使用する。

近似式の求め方は、Excelだとこんな感じ。中に書かれている値は、例です。

f:id:okandayo:20171221050120p:plain

３．2で求めた近似式をもとに、信頼区間式を求める

数式で説明すると、こんな感じ。

f:id:okandayo:20171221051410p:plain

Rでやってみた

回帰分析を行い、近似式を求める
1で求めた近似式をもとに、信頼区間式を求める

0.　準備

# ①データの読み込み
WhitePaper.data <- read.csv("testdata.csv", header=T)
head(WhitePaper.data) #読み込んだデータを確認
LIN <- WhitePaper.data$Line
TH <- WhitePaper.data$TotalBug

#②散布図のプロット

plot(log10(LIN),log10(TH)) # 生産量（LIN）と総工数（TH）

#③回帰分析

# lm関数に、説明変数をLIN、被説明変数をTHとして代入

result <- lm(log10(TH) ~ log10(LIN))

1.　回帰分析を行い、近似式を求める

# 分析結果の要約
summary(result)
abline(result) # 回帰直線を描く

#④対数スケール（回帰直線）⇒もとのスケール（回帰曲線）にもどしてグラフを描く（データを重ねがき）　#####
##summary(result) の結果から係数をもってくる。
#　回帰分析の結果 log10(y) = 2.4615 + (0.8331)*log10(x) より

x <- 0.01*c(0:7000)
prediction <- 10^(2.4615)*x^(0.8331)
plot(x, prediction , col=2,type="l", xlim=c(0,70), ylim=c(0,11000),
xlab="", ylab="", main="")
par(new=TRUE)
plot(LIN, TH, col=4, xlim=c(0,70), ylim=c(0,11000),
xlab="LIN", ylab="TH", main="")

2.　1で求めた近似式をもとに、信頼区間式を求める

###### 信頼区間
alp2 <- 0.05 # 有意水準alp/2 ⇒　信頼係数1-alp ⇒　95%信頼区間のとき　alp=1-0.95

# 95% のとき　alp2 <- 0.025
# 90% のとき　alp2 <- 0.05
# 50% のとき　alp2 <- 0.25

n <- length(LIN) # データ数
bar_log <- sum(log10(LIN))/n
y_hat <- 10^(2.4615)*LIN^(0.8331)

# 残差分散の平方根
s <- sqrt( 1/(n-2)*sum*1^2) )

### 信頼区間の計算
C <- sqrt( 1/n+(log10(x)-bar_log)^2/sum((log10(LIN)-bar_log)^2) )

K <- 0.8331*log10(x)+2.4615 + qt(1-alp2,n-2)*s*C
confidence_U <- 10^K

K <- 0.8331*log10(x)+2.4615 - qt(1-alp2,n-2)*s*C
confidence_L <- 10^K

plot(x, confidence_U, col=3,type="l", xlim=c(0,70), ylim=c(0,11000),
xlab="", ylab="", main="")
par(new=TRUE)

plot(x, confidence_L , col=3,type="l", xlim=c(0,70), ylim=c(0,11000),
xlab="", ylab="", main="")
par(new=TRUE)

結果

信頼区間95%の時と、50％の場合を両方求めてプロットしました。

f:id:okandayo:20171221052909p:plain

いろいろとアレなので、メモリの数字などはとっぱらてありますｗ

さいごに

メトリクスは扱いを間違えるとアカンことになります。

我々の仕事で言えば、コンポーネントテストで見つかった不具合とシステムテストで見つかった不具合の件数を足したり、それらを合わせて使ってソフトウェア信頼度成長曲線を描くひとはいまだに多いですよ。
— あきやま🍻 (@akiyama924) 2017年12月20日

②について、例えば因数分解の問題で係数が違うだけとかなら、平均を取る意味はあると思います（教え方を変えた結果を測るなど）。
そうではなく、因数分解と確率計算の問題なら、それは①と同じく平均を取って比較するのは間違いだと思います。
— あきやま🍻 (@akiyama924) 2017年12月20日

取得方法が同一で、同じ単位。
そういうものが同じ土俵で比較することができる、という原理に基づくなら、やっぱり違うテストレベルのバグ件数は足し合わせないほうがいいんだろうなあ。
ノイズとかそんな話ではないからなあ。
— あさこ (@acha_821) 2017年12月20日

たまたま、この記事を書く前日にこんな感じのやり取りをしたので、参考までに。。

数値データの裏の背景などのにも目を向けて取得してつかわなきゃ～とおもいました。

ここまでお付き合いくださり、ありがとうございました！

*1:log10(TH)-log10(y_hat

2017-12-17

メトリクスの示す現象論　～取得する目的とそのメトリクスとの関係～　

メトリクスの示す現象論

メトリクスは、何かをおこなったときの効果を定量的に測るツールになるので、「必ず」取得するための目的があります。

そして、その目的を支配する法則があるのではと私は考えています。

その法則を見出すには、微分方程式から入るのが一番簡単だと思います。

微分方程式

現象が説明変数xと被説明変数yで記述できると仮定します。

簡単にするために、2次元で考えます。

yとxの微分方程式では、その間にある変化量を見ることができます。

なので、データは、以下の3つの微分方程式で表すことができます。

f:id:okandayo:20171215224829j:plain

それぞれの微分方程式を解くと、右の式になります。

基本形なので、すべてがこれというわけではなく、派生形も存在するということは付け加えさせていただきます。

副次的効果？

現象が数式で表せるということにより、以下のような嬉しいこと（笑）もできるようになります。

数式から、統計的論理的に背景を検証することができる
標本数が少ない場合には、この論理に従ってランダム関数などを使用して増やす（？）ことができる
モデル化されているので、メトリクス層別の判断基準の一つになる

参考資料

生産性と品質データの解析手法

生産性と品質データの解析手法についての提案紹介 from Asako Yanuki

www.slideshare.net

2017-12-10

テスト対象のリスク度分析（素敵なメトリクス）

ソフトウェアテストの小ネタ 12/10担当のあさこです。

qiita.com

小ネタなので、すぐにできそうなところからご紹介♪

テスト対象のリスク度分析の一例を二つほど、ご紹介します。

ソースコードメトリクスを利用します。

ソースコードメトリクス

ソースコードメトリクスは、いろいろなツールで取得可能です。

その中から、一つ目のご紹介。

皆さんも使われている方も多いと思いますが、

サイクロマティック複雑度

を使用したテスト対象のリスク分析です。

すごく簡単。

一般的に、15を超えると保守性が低い傾向があるといわれており、バグが潜みやすい傾向にあるようです。

なので、以下のような策をとられるとよいかもしれません。

その際にはもちろん言うまでもありませんが、意味があって複雑度が高くなっているのか、それともコードを書いた人のスキルなのか、なども合わせて考慮する必要があります。

複雑度が高いコードのコードレビューにはスキルの高い人を割り当てる
複雑度を下げることができるように設計を見直す（リファクタリングをする）
ヒートマップなどで、どの関数が複雑度が高いかをみて、IntegTestに厚みを持たせる

すぐにできることなので、参考になさっていただけると嬉しいです。

二つ目のご紹介。

以下のメトリクスを利用。

Essential：単純な条件構造（単純な if-else, while, do-while など）を、単一のステートメントで置き換えた制御グラフにおいて計測した複雑度
FanIn：関数に対する入力の数
FanOut：関数に対する出力の数

これは、Understandというツール

ソースコード解析ツール Understand | ソフトウェア品質保証 | テクマトリックス株式会社

www.techmatrix.co.jp

から取得することができます。

Essential、Fanin・Fanout（二つのメトリクスを掛け合わせた値）このふたつをx,y軸に取り、散布図を描きます。

このメトリクスのプロットの意味するところは、もう想像がつくと思いますが、関数が複雑なうえに入出力値まで多ければ・・・そうです。ご想像の通りです。。。

ということで、判断基準としては、

Essentialの値が10以上、Fanin・Fanoutが400以上で囲まれる範囲を高リスクゾーンとし、集中的にテストを行う。

ということを一つの事例として紹介させていただきます。

以下のスライドの15ページ目でも、ご紹介しています。

めとりくすおたく from Asako Yanuki

www.slideshare.net

少しでもプロダクトの性質・特性を把握できれば、メトリクスの値と一緒に分析して品質を作りこんでいくことが楽になるかもしれません。

このサイトにも、ソースコードメトリクスを利用した分析の事例が掲載されています。

understand-jp.blogspot.jp

番外編

アーキテクチャメトリクス

このメトリクスを取得できるツールは、有償無償だと、私が知っているところでは以下のものがあります。

有償：Lattix　（テクマトリックス社取り扱いソフトウエア）

無償：ccfinder（32ビット版しかないかも・・・）

取得できるメトリクスはかなりたくさんあります。

また別の機会に、このメトリクスを利用した事例をご紹介したいと思います。

便図をつかって表現

ベイズの定理をつかってみる

シミュレーションするとこうなる

ベイズ統計とほかの統計の大きな違い

予告

年間振り返り

2017年1月

2017年2月

2017年4月

2017年5月

2017年7月

2017年9月

2017年11月

来年に向けて

所感

開催概要

●ソフトウェアプロダクトレビューの基礎と研究動向（森崎さん（名古屋大学））

●狙いの明確化によるレビュー改善事例（細谷さん（三菱電機（株）））

●パネルディスカッション「レビュー技術の研究と活用」

１．V&V V字の左側でもやるべきだということが言われているが、妥当性確認について どう考えているのか？レビューで妥当性確認ができるか？どうやればいいのか？

２．オフショア・ニアショア 品質確保（検証）の良いやり方を教えてほしい。

３．再現性・・・属人性排除、次回も同じようにできる、などについて

文化、マインド・・・の話：

４．レビュー文化：個人主義の国（欧米とか）・組織・エンジニアは、レビューのような皆のための仕事はしないので、枠や型が必要なのではないか？

５．改善内容の適用スコープは、全プロジェクトに共通というわけではないとは思う。レビューの目的やプロダクトの特性などによって改善内容を変えるべきか？レビュー設計はしているのか？

６．国際規格などを隠れ蓑にして形式的に仕事に文句をいうひとにはどう対応すべきか

７．この30年間でレビューは何が変わったのか？一言で。

はじめに

基本のおさらい

考え方

１．対象の二つのメトリクスの関係性をみる

２．1で求めた関係性を使用して回帰分析を行い、近似式を求める

３．2で求めた近似式をもとに、信頼区間式を求める

Rでやってみた

0. 準備

1. 回帰分析を行い、近似式を求める

2. 1で求めた近似式をもとに、信頼区間式を求める

結果

さいごに

メトリクスの示す現象論

副次的効果？

参考資料

生産性と品質データの解析手法

ソースコードメトリクス

サイクロマティック複雑度

番外編

アーキテクチャメトリクス

Enjoy your Testing life♪

１．V&V　V字の左側でもやるべきだということが言われているが、妥当性確認について　どう考えているのか？レビューで妥当性確認ができるか？どうやればいいのか？

２．オフショア・ニアショア　品質確保（検証）の良いやり方を教えてほしい。

0.　準備

1.　回帰分析を行い、近似式を求める

2.　1で求めた近似式をもとに、信頼区間式を求める