【翻訳】リテンションカーブ:ユーザーリテンションの最適な測定方法(Justin Butlion, projectBI)

www.projectbi.net

リテンション・カーブは、プロダクトの粘着性を測定するのに有効なビジュアライゼーションです。この記事では、リテンションカーブの作成方法、読み方、そしてビジュアライゼーションを構築する際によくある落とし穴を回避する方法をお教えします。

リテンションカーブとは?

リテンションカーブとは、あるディメンション(通常はユーザー/アカウント)の平均リテンションを、ある一定期間にわたって表したビジュアライゼーションです。

以下は、ある仮想的なビジネスのリテンションカーブを示すグラフィックです。

image by projectBI

このリテンションカーブの例では、サインアップ後の最初の6週間の週間リテンションを示しています。ゼロの時点では全員が含まれているため、100%となっています。このパーセンテージは、ユーザーがプロダクトを使用しなくなるにつれて、自然に下がっていきます。

3週間後には、ユーザーの50%しか残っていないことに注目してください。この減少は劇的だと思われるかもしれませんが、ほとんどのビジネスでは、ごく一部のユーザーしか定着していません。

4週間後には40%のユーザーが残りますが、その後、線は平坦になります。これは、一部のユーザーにとって、サービスが長期的に利用されるほど価値のあるものであることを示すもので、非常に重要なポイントです。

リテンションカーブを作成するには?

リテンション・カーブを作成するためには、まず、対象となる期間のリテンション・レートを計算する必要があります。

つまり、あなたのビジネスにとって最適なリテンション測定方法を決定する必要があります。私が使っている経験則では、週単位のリテンションですが、これは予想されるユーザーの行動に大きく依存します。アプリケーションによっては、ユーザーが月に1回サービスを利用すれば十分です。そのような場合は、週次よりも月次リテンションの方が良いでしょう。

また、私は、すべてをX日間のウィンドウで計算することをお勧めします。もし、週次リテンションにするのであれば、データセットを7日で割って正規化します。例えば、ウィークリーリテンションを採用する場合、ビジュアライゼーションのデータポイント「1」は、サインアップから「7日以内」であることを表します。「2」は、サインアップから7日以上14日以内を表します。これは、ユーザーはいつでもサービスを利用することができ、1週間のうち同じ日に全員がサインアップするわけではないので、重要なポイントです。

リテンション・レートについては、こちらのブログ記事で紹介しています:リテンション・レートとは?定義、ガイド、FAQ

典型的なリテンションテーブルは、以下の表のようなものです。

image by projectBI

この例では、7つの異なる週のコホートについて、6週間のリテンションが表示されています。この表は、ユーザーの絶対数を示しています。

次のステップは、この表を操作して、全体に対するパーセンテージを表示することです。

image by projectBI

緑色でハイライトした行は、7つの行(ユーザー・コーホート)すべての各列の平均値です。この平均がリテンションカーブとなります。

上の表から折れ線グラフに変換するには、ユーザー作成週ごとにグループ化せず、各列が行になるようにピボットするだけで、すぐにデータセットにすることができます。

リテンションカーブを作成する際にアナリストが犯しがちなミス

ピボットしてリテンションカーブを作成できるリテンションデータセットを構築することは困難です。以下に、このような分析に取り組む際に犯しがちな間違いを列挙します。

正しいユーザー集団を選択しない

リテンションカーブは、ユーザーのサブセット(部分集合、下位集合)のリテンションを表します。このため、どのユーザーのサブセットを分析に選ぶかについて、選択的である必要があります。

まず、サービスに参加したのがかなり前であり、リテンションに十分な時間があったユーザーだけを選択する必要があります。

例を挙げてみましょう。

ユーザーのライフサイクルの最初の12週間の週間保持率を示す保持曲線を作成するとします。

3週間前にサインアップしたユーザーは、12週間のうち3週間しかリテンションされる機会がありませんでした。このようなユーザーをデータセットに含めてはいけません。

上記の例では、12週間以上前にサインアップしたユーザーのみを含める必要があります。

このよくある間違いを考えるもう一つの方法は、リテンションテーブルに空白が現れるようなデータセットを使用しないことです。

image by projectBI

上記の例では、空白があります。たとえ平均値が同じでも、これではユーザーリテンションを明確に表すことはできません。リテンションカーブの初期のデータポイントには多くのデータポイントがあり、後期のデータポイントにはかなり少ないデータポイントがあります。

「完全な」データセットのみを使用してリテンションカーブを作成することの欠点は、十分なデータが揃うまで待つ必要があることです。リテンションカーブが長くなればなるほど、過去に遡る必要があります。

プロダクト、マーケティング、価格設定が最近変更され、リテンション・カーブが大きく変化している可能性があるため、現在の現実を誤って表現してしまう可能性があります。ほとんどの物事がそうであるように、ギブアンドテイクがあります。

アカウントを削除したユーザーを削除し忘れる

かなり前にサインアップしたユーザーだけを含めるだけでは不十分で、チェックする期間内にアカウントを削除したユーザーを削除する必要があります。あるユーザーは、リテンションをチェックしたい12週間より前にサインアップしていたかもしれませんが、おそらく6週目にアカウントを削除したのでしょう。

このような例では、そのユーザーは6週目から12週目の間、実際に保持される機会がなかったことになります。

要するに、すべてのユーザーがリテンションテーブルのすべてのセルに表示されるチャンスが均等にある、きれいなデータセットが必要なのです。

ブレンドビューとコーホートビュー

従来のリテンション・カーブはブレンド・ビューでした。これは、曲線がユーザーの集合を表していることを意味します。リテンションカーブのデータセットには、非常に多くのユーザーが含まれている可能性があります。

しかし、アナリストである以上、より深く掘り下げる必要があります。

この点を強調するために、ある例を見てみましょう。

例えば、登録から24時間以内に特定の機能を2回以上使用したユーザーのリテンションカーブと、ブレンドされたリテンションカーブを比較することにしたとします。この機能は、ユーザーにサービスの価値を伝える上で非常に大きな影響力を持つという仮説があるからです。

image by projectBI

驚いたことに、リテンションカーブが大きくシフトしていることに気づきました。基準を満たしたユーザーは、長期的に保持される可能性が約2倍高くなり(40%に対し78%で平坦化)、混合コホートより1週間早く平坦化しました。

リテンションカーブの可視化で変化を示すもう一つの一般的な方法は、同じ可視化で複数のコホートを表示することです。

image by projectBI

上記のビジュアライゼーションでは、それぞれが異なるサインアップ週を表す複数のカーブを見ることができます。よく見ると、直近の線が他の線より高くなっていることに気づきます。これは、ライフサイクルの最初の6週間でユーザーを維持する能力が向上していることを示しています。

リテンションカーブに関する私の最終的な考え

リテンションカーブの可視化は、すべてのB2BおよびB2Cオンラインビジネスにとって重要なビジュアライゼーションです。

リテンションカーブは、ビジネスがPMFに達している、あるいは達していないという点を明確にするのに役立つ、数少ないビジュアライゼーションです。

リテンション・カーブは、構築するのが難しいビジュアライゼーションです。この可視化を構築する際には、避けなければならない落とし穴がいくつかあります。

この記事では、これらの落とし穴のいくつかと、それを回避する方法を説明しましたが、お役に立てたでしょうか。