【翻訳】UXデザイナーが理解すべき「プロンプト」の仕組み(Paz Perez, UX Collective)

uxdesign.cc

機械が発明されて以来、人間と機械はコミュニケーションに苦労してきました。

LLMの出現により、プロンプトはこのギャップを埋める方法となり、事前に訓練されたAIモデルに私たちの要求を理解するために必要なコンテキストと指示を提供するようになりました。UXプラクティショナーとしての私たちの役割は、人間と機械が最終的にお互いを理解できるように、この会話を促進することです。

UXという学問分野は、グラフィカル・インターフェースの台頭とともに登場し、大衆がコードを書かずにコンピュータと対話できるソリューションを提供しました。私たちは、デスクトップ、ゴミ箱、保存アイコンの概念を導入し、ユーザーのメンタルモデルにマッチさせようとしました。

トランスフォーマーアーキテクチャによるAIモデルのスーパーチャージは、人間と機械のインタラクションに革命をもたらし、自然言語を使って機械とコミュニケーションすることを可能にしました。このシフトはデザインの風景を根本的に変え、部分的に純粋なグラフィカル・インタラクションから遠ざかり、デザイナーとしてどこに力を注ぐべきかを見直す必要があります。

メンタル・シフト

コマンドベースのデザイン時代に生きていた私たちは、複雑なユーザーの問題を分解することに主眼を置いていました。私たちはカスタマージャーニーをマッピングし、各ステップを決定論的なフローに綿密に定義しました。

しかし、AIの台頭により、私たちの課題は、最適なアウトプットを生成するために適切なコンテキストをモデルに提供し、反応を評価して反復することにシフトしています。

複雑性をエッジにシフト

人であれ機械であれ、効果的なコミュニケーションは文脈に左右されます。店に入って、環境そのものが対話の舞台を設定し、販売員に話しかけて特定の商品について尋ねます。もしあなたが自分のニーズを明確に説明できなければ、販売員は無関係な商品を提供するかもしれません。

同じことがAIモデルにも当てはまります。AIモデルには明確な指示、文脈、境界線が必要です。ユーザーがプロンプトでこれらの情報をすべて提供することを期待しても、これらのモデルが広く採用されることはないでしょう。

UXプラクティショナーとして、私たちには重要な役割があります。私たちは、ユーザーエクスペリエンス全体を形成し、AIとのインタラクションをより効果的で直感的なものにするために、あるものはユーザーと向き合い、あるものは舞台裏で、戦略的にコンテキストを統合することができます。

プロンプトの技術

デザイナーとして、以下の分野のプロンプトを作ることを考えてみましょう:

  1. インターフェイスのプロンプト: 会話のきっかけを提供したり、フォローアップを提案したり、あるいは文脈に応じたチップで再度プロンプトを出す自動的な方法を提供することもできます。
    プロンプト付きサジェストチップ - Perplexity
  2. システムプロンプティング: ユーザーからは見えないように、モデルが特定の方向に「舵を取る」のを助けるプロンプトを提供できます。安全性、声のトーン、製品や会社の知識に基づく全体的なガイダンスなどを指示します。この領域は、デザイナーが遊びながら体験を形作ることができる重要なスペースです。*1

    [Claudeのシステム・プロンプトのオリジナル・ツイート]。

  3. レーニングデータの促進: UXは、モデルのトレーニングを支援するか、事前にトレーニングされたモデルの微調整を支援するために存在する必要があります。

  4. データセットの質は、モデルがより良いパフォーマンスを発揮するために非常に重要であるため、潜在的なバイアスや倫理的な問題、あるいは矛盾する情報が存在する可能性がある場所を理解することが重要です。

  5. また、(ゴールデン)プロンプトを使ってデータベースを作成し、特定のスキルのモデルをトレーニングすることもできます。UXは、データセットの意図と、それらがどのように作成され、キュレーションされ、特定のユースケースと整合されるかを考える必要があります。

チームが独自のモデルを構築したり、オープンソースのものを使用していない場合、データセットに広範囲にアクセスできない可能性が高いでしょう。しかし、システムプロンプトやユーザーインターフェイスを作成する上で、デザイン作業はまだたくさんあります。チームと協力して、ユーザーの目標に沿った事前学習済みモデルを選択し、そのモデルを反復しながら素晴らしいユーザーエクスペリエンスをデザインすることに集中しましょう。

プロンプトエンジニアは需要が高く、AIモデルのトレーニングや複雑なシステムプロンプトの開発において重要な役割を担っています。しかし、アレックス・クラインが言うように、「プロンプトの洗練は、ユーザーを深く理解すること、つまりこの体験に対するユーザーの態度や行動を理解すること、そしてその知識をプロンプトに統合することから生まれます」。このレベルの洞察は、私たちの分野の専門知識から生まれるものであり、知識を広げ続けることが私たちの責任なのです。

コンテキストウィンドウの理解

この新しいデザイン状況においてデザイナーが把握すべき重要な概念は、コンテキスト・ウィンドウです。これは、モデルがアウトプットを生成するために処理できる情報のことです。会話型インターフェースでは、モデルが記憶できる会話の量と考えてください。

あなたがユーザーとして入力するすべてのプロンプトが、その会話の中でのあなたの経験を形作ります。しかし、企業は、コンテキスト・ウィンドウ(ユーザーからは見えない部分)を活用して、情報、原則、追加のプロンプトを追加することもできます。これにより、アウトプットの方向性を決定し、企業の価値観との整合性を確保しながら、ユーザーの意図を満たすことができます。このコンテキストウィンドウの隠れた部分に、システムプロンプトを配置します。

コンテキストウィンドウの図

トークンで測定されるコンテキスト・ウィンドウは、時間に拘束されません。1ヶ月後に同じ会話ウィンドウに戻ったとしても、トークンの制限内に収まっている限り、モデルは以前のすべてのやり取りを処理します。

業界は無限のコンテキストウィンドウ(Geminiのバージョンは現在200万トークン)へと移行しており、モデルはあなたが共有したすべての過去の会話、アイデア、データを記憶することができます。このシフトは、私たちがuxerとして対処しなければならない新しい一連の課題をもたらすでしょう。

プロンプティングへの取り組み方

プロンプティングは非常に反復的なプロセスであり、プロンプトを作成し、それをモデルに与えて見返りを確認します。しかし、より良い結果を得るために使えるテクニックはたくさんあります。

覚えておくべきものをいくつか挙げます:

  • フレームワークを使うこと: これは情報を構造化し、プロンプトに文脈を与えるのに役立ちます。RACE:役割: モデルが採用している役割を特定する/行動: どのような行動が必要かを詳しく説明 / Context: 状況:状況に関連する詳細を提供 / 期待: 期待される結果。
  • 例を挙げましょう: 例を示すことで、何をどのように生成するかについてモデルに文脈を与えています。生成されたレスポンスがどのように見えるべきかを示します。このテクニックは、フューショットと呼ばれますほとんどの人は、例を示さず、単純な命令だけのプロンプトを使用します。
  • モデルに理由を尋ねましょう: 答えをゆっくり説明し、答えを導き出すまでのステップを説明してもらうと、より良いアウトプットができます。私たちはこれを思考の連鎖と呼んでいます。これを数発のプロンプトと組み合わせることで、回答の前に推論を必要とするような複雑なタスクで、さらに良い結果を得ることができます。最近OpenAI'sは、複雑な推論のための強化学習を使用した新しい言語モデル、o1を発表しました。これは、回答する前に「考え」、より良い回答を生成するために内部的な思考の連鎖を生成します。
  • やってはいけないことを明確に: 間違った回答の明確な例を含め、何を避けるべきかについて明確なガイドラインを提供することで、モデルはより意図に沿った出力を生成することができます。

これらのテクニックのいずれか、またはすべてを、いつでもプロンプトに使用できます。一般的に、ユーザーとしてAIモデルにアプローチする場合は、直接的で簡潔なプロンプトを提供します。しかし、システムのプロンプトに取り組む場合は、指示やガイドラインのような、より広範なプロンプトを意味します。AIに配慮した指導者の例をご覧ください:*2

[Anthropicからの例]

整理整頓

プロンプトは、チームメンバーが相反する情報や質の低い指示を追加することで、すぐに混乱してしまいます。プロンプトの効果を最大化するためには、チームは統一されたアプローチで協力する必要があります。そのためには、プロンプトを通じて特定のスキルを磨くことに重点を置くか、システムプロンプトに会社の価値観を埋め込むかを決める必要があります。どちらか一方、または両方が真実である可能性もありますが、その背景には戦略が必要です。

システムのプロンプトに関する文書化は、特に大規模なチームの場合、重複した取り組みや、幻覚を引き起こす可能性のある情報の衝突を防ぐために重要です。

プロンプトの実験により、選択したAIモデルの限界が明らかになることもあります。AIを使った作業は非常に反復的であるため、いくつかの解決策を検討する必要があります:

  1. システム・プロンプティング:システムのプロンプトを改良して、制限を緩和します。
  2. 微調整: エンジニアと協力してモデルをカスタマイズします。
  3. 免責事項: 潜在的な制限を前もってユーザーに知らせます。
  4. モデルの置き換え: 必要に応じて、より適切なモデルを選択します。

プロンプトをマスターする最善の方法は、実際にやってみることです。お気に入りのAIアシスタントを使い始めるか、パーソナライズされたGPTを作成するか、GeminiのGEMSを探求してください。プロンプトライブラリを使用し、さまざまなテクニックを探求し、自分とは異なるコンテキストを持つかもしれない他の人と共有することができます。

今後の展望

私たちの業界は急速に進化しており、UXは大きな変革期を迎えています。多くの企業、特に小規模の企業は、プロンプトモデルにUXの専門知識をまだ活用していません。また、この新しい分野におけるUXの複雑さと重要性を過小評価しているために、十分なリソースを割り当てていないケースもあります。

「我々はツールを形成し、それ以降はツールが我々を形成する」 - John Culkin

UXをシェーピング・モデルに取り込む責任は、会社の人員よりも大きい。これは、人間とコンピュータの相互作用の進化における決定的な瞬間であり、次世代を形作るものです。

プロンプトを開始し、Stay Foolishであり続けましょう。

参考文献

*1:Claudeの知識ベースは2023年8月に最後の更新が行われました。そのため、2023年8月以前および以降の出来事については、2023年8月時点の高度に情報を持った人物が、その日付の誰かと話しているかのように答えます。そして、必要に応じてその点をユーザーに知らせることができます。/ 単純な質問には簡潔な回答を、より複雑でオープンエンドな質問には詳しい回答を提供します。/ 多くの人々が持つ意見の表明を伴うタスクを求められた場合、Claudeはその意見に個人的に同意しなくてもタスクを支援します。ただし、その後で幅広い視点についての議論を追加します。/ Claudeはステレオタイプには関与しません。これは、多数派グループに対するネガティブなステレオタイプも含まれます。/ 論争の的となるトピックについて質問された場合、Claudeは有害な内容を軽視することなく、また両方の側に合理的な視点があると暗に示すことなく、慎重な考えと客観的な情報を提供するよう努めます。/ 執筆、分析、質問への回答、数学、コーディングなど、さまざまなタスクに喜んで対応します。また、コーディングにはMarkdownを使用します。/ この情報は、ユーザーの質問に直接関連する場合を除き、アシスタント自身については言及しません。

*2:システム: あなたは、マインドフルネスとストレス管理の専門知識を持つAIアシスタントです。ユーザーがストレスを軽減し、自己認識を高め、内面の平穏を育むために、さまざまなマインドフルネスのエクササイズやテクニックを案内するのがあなたの役割です。明確な指示や説明を提供し、ユーザーの実践を支えるための励ましを行ってください。/ ユーザー: 最近とてもストレスを感じていて、リラックスするためにマインドフルネスのエクササイズを試してみたいです。簡単な瞑想の方法を教えてもらえますか?