概要

Difyのチャットボットタイプのアプリケーションにプリインストールされている複数モデルのデバッグ機能を使うと、同じ質問に対する異なるLLMの回答効果を同時に比較できます。この記事では、DeepSeek R1とo1を例に、Dify内でさまざまな大規模言語モデルの回答品質を直感的に比較する方法をご紹介します。

事前準備

  • Dify.AI クラウド版 / コミュニティ版
  • DeepSeek R1 API
  • OpenAI o1 API

クイックスタート

1. LLM APIキーの設定

テストを開始する前に、「右上」→「新しいプロバイダーを追加」 をクリックし、表示される指示に従って、複数のモデルのAPIキーを手動で追加してください。

2. アプリケーションの作成

チャットボットタイプのアプリケーションを作成し、アプリケーション名と説明を入力して作成を完了させます。

3. 大規模言語モデルの選択

アプリケーション右上の大規模言語モデル選択ページで、o1モデルを選択した後、「複数のモデルでデバッグ」 をタップし、deepseek-reasonerモデルを追加します。

4. 効果の比較

ダイアログボックスに質問を入力すると、入力した質問に対する各モデルの応答を同時に確認できます。

詳細や利用に関するご質問は、複数モデルのデバッグをご覧ください。