flowchart TD
    subgraph DAM [デプロイとモニタリング]
        MS[モデルの保持・提供]
        PM[モニタリング]
        CI[継続的な改善]
    end

    subgraph DAD [開発とデバッグ]
        TES[全てのステップを追跡]
        VP[プロンプトバージョン管理]
        TE[実験の追跡]
    end

    subgraph EAI [評価と改善]
        LJM[LLMの判定メトリクス]
        HF[人間によるフィードバック]
        CV[バージョン比較]
    end

    EAI --> DAD
    DAD --> EAI
    DAM -.-> DAD
    EAI --> DAM

なぜMLflow for GenAIを使うのか？
#

MLflow GenAIを使うことでAIアプリケーションの内部で起きていることを全て見ることができます。全てのLLM呼び出しやツール連携、意思決定ポイントを把握し、ブラックボックスなシステムを透明でデバッグ可能にします。

LangChain、LlamaIndex、OpenAIなどの15以上のフレームワークをサポートしています。

人間によるフィードバックも受け取ることができ、ドメインエキスパートによる実際の利用状況をアプリケーションに反映させることができます。

ビルドしてみよう
#

事前条件
#

以下を使えることを確認してください。

Python 3.9 or higher
MLflow 3+ installed (pip install –upgrade mlflow)
An MLflow tracking server (local or remote)

環境構築
#

今回は以下の手順で環境を作成しました。 pipenv の環境構築はchatGPTにきいてください 🙇

mlfowをインストールします

pipenv --python 3.12
pipenv install "mlflow>=3.1"

MLflowのサーバーを起動します
```
pipenv run mlflow server --host localhost --port 5001
```
:::message MACではポート5000がすでに使われているので、ポート5001を使っています。またデータ管理もファイルベースではなくPostgreSQLやDatabricksなどを使うことができます。 :::

fileベースのMFflow管理情報を作成します以下の内容で mlflow_setup.py を作成します。

import mlflow

# Creates local mlruns directory for experiments
mlflow.set_tracking_uri("http://localhost:5001")
mlflow.set_experiment("my-genai-experiment")

以下のコマンドを実行します。

pipenv run python mlflow_setup.py

MLflowに接続する以下の内容で mlflow_verify.py を作成します。

import mlflow

# Print connection information
print(f"MLflow Tracking URI: {mlflow.get_tracking_uri()}")
print(f"Active Experiment: {mlflow.get_experiment_by_name('my-genai-experiment')}")

# Set the active experiment
mlflow.set_experiment("my-genai-experiment")

# Test logging
with mlflow.start_run():
    mlflow.log_param("test_param", "test_value")
    print("✓ Successfully connected to MLflow!")

以下のコマンドを実行します。 ✓ Successfully connected to MLflow! が表示されたら成功です。

pipenv run python mlflow_verify.py

MLflow UIにアクセスする mlflowサーバーは起動済みなので、ブラウザで http://localhost:5001 にアクセスします。

MLflow UIが表示されたら成功です。

アプリの追跡情報を収集する
#

わずか数行のコードで、全てのプロンプト、モデル、ツールの呼び出しの包括的な追跡をする事ができます。以下を実施できます。

OpenAI, LangChain, and DSPy などの人気フレームワークの自動インストルメンテーションができます
カスタムの追跡情報をキャプチャできます
AIワークフローのデバッグができます

:::message 自動インストルメンテーション とは「フレームワークの動作を観察・分析するために情報を埋め込むこと」を指します。 :::

以下の記事でlocal llmの動作確認をしています。この仕組みを使ってlocal llmのインストルメンテーションをします。

LMStudioとLangChainでlocalチャットボットを作る

pipenv install streamlit langchain-openai

以下の内容で streamlit_app.py を作成します。

import mlflow
import streamlit as st
from langchain_openai import ChatOpenAI

st.title("🦜🔗 Quickstart App")

# Set the active experiment
mlflow.set_experiment("my-genai-experiment")


@mlflow.trace(name="llm_call", attributes={"model": "gemma-3-12b", "source": "local"})
def generate_response(input_text):
    llm = ChatOpenAI(
        base_url="http://localhost:1234/v1",
        api_key="not-needed",
        temperature=0.7,
        model_name="google/gemma-3-12b",
    )
    output = llm.invoke(input_text).content
    st.info(output)
    return output


with st.form("my_form"):
    text = st.text_area(
        "Enter text:",
        "What are the three key pieces of advice for learning how to code?",
    )
    submitted = st.form_submit_button("Submit")
    if submitted:
        generate_response(text)

以下の環境変数を設定します。

export MLFLOW_TRACKING_URI=http://localhost:5001

スクリプトを実行します。

pipenv run streamlit run ./streamlit_app.py

http://localhost:5001 の my-genai-experiment をクリック、Traces をクリックします。LLM の呼び出しが追跡されていることがわかります。

localのチャットレスポンスが返ると追跡の Status が OK になります。同時に mlartifacts というディレクトリが生成され、ここにログが保存されます。

Inputs/Outputs と @mlflow.traceで指定した name が設定され Attributes も表示されていて、LLMの呼び出しログを可視化することができました！

おわりに
#

MLflowで生成AIアプリのログを可視化することができました。公式のドキュメントではOpenAIをベースにした説明になっていたので、ローカルで動作確認するために少し手間取りました。また、MACで試す場合には5000番ポートがすでに使われているので、5001番ポートを使う必要があるのもポイントです。

次は可視化できた情報を評価について学んでいこうとおもいます。

Reply by Email

MLflowでローカルチャットボットのログを可視化する

はじめに
#

ゴール
#

環境
#

MLflowとは
#

MLflow for GenAI
#

GenAI クイックスタート
#

MLflow for GenAIを使ってみる
#

自身を持って製品環境で使えるGenAIを作る
#

なぜMLflow for GenAIを使うのか？
#

ビルドしてみよう
#

事前条件
#

環境構築
#

アプリの追跡情報を収集する
#

おわりに
#

関連記事

はじめに #

ゴール #

環境 #

MLflowとは #

MLflow for GenAI #

GenAI クイックスタート #

MLflow for GenAIを使ってみる #

自身を持って製品環境で使えるGenAIを作る #

なぜMLflow for GenAIを使うのか？ #

ビルドしてみよう #

事前条件 #

環境構築 #

アプリの追跡情報を収集する #

おわりに #

関連記事

はじめに
#

ゴール
#

環境
#

MLflowとは
#

MLflow for GenAI
#

GenAI クイックスタート
#

MLflow for GenAIを使ってみる
#

自身を持って製品環境で使えるGenAIを作る
#

なぜMLflow for GenAIを使うのか？
#

ビルドしてみよう
#

事前条件
#

環境構築
#

アプリの追跡情報を収集する
#

おわりに
#