Is Claude Token Saver free?

Yes, Claude Token Saver is free to use.

How do I install Claude Token Saver?

Claude Token Saver is a local plugin. Install it using npm package: claude-token-saver-mcp and add the generated configuration snippet to your AI app's MCP config file. Then restart your AI app.

What AI apps work with Claude Token Saver?

Claude Token Saver uses the Model Context Protocol (MCP) and works with any MCP-compatible AI app, including Claude, ChatGPT / Codex, Gemini, Copilot, Cursor, and more.

Back to Browse

Claude Token Saver MCP Server

by BlackFoil

Developer ToolsModerate5.3MCP RegistryLocal

Free

Server data from the Official MCP Registry

MCP server that offloads routine coding tasks to local LLM (Ollama) to save Claude API tokens

About

MCP server that offloads routine coding tasks to local LLM (Ollama) to save Claude API tokens

Security Report

5.3

Moderate5.3Moderate Risk

Valid MCP server (1 strong, 1 medium validity signals). 5 known CVEs in dependencies (1 critical, 2 high severity) Package registry verified. Imported from the Official MCP Registry.

4 files analyzed · 6 issues found

Security scores are indicators to help you make informed decisions, not guarantees. Always review permissions before connecting any MCP server.

How to Install

Add this to your MCP configuration file:

{
  "mcpServers": {
    "io-github-blackfoil-claude-token-saver-mcp": {
      "args": [
        "-y",
        "claude-token-saver-mcp"
      ],
      "command": "npx"
    }
  }
}

Documentation

View on GitHub

From the project's GitHub README.

English | 日本語

claude-token-saver-mcp

Beta — 個人利用向け。736 テスト / カバレッジ 97%。

Claude Code の「それ、ローカルでよくない？」を自動化する MCP サーバー。

ボイラープレート生成、テスト作成、テキスト要約 — Cloud API に投げるまでもない定型タスクを、手元の Ollama でさばきます。セキュリティ対策込み。

モチベーション

Claude Code の API 利用を分析してみたら、リクエストの約 40% は定型的なコード生成やテキスト処理でした。この手のタスクは 7B クラスのローカルモデルでも実用的な品質が出ます。「推論は Cloud、作業は Local」— この振り分けを MCP で自動化したのがこのツールです。

ローカル LLM はどこまで来たか

ローカル LLM の進化は速いです。2024 年の Llama 3 から 2025 年の Qwen3 まで、わずか 1 年でコード生成ベンチマーク (HumanEval) のスコアは 60% → 85% に跳ね上がりました。

この調子なら、Agent ワークフローにローカル LLM が当たり前に組み込まれる日もそう遠くないでしょう。claude-token-saver-mcp は Cloud と Local を使い分けるための土台を提供します。

しくみ

MCP (Model Context Protocol) は Claude Code が外部ツールを呼び出すための標準プロトコルです。このサーバーを登録すると、Claude Code がタスクの内容を見て、定型的な処理を自動的にローカル LLM へ回します。

Claude Code ──MCP──▶ token-saver ──HTTP──▶ Ollama (ローカル)
     │                                         │
     │  「定型タスクだ → ローカルに振ろう」        │
     │                                         │
     └─── 高度な推論・設計判断は Cloud で継続 ───┘

Ollama が落ちていたり応答が遅い場合は Cloud API にフォールバック可能です。

30 秒セットアップ

前提: Node.js 20+ と Ollama がインストール済みであること。

0. Ollama を起動

ollama serve

1. プロジェクトルートに .mcp.json を作成

{
  "mcpServers": {
    "token-saver": { "command": "npx", "args": ["-y", "claude-token-saver-mcp"] }
  }
}

2. Claude Code を起動して、こう頼む

コーディング用にローカルLLMをセットアップして

RAM に応じた最適モデルが推奨 → ダウンロード（約 4GB）→ プリロードまで自動で走ります。

3. 動作確認

TypeScript で配列をシャッフルする関数を書いて

「ローカルLLM（qwen2.5-coder:…）で生成しました」のようにローカルモデル名が表示されれば OK。出ない場合は ollama list でモデルを確認し、トラブルシューティングを参照してください。

git clone https://github.com/BlackFoil/claude-token-saver-mcp.git
cd claude-token-saver-mcp
npm ci && npm run build

プロジェクトルートの .mcp.json に追加：

{
  "mcpServers": {
    "token-saver": {
      "command": "node",
      "args": ["/path/to/claude-token-saver-mcp/dist/server.js"]
    }
  }
}

特徴

ローカル完結 — 定型タスクは Cloud API を使わずに処理できる
自動モデル選択 — RAM を検出して最適なモデルを推奨・DL・プリロード（auto_setup）
セキュリティ内蔵 — プロンプトインジェクション検知 + 出力サニタイズ
コスト可視化 — 節約額をリアルタイムで追跡（定型タスク比率 40% なら月 $50〜80 程度の削減が目安）
Cloud フォールバック — Ollama が落ちても Cloud に自動切り替え可能

使用例

あなた: 「ソート関数を書いて」    → offload_work がローカルで生成     💰 $0.02 節約
あなた: 「このログを要約して」    → compress_context がローカルで圧縮  💰 $0.05 節約
あなた: 「コスト節約を見せて」    → cost_dashboard: 累計 $47.89 節約
あなた: 「3つのAPIを一括実装して」 → batch_offload: 3 タスクを順次処理

ローカル品質の実際

ローカル 7B モデルの出力は Claude に及びません。それは前提です。ただ、定型タスクに限れば十分実用的です。

タスク	ローカル品質	向き不向き
ボイラープレート生成	★★★★☆	✅ 得意
ユニットテスト作成	★★★★☆	✅ 得意
テキスト要約	★★★★☆	✅ 得意
単純なリファクタリング	★★★☆☆	✅ 実用的
アーキテクチャ設計	★★☆☆☆	❌ Cloud に任せるべき
複雑なデバッグ	★★☆☆☆	❌ Cloud に任せるべき

Claude Code がタスクの複雑さを判断して自動で振り分けます。ローカルの品質が足りなければ Cloud で処理されます。

自動ティアリング

RAM	Tier	モデル	DL サイズ
< 16 GB	Light	phi4:latest	~2.5 GB
16–48 GB	Standard	qwen2.5-coder:7b	~4.7 GB
> 48 GB	Ultra	qwen2.5-coder:32b	~18 GB

ツール一覧

ツール	説明
`offload_work`	コード生成・リファクタリングをローカルで実行
`compress_context`	長大なテキストをローカルで要約
`auto_setup`	最適モデルの推奨 → DL → プリロードをワンステップで
`batch_offload`	複数タスクを一括投入（順次 / 並列）
`cost_dashboard`	累計節約額・モデル使用統計

ツール	説明
`get_metrics`	サーバーメトリクス（JSON / Prometheus）
`recommend_model`	タスクカテゴリ別の最適モデル推奨
`pull_model`	Ollama モデルのダウンロード
`preload_model`	VRAM へのプリロード
`list_loaded_models`	ロード中モデルの一覧
`configure_model_selector`	モデルセレクターのランタイム設定

セキュリティ

ローカル LLM への入出力を自動で保護します。

プロンプトインジェクション検知 — 5 カテゴリ・20 パターンで悪意ある入力をブロック
出力サニタイズ — API キー・パスワード・JWT など 11 パターンを [REDACTED] に置換
データプライバシー — 全処理がローカル完結。外部への送信なし

ドキュメント


クイックスタート	5 分で始める
ユースケース集	具体的な活用例
設定リファレンス	全設定項目
FAQ	よくある質問
トラブルシューティング	エラー対応

アーキテクチャ

src/
├── server.ts          # MCP エントリポイント（11 ツール登録）
├── tools/             # offload_work, compress_context, auto_setup, batch_offload 等
├── ollama/            # Ollama クライアント & マルチノードロードバランサー
├── queue/             # FIFO キュー & 優先度キュー（URGENT/HIGH/NORMAL/LOW）
├── model-selector/    # モデル推奨エンジン, ベンチマーク DB, 実行トラッカー
├── validators/        # 入力バリデーション & プロンプトインジェクション検知
├── cost/              # コスト計算 & レポーター
├── metrics/           # Prometheus メトリクス収集
├── persistence/       # ExecutionTracker / BenchmarkStore のファイル永続化
├── config/            # Zod 設定スキーマ & ローダー
├── tiering/           # RAM ベースの自動ティアリング
├── logging/           # 構造化ログヘルパー
└── errors.ts          # CTS-XXXX エラー体系

開発

npm ci
npm test             # 736 テスト（カバレッジ 97%）
npm run typecheck    # 型チェック
npm run lint         # ESLint
npm run build        # プロダクションビルド

対応プラットフォーム: macOS / Linux / Windows（Ollama が動く環境）

コントリビューション歓迎です → CONTRIBUTING.md

ライセンス

Apache License 2.0

Reviews

No reviews yet

Be the first to review this server!

More Developer Tools MCP Servers

Git

Free

by Modelcontextprotocol · Developer Tools

Read, search, and manipulate Git repositories programmatically

Toleno

Free

by Toleno · Developer Tools

Toleno Network MCP Server — Manage your Toleno mining account with Claude AI using natural language.

mcp-creator-python

Free

by mcp-marketplace · Developer Tools

Create, build, and publish Python MCP servers to PyPI — conversationally.

MarkItDown

Free

by Microsoft · Content & Media

Convert files (PDF, Word, Excel, images, audio) to Markdown for LLM consumption

mcp-creator-typescript

Free

by mcp-marketplace · Developer Tools

Scaffold, build, and publish TypeScript MCP servers to npm — conversationally

FinAgent

Free

by mcp-marketplace · Finance

Free stock data and market news for any MCP-compatible AI assistant.

Claude Token Saver MCP Server

About

Security Report

Findings (6)Action required

How to Install

Documentation

claude-token-saver-mcp

モチベーション

ローカル LLM はどこまで来たか

しくみ

30 秒セットアップ

特徴

使用例

ローカル品質の実際

自動ティアリング

ツール一覧

セキュリティ

ドキュメント

アーキテクチャ

開発

ライセンス

Reviews

No reviews yet

More Developer Tools MCP Servers

Git

Toleno

mcp-creator-python

MarkItDown

mcp-creator-typescript

FinAgent

Claude Token Saver MCP Server

About

Security Report

Findings (6)Action required

How to Install

Documentation

claude-token-saver-mcp

モチベーション

ローカル LLM はどこまで来たか

しくみ

30 秒セットアップ

特徴

使用例

ローカル品質の実際

自動ティアリング

ツール一覧

セキュリティ

ドキュメント

アーキテクチャ

開発

ライセンス

Reviews

No reviews yet

More Developer Tools MCP Servers

Git

Toleno

mcp-creator-python

MarkItDown

mcp-creator-typescript

FinAgent