model-mash-release

Rating

Similar

Botright

agent-go-round

apps-skills

agno-docs

kanbania

Information

# ModelMash (模方) 使用指南 [![GitHub Downloads](https://img.shields.io/github/downloads/max-doo/model-mash-release/total)](https://github.com/max-doo/model-mash-release/releases) ## **为什么选择 ModelMash？** ModelMash 采用了独特的 **"原生聚合 + 智能总结"** 方案： ### 1. **完整保留原生体验（区别于 API 客户端）**：不同于仅调用 API 的工具，ModelMash 直接嵌入官方网页。这意味着你可以**无缝使用各家在网页版里内置的 Agent/工具能力与生态功能**，你使用的是“完全体”的 AI，而非“阉割版”的 API。例如： * **ChatGPT**: 直接使用 **Agent mode / Deep Research** 进行多步研究与网页操作，配合 **终端/代码执行**、**Canvas** 与 **GPTs/Actions** 完成端到端任务。 * **Claude**: 利用 **Artifacts** 做可编辑的代码/文档/前端预览，配合 **Projects** 的知识库式工作区与 **Computer Use** 的界面操作能力处理长流程工作。 * **Gemini**: 通过 **Deep Research + Canvas** 产出可编辑报告，结合 **Workspace 扩展** 读取/利用 Gmail、Drive、Docs/Sheets/Slides 等内容，并用 **Gems** 固化常用工作流。 * **Grok**: 原生集成 **实时 X + Web 搜索** 与 **工具调用**（如代码执行），在语音模式下可进行多模态交互与实时信息跟踪。 * **Perplexity**: 使用 **Pro Search** 做多轮检索与推理，输出带来源的研究结论，适合快速做“问题澄清 → 验证 → 归纳”。 * **通义千问**: 原生支持 **工具使用/Agent 交互**，并集成 **录音/音视频/文档** 场景能力，可直接在网页端完成 **AI PPT** 等生产力任务。 * **Kimi**: 以 **超长上下文** + **文件解析** 见长，并支持 **联网搜索/工具调用**，适合处理长文档、资料汇总与结构化输出。 * **豆包**: 覆盖 **实时语音**、多模态理解与 **工具调用/GUI 任务**，并提供 **3D 生成** 等创作类能力，适合多模态交互与任务执行。 * **腾讯元宝**: 直接使用其 **DeepSeek+ 深度思考** 能力，并可从 **微信公众号/视频号** 等腾讯生态信源检索信息，支持语音输入/通话与文件解析。 * **智谱清言**: 基于 GLM 系列模型，支持 **原生工具调用** 与 **AI 搜索工具**，并提供 **PPT/海报** 等应用级能力，适合“边搜边写边产出”。 * **文心一言**: 依托百度生态的 **搜索与插件/智能体平台**，支持多模态输入输出与工具增强，适合做“检索增强 + 任务型智能体”工作流。 ### 2. **Agent 总结系统（区别于普通聚合浏览器）**： ModelMash 引入了智能总结AI Agent 作为“裁判”。它能自动阅读所有窗口的回答，帮你**去伪存真、综合观点**，甚至进行**辩论分析**。通过多模型交叉验证与 Agent 深度总结，ModelMash 能有效减少幻觉，提供**比单一模型更客观、比普通聚合工具更深度**的分析能力，输出全面的总结报告。 ## ️ 核心优势与竞品对比 | 功能特性 | ModelMash (本产品) | ChatAll (齐叨) | ChatHub | | :--- | :--- | :--- | :--- | | **核心定义** | **Webview 聚合 + Agent 分析中心** | Webview 并发工具 | 浏览器插件/聚合器 | | **原生生态支持** | ** 100% 完整体验**
(支持 GPTs、Artifacts、绘图、联网等官方所有功能) | API调用 | API调用 | | **智能总结 Agent** | ** 深度集成**
(内置裁判、辩论、学术分析等 6 种模式，可自定义 Prompt) | 仅简单的并发显示，无二次分析能力 | 支持 | | **使用成本** | ** 极低**
(直接复用网页版账号，仅总结功能需少量 API) | 免费 | 收费 | | **文件上传能力** | ** 模拟拖拽**
(支持 PDF/图片/代码，通过 CDP 协议模拟真实操作) | 不支持 | ️ 不支持拖拽上传（通过API上传）| | **Deep Research** | ** 一键全开**
(智能识别并开启各家的深度思考/联网搜索模式) | 手动开启 | 手动开启 | | **数据隐私** | ** 100% 本地化**
(Cookie、历史记录均存储在本地设备) | 本地存储 | ️ 云端同步 | --- ## 1. 快速入门 ### 1.1 安装与启动 * **安装版**：下载 \`ModelMash Setup.exe\` 安装包，双击安装。数据存储在系统目录 (\`%APPDATA%\`)，适合固定设备使用。 * **便携版**：下载 \`ModelMash-Portable.zip\` 压缩包，解压到ModelMash-Portable即可使用。数据存储在程序目录内，适合放在 U 盘随身携带。 ### 1.2 首次运行的关键步骤 ModelMash 的核心原理是内嵌了多个“独立浏览器”窗口。 1. 启动软件后，你会看到多个空白的模型窗口。 2. **必须手动登录**：请在每个窗口中，像在普通浏览器里一样，登录你的账号。 3. **状态保持**：一旦登录成功，软件会记住你的登录状态（Cookie），下次打开无需重新登录。 4. **上网环境**：要使用海外的模型需要自备必要的上网环境。 --- ## 2. ️ 界面与核心交互 ### 2.1 布局概览 * **顶部栏**：每个模型窗口上方都有独立的控制条。 * *模型名称*：点击可切换该窗口显示的模型。 * *刷新/后退*：网页卡死或需要返回时使用。 * **中央工作区**：并排显示的模型窗口（Webview）。 * *窗口占比调整*：在多列布局下，可拖拽窗口之间的分隔线，实时调整相邻窗口宽度占比（悬停分隔线时鼠标会显示 ↔）。 * *窗口占比为临时状态*；在应用刷新/重载、切换窗口布局、或点击“重置占比”后会恢复为均分。 * **底部控制栏**：你的“指挥中心”。 * *统一输入框*：在此输入内容，会同步发送给所有模型。 * *发送按钮*：分两步操作（详见下文）。 * *布局切换*：支持 **单列 / 双列 / 三列 / 田字格 (四窗)** 视图。 * **侧边栏 (抽屉)**： * *左下角 Logo*：打开 **设置面板**。 * *左下角历史图标*：打开 **对话历史**。 * *右下角列表图标*：打开 **总结历史**。 * *右下角生成总结按钮*：打开 **AI 总结面板**。 ![主页面](docs/assets/main-page.png) --- ## 3. 高效对话工作流 ### 3.1 “两步走”发送机制为了防止误发，ModelMash 采用了独特的发送逻辑： 1. **第一步：输入与确认** * 在底部输入框输入问题。 * 按 \`Enter\` 或点击发送按钮。 * **效果**：文字会自动填入所有模型网页的输入框中，但**不会立即发送**。 * *优势*：你可以在发送前，对某个特定模型的输入进行微调（例如给 Claude 多加一句提示）。 2. **第二步：统一触发** * 再次点击底部的“发送”按钮（此时按钮图标会变化）。 * **效果**：所有模型同时开始回答。 ### 3.2 文件上传 (支持拖拽上传) 支持将图片、PDF、代码文件发送给所有模型。 * **操作**：直接将文件拖拽到底部输入框区域。 * **原理**：软件会模拟鼠标动作，将文件同时拖入所有 AI 的网页窗口中。 * **注意**：各模型对文件的支持度不同，请留意各窗口的上传状态反馈。 ### 3.3 灵活的显示模式 * **专注模式 (单列)**：在处理复杂代码或长文阅读时，切换到单列，获得最大视野。 * **对比模式 (2/3/4列)**：在验证事实或寻求创意时，开启多列，直观对比不同 AI 的回答。 --- ## 4. AI 智能总结与分析 (核心功能) 这是 ModelMash 的核心功能。它不仅能对比，还能请一个Agent来帮你读懂所有回答，最重要的是你可以自定义Agent提示词来适应不同使用场景。 ### 4.1 准备工作 (必做) 要使用此功能，你需要配置一个大模型供应商的 API（因为总结需要消耗 Token）。 1. 打开 **设置** -> **总结 Agent 配置**。 2. 添加一个供应商，详细列表请参考 [5.4 支持的 API 供应商]。 3. 输入 Base URL 和 API Key，点击“验证”。 ### 4.2 使用流程 1. **发起对话**：先在主界面问所有模型一个问题。 2. **等待回复**：等各家 AI 说完。 3. **开启总结**：点击右下角的 **“生成总结”** 图标，打开总结面板。 4. **配置任务**： * **选择素材**：勾选你觉得有价值的回答（默认全选）。 * **选择裁判**：在“使用模型”下拉框中，选一个负责总结的 AI，推荐文本生成能力强的模型，可参考[LM Arena](https://lmarena.ai/zh/leaderboard)上的模型排名。 * **选择模式**：点击底部的模式按钮（如下）。 5. **生成报告**：点击“开始分析”。 ### 4.3 六大预设模式详解 ModelMash 内置了专业的提示词模板： 1. ** 综合最佳**：融合各家之长，给出一个最完美的标准答案。 2. **️ 裁判找茬**：专门挑刺。它会指出哪个模型在胡说八道，哪个模型逻辑有漏洞。 3. ** 学术分析**：以严谨的学术口吻，评估来源、方法论和证据强度。 4. ** 创意发散**：不寻求标准答案，而是基于现有回答，通过头脑风暴延伸出新点子。 5. **️ 辩论对决**：把不同模型的回答看作辩手，进行评分和胜负裁决。 6. **️ 实践指南**：忽略理论，直接提取可执行的操作步骤（Step-by-step）。 --- ## 5. ️ 高级配置与个性化 ### 5.1 模型管理与排序你可以决定谁坐在“C位”。 * **排序**：在设置中，按住模型卡片前的“把手”图标，**拖拽**即可调整顺序。排在第一位的模型会默认出现在最左侧，在主页面更改模型显示顺序会同步修改排序。 * **同步模型**：如果你添加了新的 API 供应商，点击“同步/配置”按钮，可以自动拉取该供应商下的所有新模型列表。 ### 5.2 自定义 Agent (高阶玩法) 觉得预设的 6 种模式不够用？你可以创造自己的 Agent。 1. 在设置中找到 **Agent 提示词**。 2. 点击 **新增**。 3. **编写 Prompt**：例如，你可以写一个“代码审查员”模式，提示词为：“你是一个资深架构师，请忽略所有非代码内容，只对比各模型给出的代码方案，指出潜在的内存泄漏风险和性能瓶颈...”。 4. 保存后，总结面板里就会多出一个选项。 ### 5.3 Deep Research (深度研究) 在底部控制栏有一个 **Deep Research** 按钮。 * **功能**：一键激活以下 Web 应用的研究/联网模式：ChatGPT、Perplexity、Gemini、Grok、通义千问、豆包、智谱清言。 * **不支持**：Claude、Kimi、腾讯元宝、文心一言（仍可在网页内手动开启）。 * **原理**：通过 DOM 操作自动点击网页上的特定开关。 ### 5.4 支持的 API 供应商 ModelMash 支持所有兼容 OpenAI API 格式的供应商。**免费 Token：注册阿里百炼，智谱可免费领取试用Token** #### 国际供应商 | 供应商 | Base URL | 特性支持 | |--------|----------|---------| | **OpenAI** | \`https://api.openai.com/v1\` | 标准 API
o1/o3 推理模型 | | **Anthropic Claude** | 通过代理 | ️ 需要 OpenAI 兼容代理 | | **Google Gemini** | \`https://generativelanguage.googleapis.com/v1beta/openai\` | 思考内容（thinking_config）
Gemini 3 系列 | | **OpenRouter** | \`https://openrouter.ai/api/v1\` | 多模型聚合
思考内容支持 | | **Together AI** | \`https://api.together.xyz/v1\` | 开源模型托管 | #### 国内供应商 | 供应商 | Base URL | 特性支持 | |--------|----------|---------| | **阿里云百炼** | \`https://dashscope.aliyuncs.com/compatible-mode/v1\` | Qwen 系列
混合思考模式（enable_thinking） | | **DeepSeek** | \`https://api.deepseek.com/v1\` | DeepSeek-V3
DeepSeek-R1 推理模型 | | **硅基流动** | \`https://api.siliconflow.cn/v1\` | 多模型支持
思考内容支持 | | **智谱 AI** | \`https://open.bigmodel.cn/api/paas/v4\` | ️ 需要适配层 | | **月之暗面** | 通过代理 | ️ 需要 OpenAI 兼容代理 | #### 思考内容支持部分模型支持推理过程可视化（Reasoning/Thinking），ModelMash 会自动识别并适配，可在点击总结页面的设置按钮️在参数面板中开启思考模式即可让模型返回思考内容。 --- ## 6. 数据管理与导出 ### 6.1 历史记录 * **对话历史**：保存了你和多个模型聊天的上下文。点击历史记录，可以恢复当时的输入内容。 * **总结历史**：保存了 AI 生成的Markdown 报告。 * **URL 追踪**：软件会尝试记录对话发生时的网页链接（如 Gemini 的会话链接），在历史记录中点击可直接跳转回当时的网页现场。 ### 6.2 导出报告生成的总结报告支持导出为 **Markdown (.md)** 文件。 * 在设置中，可以指定默认的 **导出目录**。 * 导出的文件不仅包含总结结果，还包含原始的对话内容，是极佳的知识库素材。 --- ## 7. 常见问题排查 * **Q: 为什么点击发送后，只有输入框填了字，没自动发出去？** * A: 这是设计特性。请**再次点击**发送按钮。如果第二次点击仍无效，可能是该网站改版了 UI，导致 DOM 选择器失效。请等待软件更新。 * **Q: 总结功能提示 "API Key 无效"？** * A: 请检查设置中的 Base URL 是否正确。例如 OpenAI 的官方地址通常是 \`https://api.openai.com/v1\`，有些中转商的地址结尾不需要 \`/v1\`，请仔细核对供应商文档。 * **Q: 窗口显示空白或加载不出网页？** * A: 检查你的网络环境。部分 AI 平台（如 Google, GPT）需要特殊的网络环境才能访问。ModelMash 自身不提供代理服务，使用的是你系统的网络环境。如果网络没有问题，请尝试点击刷新按钮，或按住Ctrl+R强制刷新应用 * **Q: 如何清空所有数据重置软件？** * A: 删除 \`%APPDATA%/modelmash\` (Windows) 或 \`~/Library/Application Support/modelmash\` (macOS) 文件夹即可。 --- > **希望这份指南能帮助你将 ModelMash 变成你最得力的 AI 助手！如有更多问题或建议，欢迎提交留言反馈！** ![问卷二维码](docs/assets/qrcode.png)

Prompts

Reviews

Write Your Review

Detailed Ratings

ALL

Correctness

Helpfulness

Interesting

Upload Pictures and Videos

Name

Size

Type

Download

Last Modified

Community

Add Discussion

Upload Pictures and Videos

Chatbot close

Bot
Hi there
How can I help you today?

Send