X

model-mash-release

Information

# ModelMash (模方) 使用指南 [![GitHub Downloads](https://img.shields.io/github/downloads/max-doo/model-mash-release/total)](https://github.com/max-doo/model-mash-release/releases) ## **为什么选择 ModelMash?** ModelMash 采用了独特的 **"原生聚合 + 智能总结"** 方案: ### 1. **完整保留原生体验(区别于 API 客户端)**: 不同于仅调用 API 的工具,ModelMash 直接嵌入官方网页。这意味着你可以**无缝使用各家在网页版里内置的 Agent/工具能力与生态功能**,你使用的是“完全体”的 AI,而非“阉割版”的 API。例如: * **ChatGPT**: 直接使用 **Agent mode / Deep Research** 进行多步研究与网页操作,配合 **终端/代码执行**、**Canvas** 与 **GPTs/Actions** 完成端到端任务。 * **Claude**: 利用 **Artifacts** 做可编辑的代码/文档/前端预览,配合 **Projects** 的知识库式工作区与 **Computer Use** 的界面操作能力处理长流程工作。 * **Gemini**: 通过 **Deep Research + Canvas** 产出可编辑报告,结合 **Workspace 扩展** 读取/利用 Gmail、Drive、Docs/Sheets/Slides 等内容,并用 **Gems** 固化常用工作流。 * **Grok**: 原生集成 **实时 X + Web 搜索** 与 **工具调用**(如代码执行),在语音模式下可进行多模态交互与实时信息跟踪。 * **Perplexity**: 使用 **Pro Search** 做多轮检索与推理,输出带来源的研究结论,适合快速做“问题澄清 → 验证 → 归纳”。 * **通义千问**: 原生支持 **工具使用/Agent 交互**,并集成 **录音/音视频/文档** 场景能力,可直接在网页端完成 **AI PPT** 等生产力任务。 * **Kimi**: 以 **超长上下文** + **文件解析** 见长,并支持 **联网搜索/工具调用**,适合处理长文档、资料汇总与结构化输出。 * **豆包**: 覆盖 **实时语音**、多模态理解与 **工具调用/GUI 任务**,并提供 **3D 生成** 等创作类能力,适合多模态交互与任务执行。 * **腾讯元宝**: 直接使用其 **DeepSeek+ 深度思考** 能力,并可从 **微信公众号/视频号** 等腾讯生态信源检索信息,支持语音输入/通话与文件解析。 * **智谱清言**: 基于 GLM 系列模型,支持 **原生工具调用** 与 **AI 搜索工具**,并提供 **PPT/海报** 等应用级能力,适合“边搜边写边产出”。 * **文心一言**: 依托百度生态的 **搜索与插件/智能体平台**,支持多模态输入输出与工具增强,适合做“检索增强 + 任务型智能体”工作流。 ### 2. **Agent 总结系统(区别于普通聚合浏览器)**: ModelMash 引入了智能总结AI Agent 作为“裁判”。它能自动阅读所有窗口的回答,帮你**去伪存真、综合观点**,甚至进行**辩论分析**。通过多模型交叉验证与 Agent 深度总结,ModelMash 能有效减少幻觉,提供**比单一模型更客观、比普通聚合工具更深度**的分析能力,输出全面的总结报告。 ## ️ 核心优势与竞品对比 | 功能特性 | ModelMash (本产品) | ChatAll (齐叨) | ChatHub | | :--- | :--- | :--- | :--- | | **核心定义** | **Webview 聚合 + Agent 分析中心** | Webview 并发工具 | 浏览器插件/聚合器 | | **原生生态支持** | ** 100% 完整体验**
(支持 GPTs、Artifacts、绘图、联网等官方所有功能) | API调用 | API调用 | | **智能总结 Agent** | ** 深度集成**
(内置裁判、辩论、学术分析等 6 种模式,可自定义 Prompt) | 仅简单的并发显示,无二次分析能力 | 支持 | | **使用成本** | ** 极低**
(直接复用网页版账号,仅总结功能需少量 API) | 免费 | 收费 | | **文件上传能力** | ** 模拟拖拽**
(支持 PDF/图片/代码,通过 CDP 协议模拟真实操作) | 不支持 | ️ 不支持拖拽上传(通过API上传)| | **Deep Research** | ** 一键全开**
(智能识别并开启各家的深度思考/联网搜索模式) | 手动开启 | 手动开启 | | **数据隐私** | ** 100% 本地化**
(Cookie、历史记录均存储在本地设备) | 本地存储 | ️ 云端同步 | --- ## 1. 快速入门 ### 1.1 安装与启动 * **安装版**:下载 \`ModelMash Setup.exe\` 安装包,双击安装。数据存储在系统目录 (\`%APPDATA%\`),适合固定设备使用。 * **便携版**:下载 \`ModelMash-Portable.zip\` 压缩包,解压到ModelMash-Portable即可使用。数据存储在程序目录内,适合放在 U 盘随身携带。 ### 1.2 首次运行的关键步骤 ModelMash 的核心原理是内嵌了多个“独立浏览器”窗口。 1. 启动软件后,你会看到多个空白的模型窗口。 2. **必须手动登录**:请在每个窗口中,像在普通浏览器里一样,登录你的账号。 3. **状态保持**:一旦登录成功,软件会记住你的登录状态(Cookie),下次打开无需重新登录。 4. **上网环境**:要使用海外的模型需要自备必要的上网环境。 --- ## 2. ️ 界面与核心交互 ### 2.1 布局概览 * **顶部栏**:每个模型窗口上方都有独立的控制条。 * *模型名称*:点击可切换该窗口显示的模型。 * *刷新/后退*:网页卡死或需要返回时使用。 * **中央工作区**:并排显示的模型窗口(Webview)。 * *窗口占比调整*:在多列布局下,可拖拽窗口之间的分隔线,实时调整相邻窗口宽度占比(悬停分隔线时鼠标会显示 ↔)。 * *窗口占比为临时状态*;在应用刷新/重载、切换窗口布局、或点击“重置占比”后会恢复为均分。 * **底部控制栏**:你的“指挥中心”。 * *统一输入框*:在此输入内容,会同步发送给所有模型。 * *发送按钮*:分两步操作(详见下文)。 * *布局切换*:支持 **单列 / 双列 / 三列 / 田字格 (四窗)** 视图。 * **侧边栏 (抽屉)**: * *左下角 Logo*:打开 **设置面板**。 * *左下角历史图标*:打开 **对话历史**。 * *右下角列表图标*:打开 **总结历史**。 * *右下角生成总结按钮*:打开 **AI 总结面板**。 ![主页面](docs/assets/main-page.png) --- ## 3. 高效对话工作流 ### 3.1 “两步走”发送机制 为了防止误发,ModelMash 采用了独特的发送逻辑: 1. **第一步:输入与确认** * 在底部输入框输入问题。 * 按 \`Enter\` 或点击发送按钮。 * **效果**:文字会自动填入所有模型网页的输入框中,但**不会立即发送**。 * *优势*:你可以在发送前,对某个特定模型的输入进行微调(例如给 Claude 多加一句提示)。 2. **第二步:统一触发** * 再次点击底部的“发送”按钮(此时按钮图标会变化)。 * **效果**:所有模型同时开始回答。 ### 3.2 文件上传 (支持拖拽上传) 支持将图片、PDF、代码文件发送给所有模型。 * **操作**:直接将文件拖拽到底部输入框区域。 * **原理**:软件会模拟鼠标动作,将文件同时拖入所有 AI 的网页窗口中。 * **注意**:各模型对文件的支持度不同,请留意各窗口的上传状态反馈。 ### 3.3 灵活的显示模式 * **专注模式 (单列)**:在处理复杂代码或长文阅读时,切换到单列,获得最大视野。 * **对比模式 (2/3/4列)**:在验证事实或寻求创意时,开启多列,直观对比不同 AI 的回答。 --- ## 4. AI 智能总结与分析 (核心功能) 这是 ModelMash 的核心功能。它不仅能对比,还能请一个Agent来帮你读懂所有回答,最重要的是你可以自定义Agent提示词来适应不同使用场景。 ### 4.1 准备工作 (必做) 要使用此功能,你需要配置一个大模型供应商的 API(因为总结需要消耗 Token)。 1. 打开 **设置** -> **总结 Agent 配置**。 2. 添加一个供应商,详细列表请参考 [5.4 支持的 API 供应商]。 3. 输入 Base URL 和 API Key,点击“验证”。 ### 4.2 使用流程 1. **发起对话**:先在主界面问所有模型一个问题。 2. **等待回复**:等各家 AI 说完。 3. **开启总结**:点击右下角的 **“生成总结”** 图标,打开总结面板。 4. **配置任务**: * **选择素材**:勾选你觉得有价值的回答(默认全选)。 * **选择裁判**:在“使用模型”下拉框中,选一个负责总结的 AI,推荐文本生成能力强的模型,可参考[LM Arena](https://lmarena.ai/zh/leaderboard)上的模型排名。 * **选择模式**:点击底部的模式按钮(如下)。 5. **生成报告**:点击“开始分析”。 ### 4.3 六大预设模式详解 ModelMash 内置了专业的提示词模板: 1. ** 综合最佳**:融合各家之长,给出一个最完美的标准答案。 2. **️ 裁判找茬**:专门挑刺。它会指出哪个模型在胡说八道,哪个模型逻辑有漏洞。 3. ** 学术分析**:以严谨的学术口吻,评估来源、方法论和证据强度。 4. ** 创意发散**:不寻求标准答案,而是基于现有回答,通过头脑风暴延伸出新点子。 5. **️ 辩论对决**:把不同模型的回答看作辩手,进行评分和胜负裁决。 6. **️ 实践指南**:忽略理论,直接提取可执行的操作步骤(Step-by-step)。 --- ## 5. ️ 高级配置与个性化 ### 5.1 模型管理与排序 你可以决定谁坐在“C位”。 * **排序**:在设置中,按住模型卡片前的“把手”图标,**拖拽**即可调整顺序。排在第一位的模型会默认出现在最左侧,在主页面更改模型显示顺序会同步修改排序。 * **同步模型**:如果你添加了新的 API 供应商,点击“同步/配置”按钮,可以自动拉取该供应商下的所有新模型列表。 ### 5.2 自定义 Agent (高阶玩法) 觉得预设的 6 种模式不够用?你可以创造自己的 Agent。 1. 在设置中找到 **Agent 提示词**。 2. 点击 **新增**。 3. **编写 Prompt**:例如,你可以写一个“代码审查员”模式,提示词为:“你是一个资深架构师,请忽略所有非代码内容,只对比各模型给出的代码方案,指出潜在的内存泄漏风险和性能瓶颈...”。 4. 保存后,总结面板里就会多出一个选项。 ### 5.3 Deep Research (深度研究) 在底部控制栏有一个 **Deep Research** 按钮。 * **功能**:一键激活以下 Web 应用的研究/联网模式:ChatGPT、Perplexity、Gemini、Grok、通义千问、豆包、智谱清言。 * **不支持**:Claude、Kimi、腾讯元宝、文心一言(仍可在网页内手动开启)。 * **原理**:通过 DOM 操作自动点击网页上的特定开关。 ### 5.4 支持的 API 供应商 ModelMash 支持所有兼容 OpenAI API 格式的供应商。**免费 Token:注册阿里百炼,智谱可免费领取试用Token** #### 国际供应商 | 供应商 | Base URL | 特性支持 | |--------|----------|---------| | **OpenAI** | \`https://api.openai.com/v1\` | 标准 API
o1/o3 推理模型 | | **Anthropic Claude** | 通过代理 | ️ 需要 OpenAI 兼容代理 | | **Google Gemini** | \`https://generativelanguage.googleapis.com/v1beta/openai\` | 思考内容(thinking_config)
Gemini 3 系列 | | **OpenRouter** | \`https://openrouter.ai/api/v1\` | 多模型聚合
思考内容支持 | | **Together AI** | \`https://api.together.xyz/v1\` | 开源模型托管 | #### 国内供应商 | 供应商 | Base URL | 特性支持 | |--------|----------|---------| | **阿里云百炼** | \`https://dashscope.aliyuncs.com/compatible-mode/v1\` | Qwen 系列
混合思考模式(enable_thinking) | | **DeepSeek** | \`https://api.deepseek.com/v1\` | DeepSeek-V3
DeepSeek-R1 推理模型 | | **硅基流动** | \`https://api.siliconflow.cn/v1\` | 多模型支持
思考内容支持 | | **智谱 AI** | \`https://open.bigmodel.cn/api/paas/v4\` | ️ 需要适配层 | | **月之暗面** | 通过代理 | ️ 需要 OpenAI 兼容代理 | #### 思考内容支持 部分模型支持推理过程可视化(Reasoning/Thinking),ModelMash 会自动识别并适配,可在点击总结页面的设置按钮️在参数面板中开启思考模式即可让模型返回思考内容。 --- ## 6. 数据管理与导出 ### 6.1 历史记录 * **对话历史**:保存了你和多个模型聊天的上下文。点击历史记录,可以恢复当时的输入内容。 * **总结历史**:保存了 AI 生成的Markdown 报告。 * **URL 追踪**:软件会尝试记录对话发生时的网页链接(如 Gemini 的会话链接),在历史记录中点击可直接跳转回当时的网页现场。 ### 6.2 导出报告 生成的总结报告支持导出为 **Markdown (.md)** 文件。 * 在设置中,可以指定默认的 **导出目录**。 * 导出的文件不仅包含总结结果,还包含原始的对话内容,是极佳的知识库素材。 --- ## 7. 常见问题排查 * **Q: 为什么点击发送后,只有输入框填了字,没自动发出去?** * A: 这是设计特性。请**再次点击**发送按钮。如果第二次点击仍无效,可能是该网站改版了 UI,导致 DOM 选择器失效。请等待软件更新。 * **Q: 总结功能提示 "API Key 无效"?** * A: 请检查设置中的 Base URL 是否正确。例如 OpenAI 的官方地址通常是 \`https://api.openai.com/v1\`,有些中转商的地址结尾不需要 \`/v1\`,请仔细核对供应商文档。 * **Q: 窗口显示空白或加载不出网页?** * A: 检查你的网络环境。部分 AI 平台(如 Google, GPT)需要特殊的网络环境才能访问。ModelMash 自身不提供代理服务,使用的是你系统的网络环境。如果网络没有问题,请尝试点击刷新按钮,或按住Ctrl+R强制刷新应用 * **Q: 如何清空所有数据重置软件?** * A: 删除 \`%APPDATA%/modelmash\` (Windows) 或 \`~/Library/Application Support/modelmash\` (macOS) 文件夹即可。 --- > **希望这份指南能帮助你将 ModelMash 变成你最得力的 AI 助手!如有更多问题或建议,欢迎提交留言反馈!** ![问卷二维码](docs/assets/qrcode.png)

Prompts

Reviews

Tags

Write Your Review

Detailed Ratings

ALL
Correctness
Helpfulness
Interesting
Upload Pictures and Videos

Name
Size
Type
Download
Last Modified
  • Community

Add Discussion

Upload Pictures and Videos