Gemini

Google推出的多模态AI大模型,2025年11月发布Gemini 3系列,LMArena首个突破1500分的模型

深度报告

  • Google Gemini 是 Google DeepMind 推出的多模态 AI 大模型,于 2023 年 12 月首次发布,2025 年 11 月发布 Gemini 3 系列。Gemini 3.1 Pro 在 LMArena 榜单创下 1501 ELO 的历史纪录,成为首个突破 1500 分的模型。该产品提供网页版、移动 App 和 API 三种使用形态,定价从免费版到 $249.99/月的 Ultra 版不等。Gemini 的核心优势在于与 Google 生态的深度集成、超长上下文处理能力和实时搜索数据支撑,但在中文创意写作和长对话上下文保持方面存在不足。

  • Google Gemini 由 Google DeepMind(谷歌深度思维)开发。2024 年,Google Brain 与 DeepMind 完成世纪大合并,由 2024 年诺贝尔化学奖得主戴密斯·哈萨比斯(Demis Hassabis)领导。Gemini 是 Google 迄今为止最强大、最通用的 AI 模型,设计为原生多模态架构,能够同时处理文本、图像、视频、音频和代码等多种数据类型。 Gemini 的产品矩阵涵盖三个版本层级:Gemini 3.1 Pro 定位于复杂任务和创意概念实现,Gemini 3 Flash 追求前沿智能的高速响应,Gemini 3.1 Flash-Lite 则面向高容量任务的高效处理。此外还有针对科学和研究场景的 Gemini 3.1 Deep Think、图像生成编辑的 Nano Banana,以及音频对话控制的 Gemini Audio。

  • Gemini 提供了丰富的功能体验。在对话与推理方面,Gemini 3 Pro 在推理能力上有显著提升,Deep Think 模式可为复杂技术问题提供更全面、结构更清晰的答案,但长对话上下文保持较差,15 至 20 轮交互后偶尔会丢失之前的内容或自相矛盾。研究与摘要功能集成了实时搜索,能拉取最新信息并引用来源;Deep Research 功能可在 5 分钟内生成 12 页文档,引用 30 个以上来源,质量堪比初级分析师数小时产出。 在写作与编辑方面,Gemini 擅长在 Gmail 中快速生成上下文恰当的回复,也擅长重组和提升文档清晰度,能够将长文档浓缩为关键要点。但在创意和长文写作方面表现称职但模式化,不如 ChatGPT 和 Claude。编程辅助方面,Gemini 在代码生成、调试和代码解释方面表现称职,与 Google Cloud、Firebase、Android 开发的配合特别好,但通用编程方面 Claude 和 GitHub Copilot 在代码质量和一致性上仍略胜一筹。 图像与视频生成基于 Imagen 和 Veo 2/3 模型,质量对于快速视觉素材、社交媒体图片和概念设计足够好,但复杂提示词下艺术质量不及 Midjourney。Gemini Live 语音对话功能在免费版中就可用,体验自然流畅,可以打断和追问,但部分用户反映语音交互表现力不如 ChatGPT 的 Advanced Voice Mode。

  • Gemini 的定价方案分为个人用户和企业用户两个体系。个人用户方面,免费版提供 Gemini 3 Flash、Gemini Live 和 Google 应用集成,但有每日用量限制;Google AI Pro 月费 19.99 美元,包含 Gemini 3 Pro、Deep Research、1500 页上传、Gems、Gmail/Docs AI 以及 2TB Google One 存储;Google AI Ultra 月费 249.99 美元,提供最高用量、Veo 2/3 视频生成、Deep Think 推理模式和抢先体验功能,还包含 YouTube Premium。企业用户方面,Business 方案每用户每月 20 美元,包含团队协作、NotebookLM Plus 和企业级安全;Enterprise 方案每用户每月 30 美元,提供 AI 会议字幕(支持 65 种以上语言)、数据分类保护和完整模型访问。 从性价比角度分析,Google AI Pro 是最具性价比的选择,因为它包含的 2TB Google One 存储单独购买价值 9.99 美元/月,相当于 AI 功能仅需约 10 美元/月。相比竞品 ChatGPT Plus 和 Claude Pro 都是每月 20 美元,但 Gemini 额外包含云存储和实时搜索功能。

  • 正面评价方面,用户普遍认可 Gemini 无可匹敌的 Google 生态集成能力,它原生集成 Gmail、Docs、Sheets、Slides、Meet 和 Maps。强大的免费版也是显著优势,Gemini 3 Flash 和 Gemini Live 全部免费。实时搜索数据支撑使回答基于实时 Google 搜索数据,并带有来源引用。Deep Research 功能可在几分钟内生成带引用的全面多页报告。超高性价比也是用户选择的重要因素,AI Pro 捆绑的存储空间增加了实际价值。此外,1500 页文档分析和跨设备同步功能也受到好评。 负面反馈主要集中在几个方面:长对话上下文丢失是最大痛点,15 至 20 轮交互后容易忘记之前的内容或自相矛盾。偶尔仍会自信地给出编造的信息,尤其是小众话题。创意写作称职但模式化,缺乏温度。Google 的数据收集意味着对话可能被用于服务改进,存在隐私担忧。定价结构也较为混乱,Google One、AI Pro、AI Ultra 之间的关系不太好理解。

  • Gemini 3 于 2025 年 11 月 19 日发布后引发行业震动。在 LMArena 全球排行榜上,Gemini 3 以 1501 分的 ELO 评级傲视群雄,成为人类历史上首个突破 1500 分大关的模型。Alphabet 股价在发布当日最高涨幅达 6.9%,公司市值达到 3.54 万亿美元。马斯克发推盛赞其「印象深刻」,OpenAI CEO Sam Altman 也认可其领先地位。 媒体评价总体正面,认为 Gemini 3 实现了「断崖式领先」,在多个榜单刷新纪录。但也有中性观点指出 Gemini 并非在所有场景都最强,Claude 在编程、ChatGPT 在创意写作各有优势。批评主要集中在中文能力较弱和长对话稳定性有待提升。

  • Gemini 面临的主要争议和风险包括:数据隐私问题,用户对话可能被用于模型改进,隐私敏感用户可能有所顾虑;偶尔的幻觉问题仍存在,对小众话题可能自信地给出错误信息;长对话稳定性问题在生产环境中可能造成实际困扰;此外中文创意写作能力与英文存在明显差距。

  • 最适合使用 Gemini 的用户群体包括:Google Workspace 重度用户,因为 Gmail、Docs 和 Drive 是日常工具,Gemini 的集成无可替代;研究人员和分析师,Deep Research 和实时搜索让 AI 成为信息收集最强的工具;需要处理超长文档的用户,如法律合同、学术论文等大型 PDF 批量处理;视频内容分析需求者,1 小时视频可直接分析,多模态能力顶尖;预算敏感用户,免费版很慷慨,AI Pro 含存储性价比最高;以及多模态创作者,一个平台可搞定文本、图像、视频、语音。 不太适合使用 Gemini 的用户包括:中文创意写作者,需要有温度、有个人风格的内容,Gemini 中文写作较生硬;追求隐私的用户,Google 的数据收集政策存在隐私担忧;复杂编程任务开发者,多文件代码一致性与 Claude 有差距;对延迟敏感的应用开发者,响应速度较慢不适合实时交互场景。

  • 2026 年的 Google Gemini 已经不再是简单的「Google 版 ChatGPT」,而是一个具有独特优势的差异化产品。Gemini 3 的发布标志着 Google 在 AI 领域的全面反击,LMArena 首个 1500 分模型证明技术实力,Google 生态的原生集成是独特护城河,Deep Research 和超长上下文是刚需场景的最优解。但中文能力和长对话稳定性仍需改进。 行动建议方面,普通用户今天就可从免费版开始试用,体验 Gemini Live 语音对话;Google 用户可考虑 19.99 美元/月的 AI Pro 方案,相当于 10 美元/月获得 AI 加 2TB 存储;专业开发者可根据场景选择,超长文档用 Gemini、编程用 Claude、长对话用 GPT;企业用户需评估 Business 或 Enterprise 方案,注意数据安全政策。

用户评论

  • 头像
    Evel_ynScott
    额度又涨了!!!

  • 头像
    whitepeacock409
    Mac 客户端出了,终于不用每次开浏览器了,体验比网页版顺滑一点,就是功能跟网页版没太大区别,希望后续多做点原生适配。

  • 头像
    RonaldRuiz_Plus
    Gemini 3 Pro 真的封神了。

  • 头像
    JNelson_66
    Mac 版下载试了一下,界面设计跟手机版一脉相承,很简洁。功能和网页版基本一致,就当一个快捷入口用吧,总比每次找浏览器标签省事。不过我用下来有个感受,窗口切换比网页版流畅,不会因为切换 Tab 导致对话刷新或者加载失败,这个对重度用户来说还是有价值的。希望后续做桌面端的原生适配,比如支持拖拽文件进去、系统通知集成之类的,感觉现在只是把网页装了个壳。

  • 头像
    Johnny_Gonzales_7
    用量大真的会被限速,烦死了。

  • 头像
    Nancy574
    3.0 pro 的额度确实有点紧,用量稍微大一点就开始限速。后来按建议改成小任务走 flash、大任务走 thinking 模式,额度问题基本解决了。flash 速度其实挺快的,平时够用。

  • 头像
    ticklishmouse163
    用 Gemini 做深度调研这件事效率真的起飞。给它一个比较复杂的研究方向,它会自动搜索、整理、归纳,最后给你一份带引用来源的多页报告,而且速度很快。以前这种事我要花大半天,现在十分钟搞定。Google 搜索实时加持让它不会动不动说「知识截止日期」,这点比很多竞品强。

  • 头像
    reddog774
    把一堆 PDF 塞进去让它帮我做分析,上下文窗口长这件事真的是 Gemini 的核心竞争力,其他家根本比不了。同一对话里同时放了三份英文学术报告加一份行业白皮书,全程没有丢失上下文,最后让它做交叉比对分析,结果相当准确。以前碰到上下文限制要来回切对话、手动喂材料,效率折损很大,现在这个痛点基本消除了。

  • 头像
    JUngu
    免费版给的太多了,有点不敢相信这是 Google。

  • 头像
    Daniel_Murray_X
    Gemini 3.1 Pro 现在在 Web 端就能用,文本理解、长上下文、多模态基本都拉满了。有人整理了一套「榨干它全部潜力」的使用方法,按那个来用确实比普通聊天强很多,Deep Research 和 Canvas 功能我觉得是亮点。

  • 头像
    Sarah.SmithX
    查资料这件事交给 Gemini 真的放心,实时联网比那些知识截止 2024 年的强多了。

  • 头像
    MarilynLewis_2021
    Gemini 的绝活是什么都能吃,文字图片视频音频都行。缺点是太热情了,你就说个「嗯」,它能回八百字,有时候真的很烦。

  • 头像
    陈月
    用 Gemini 配合 Cursor 做小程序全栈开发,跑通了整个流程,分享一下感受。需求分析和数据库设计阶段主要靠 Gemini,把业务描述扔给它,让它帮我拆拆数据模型,再梳理接口逻辑,这部分比自己从头捋文档省了很多时间。写代码阶段就切换到 Cursor,Gemini 输出的设计文档直接作为上下文喂给 Cursor,衔接比较顺。调 bug 的时候我习惯两个轮流用,Gemini 分析报错信息思路清晰,Cursor 直接改代码更方便。整体来说这个搭配适合独立开发者,两个工具各有侧重,不需要在一个工具上死磕到底。当然 bug 还是要自己调,不要指望全自动。

  • 头像
    孙伟丹
    用对话方式 AI 生图这个体验真的很爽,给参考图加提示词,指哪打哪,以前觉得提示词太难调了,现在直接说想改哪里就改哪里,门槛降了很多。

  • 头像
    WEwil
    生图这块比之前强了,但跟 Midjourney 比还是有差距,精细度不够,拿来快速出草图可以,要做正式的创意物料还得去专业平台。

  • 头像
    BDavis_7
    官方界面有点难用我承认,但装了那个增强插件之后真的翻倍好用了,对话记忆、自定义指令、快捷键都有,推理能力本来就封神,再配个好界面,真的无敌。

  • 头像
    VHernandezSr
    原生界面将就用吧,反正免费,不指望它跟付费产品比界面设计。

  • 头像
    CarolynCruz_Max
    推理这块不错,Gemini 特别适合复杂问题的分析和归纳,拿来查资料和做多步骤推导很稳,但整体项目管理和规划能力跟 GPT 比还是略差一点,各有所长吧。

  • 头像
    JReyes_2024964
    Context Window 有 1M 这件事是真的很恐怖,把整个项目代码库丢进去都没问题,这才是 Gemini 最核心的护城河,其他家暂时真追不上。

  • 头像
    MeganEdwards_Max
    我现在基本形成了固定分工:ChatGPT 陪聊、Gemini 查资料、Grok 看新闻、Claude 写报告。Gemini 查资料这个定位非常稳,联网能力强,实时性好,就是对话感差一点,不太适合闲聊。

  • 头像
    JReed_Pro
    谷歌生态用户直接冲,不用多想。

  • 头像
    ESullivan_2024127
    把一本 200 多页的书直接扔给 Gemini 做分析,它居然跑通了,文档理解能力很强。跑完生成了一个 html 文件,点开就能用,体验超出预期。长文档处理这块真是 Gemini 的强项,其他家没这么顺的。

  • 头像
    hENRYcRUZ
    还要科学上网,国内用起来太麻烦了,这是硬伤。

  • 头像
    邵宇
    跟国内大厂模型横向对比了一下,主观感受 Gemini 在推理深度和文本理解上依然有优势。用同一套问题测了豆包、Kimi 和 Gemini,复杂逻辑题的拆解和多步推理 Gemini 表现最稳,国内的模型在速度和界面体验上更好,响应快且排版美观,但碰到真正烧脑的问题,输出深度差一截。当然这个对比有局限性,我自己的使用场景偏研究分析,如果只是日常问答,国内模型完全够用,而且不用科学上网,这是个不可忽视的实际门槛。总结就是重度分析研究用 Gemini,日常轻量任务国内随便选一个。