网上有很多关于最强AI的争论,比如Claude 和 Gemini 和 ChatGPT 谁更强?
但实际上我常用AI工具是跟场景匹配的,没有任何一个AI是全能的,有几个并不在上面的三个AI里面。
深度调研:需要深入了解某一个行业或者某一个概念
我会同时用三个模型,分别是ChatGPT的Deep Research,Geimini的Deep Research和Kimi的Deep Research。别看名字都一样,但是侧重点差别很大。
比如拿这个案例来看,我让他们三个分别做了关于「深刻的评价下AI浏览器,比如perplexity的comet等,和传统网页浏览器的异同点」的深度调研。
ChatGPT的最为老牌,除得最早,它的结果「最干」,说白了就是大量的专业名词+专业分析,非常适合去深度的阅读和理解,但是不利于快速获取重点知识。
Kimi很好的弥补了这一点儿,它会生成两个东西
(1)类似于ChatGPT的文字报告 (2)可视化报告
重点就在于这个可视化报告,非常适合于快速获取知识。
它跟普通的对话获取知识不一样,因为它是经过问题->deep research->结果可视化,意味着这个可视化结果其实就是上万字报告的总结,信息量要比一般的提问多很多。
特别是一些比较枯燥的信息,就像这种用户体验设计方面的差异,文字是很难精确表述的,但是可视化的报告很好的弥补了这一点儿。
这类型的内容ChatGPT和Gemini都有生成,但问题是内容的表达形式有时候非常的重要,特别是上万字的报告,没点儿耐心很难看完,而先看完图形化报告,再对照文字仔细研究就很高效了。
Gemini的优势就是背靠Google,特点就是非常的财大气粗,表现在(1)速度快,一般几分钟就好(2)参考的资料很多,很多时候它会告诉你这个报告参考了200+的来源。
这是它的特点,它的优点是可读性很强,你看Gemini输出的文字,特别的地道,不像是ChatGPT那么干巴巴,Gemini生成的报告虽然很长,但是它用大量的“软词”把阅读难度一下子降低了。
以及它也会有一些简单的可视化内容,比如这个表格就很方便去做横向对比,对于调研来说很有用,可直接作为最后的报告内容。
读论文:泛PDF文档阅读理解
这个需求对我来说是刚需,特别是读各种文献,绝大多数情况下都得拿PDF来读,我试过几乎所有的AI。
除了有几个以前就是做PDF阅读器出身的,他们的OCR做的好,其他的都不行,除了豆包。
选择pdf论文后直接给四个建议prompt,很贴心。
开始工作后,右边论文全文,左边提问和输出,使用起来非常的舒服。
它会直接提供一个思维导图,非常有助于快速理解文章概要。
以及它会把核心的创新和贡献都直接列举出来,其实这就是看论文的核心要点,要是它的创新点不是你需要的,你看这篇论文可能就是浪费时间。
特别是右边的原文,支持「滑词」功能,你可以激活搜索、翻译、解释、复制等等。
还支持对于图片内的文字提取,很多时候这个功能可以帮大忙。
即使是表格内容,也有很好用的方法,就是可以直接复制。
可以很精准的提取大段表格中的内容,搞过科研的都知道这个功能有多实用,并且要比直接的截图理解准确的多。
写代码
我相信现在已经很少有人用大模型直接来写代码了,因为绝大多数的代码都会跟几个甚至几十个文件相关关联、引用、调用,甚至更复杂的层层嵌套的操作。
大模型对于单个文件还行,要是碰到几十个,百分百会抓瞎,对于任何单个模型都是。
现在写代码主要就分为两个流派:
1 Full Auto 全自动
这种代表就是Gemini CLI和Claude Code。
这俩的主要特点就是只要你允许它自动执行,它们会根据你的要求不停的去写代码,验证,写代码,验证,很容易几个小时过去了,它还在运行。
Gemini⬇️
Claude Code⬇️
这两种方式的特点就是比较黑盒,意味着你很难在几千行的思考以及执行过程中去探究它到底干了什么,如果最后面的结果你满意还好,否则的话可能就是在浪费时间,甚至会把原本还不错的代码搞的一团乱。
Claude Code的消耗很大,一个小时30美元是常态。
Gemini现在比较良心,一天有100万的免费token,可以用很久。
2 Part Auto 半自动
这种代表就是搭载了Claude的AI Coding 编辑器,如Cursor,Trae等。
这种就是传统的编辑器展示形式,只是嵌套了AI功能,你可以在任意的地方调用AI去帮你写code。
它也有类似于自动化的特性,这个智能体就是类似的功能,它会针对于一个功能,进行自主的写代码,测试,最后给你一个结论性的简短报告
不过它是比较透明的,也就是在一些步骤的抉择时刻,会主动把选择权交给你,你可以选择继续运行或者你有自己的想法也可以。
不过这个有个特点,就是性能强烈依赖于搭载的模型,当下的话,Claude-4这个系列的模型效果最好,其他的模型次之。
我觉得大模型本身的好坏很难用一两句说清,重要的是你得选择合适的模型,而不是通俗意义上的最强模型。