文 | 鲸选AI
最近,Google专为AI手机打样的Pixel 10,宣布在Google 相册中可以通过文字或语音编辑图像,直接调用最近大火的Nano Banana图片编辑模型。
这意味着手机P图就省事了,国外网友已经放飞想象力,玩起来了。
其实,Pixel 不是走量的手机,但是现在凭借AI能力,却赢得越来越多的粉丝用户。手机从智能进入AI时代,会成为决定销量的核心因素吗?这事苹果和三星都在深刻思考。
前阵子,罗永浩在与李想的视频播客中提到, 第一代iPhone发布时,声称其OS系统领先业界5年,安卓系统通过"照抄"和"照搬"iPhone,果真花费了4-5年时间,才在某些体验上逼近iPhone。
而随着被国外网友称为 “全球最 AI 的手机”谷歌 Pixel 10 系列,正在通过Tensor G5+ 端侧 Gemini Nano带来的组合,在AI领域建立吸引力。
乔布斯说,硬件上的领先只能保持6个月,全新的Tensor G5芯片,官方给到的参考是相比上一代 CPU 平均快 34%、TPU(AI 单元)提升最高 60%。而且支持Qi2磁吸无线充电,相机升级到50MP主摄,屏幕亮度高达3300尼特,电池也更大了。
这些提升不是跑分炫耀,而是为了把更复杂的模型、更多的场景判断塞到本地实时完成,从而完成乔布斯说硬件领先6个月的后半句:软件才能建立2-3年的领先。现在看来,AI也许壁垒更高,建立的领先时长也许更长。
Google这次重磅发布Pixel 10,也主要展现里面的AI功能,尤其是Gemini的深度整合,它是负责“AI理解与生成”的落地,将你的短信、截图、通话、图片等这类信息在手机里本地串起来。
这套组合的直接结果是:很多原来需要云端的“聪明”,如今不联网也能做、延迟更低、隐私边界更可控。
更重要的是,Pixel 10 手机从嫁接AI,到现在越来越像个原生AI伙伴,它不再只是等你问问题,而是开始转变为主动帮你想事儿。
最典型的就是Magic Cue这个功能,它不是等你输入,而是主动猜想你的需求,拉取信息给你建议。例如,在聊天中,如果朋友询问晚餐地点,它会自动提取地址并建议回复;在打电话给航空公司时,它会弹出航班信息卡片。
相比之下,华为Mate 70系列的小艺助手通过自有的盘古大模型,以及接入DeepSeek模型,实现AI运动轨迹、AI主角时刻、AI时空穿越、AI智控键、AI隔空传送、AI通话摘要、AI通话降噪、AI静谧通话等功能,软硬件结合的优势,让其能实现AI隔空传送等功能。
但囿于大模型能力的差别,华为手机的主动式 AI能力还在努力。最典型的AI 消息随身功能,是当检测到机主之外的注视时,手机会自动隐藏消息,保护用户隐私,这些能力更多基于算法层面,还不是模型层面。
三星Galaxy AI(如S25系列)则有Circle to Search等功能,能基于屏幕内容提供建议,但Magic Cue的预测性更强,三星的AI更偏向于搜索和编辑工具,而非主动Cue式的指导。
总体上,Pixel 10的Magic Cue在主动性和跨数据源整合上领先,其他品牌的功能更碎片化或需用户启动。
摄影方面,Pixel 10系列的AI也更主动,思路从“拍完再修”,走向“拍照时AI指导”。
Camera Coach功能会在你拍照时实时介入:“嘿,角度再低点,光线会更好。”
不是事后编辑图片,而是拍摄中随时提醒。这种介入式AI结合Tensor G5处理器,实现更快处理,这便是Add Me(提示我)和Best Take(自动最佳拍摄)。
华为手机目前对图片类的AI编辑还集中在AI修图等功能,如AI消除功能快速移除照片中的不必要元素,如水印、路人或物品等,也在开发更有趣的AI能力,比如鸿蒙5带来了双指抠图的能力,人像可以随时抠出换背景,也是算法层面的创新。
三星Galaxy AI的相机功能包括实时对象识别和编辑建议(如在S24/S25中),但与Camera Coach相比,三星更注重后期编辑。Pixel 10的这一功能在互动性和教育性上领先,华为强调硬件优化,三星则平衡于编辑与识别。
Pixel 10的“实时语音翻译”的升级,让双语沟通毫无障碍,拿捏11种不同语言,就像手机内置了一位私人翻译一样。它会实时翻译你说的日语,让对方听到的是英语,并且保持你的音色语调,不过目前不支持中文。
苹果iPhone 17的Translate app由Apple Intelligence支持,提供语音翻译,Live Translation 功能还可以整合至 “讯息” app、FaceTime 及 “电话” app,这些能力由 Apple 自主研发的小模型运行,以确保用户的个人对话保密。
苹果自研小模型,在翻译等特定场景上表现还行,需要创意等需要大模型的场景,就得依靠OpenAI等公司合作,但目前进展不大。
三星Galaxy S25的Live Translate使用Galaxy AI(基于Gemini Pro),支持20种语言,包括电话和面对面,生成自然声音。Gemini Pro覆盖更广,但部分云端依赖可能增加延迟。
这也是三星手机没有全自研系统和小模型的的劣势。但积极拥抱Google Gemini系列大模型,除了本地任务打不过苹果,信息整合以及图片处理等任务还是超过iPhone系列。
AI手机风向的转变非常的迅速,2024年下半年以前,各大手机厂商都加入了一场关于自研大模型的热潮,将掌握底层AI能力与未来手机市场的核心竞争力划等号。
可以看到,涉及到长上下文处理以及等多模态内容处理等内容,Google凭借模型优势,还是建立起场景服务AI化的领先。三星紧随其后,大力引入Google的整套能力;华为和苹果则旗鼓相当,二者都在加速进化,补足模型方面的能力,这些能力可能需要2-3年的时间。
如果说过去十年的手机之争是谁的算法更强、谁的镜头更大,那接下来的竞争,会越来越像是谁更懂“魔法”与“用户心理”,这是硬件+系统+大模型带来的乘法优势。
在这条路上,Pixel 10 迈出了不小的步子,尽管原生安卓的UI,可能不如国产诸多『完善版』更好用。不过,Pixel 10 本身也不是Google走销量的产品,很多时候是为了探索发展方向。 iPhone这块确实怎么走还没明确,iPhone 17这次硬件不挤牙膏了,但是系统层大语言模型和图像模型,一直在思考用谁家的,Siri的AI版都要拖到2027年才迭代了。
回到消费者视角,当手机因为AI更主动,便利与隐私双刃剑的问题就会席卷而至。你们怎么看这一变化?