日前,豆包与中兴合作发布首款“豆包助手”手机,售价3499元。这款主打说一句话就能让AI帮你自动点单、全网比价等卖点的手机,一经上线很快售罄。
在这个AI“解放双手”的叙事里,市场反响各异。一边是魅族科技喊话豆包官方,“期待有机会深入合作”、罗永浩点赞AI手机称“技术革命谁都拦不住”;另一边则是豆包手机撞上第三方App风控墙,登录和使用遇阻。
不少豆包手机助手用户反馈,使用其AI智能体自动操作任务后,会导致微信账号异常退出、触发淘宝人机识别验证,建行、农行等银行App则会弹窗提示系统检测到屏幕共享,需退出共享软件“AI操作手机”后再使用。
南都记者实测使用豆包手机助手操作淘宝遇阻。
豆包手机助手触发第三方App风控背后,是AI代理与隐私安全边界的博弈,也是事关未来的商业模式之争。当AI执行你的任务指令时,意味着你屏幕里出现的相关数据有可能被读取,包括网购记录、聊天对话等;同时AI将绕过第三方应用成为新的流量入口——入口作为互联网公司的关键护城河,成为“兵家必争之地”。
豆包手机助手“丝滑”操作,将限制部分使用场景
12月1日,搭载豆包手机助手技术预览版的工程样机努比亚M153少量发售,单机售价3499元。这是国内大模型厂商瞄准商业化落地以来,首次发布AI手机操作系统方面的探索成果。即使官方强调这只是一款工程样机,该手机还是很快告罄,二手市场上一度被炒至数千甚至上万元。
与常规智能手机相比,搭载了豆包手机助手的努比亚手机实现了AI从“能说”到“会做”,具体表现为手机操作能力、大模型调用的便携性明显改善。官方演示视频显示,只需用户一句语音指令,豆包就能自动在多款应用间跳转,完成商品比价下单、给好友发消息、P图、查询物流信息、订餐厅机票等任务。
这是豆包与手机厂商在操作系统层面合作的结果,前者主导AI手机助手的产品定义与体验,后者主导硬件研发设计以及生产制造。豆包方面称,目前正与多家手机厂商洽谈,希望以“生态合作”形式将手机助手整合进不同品牌机型中。
豆包手机助手上线后,市场表现超乎预期,但也遇到一些异常情况。多位豆包手机助手用户反馈,大概从12月2日晚开始,使用这款手机AI智能体自动操作任务后,会导致微信账号异常退出。有用户还提到,在淘宝需进行人机识别验证,数个银行App也弹窗提醒限制使用。
为何豆包手机助手会频频触发第三方App的风控措施?这与AI手机背后的技术原理分不开。
有业内人士实测手机后认为,豆包拥有了格外“丝滑”的跨应用操作能力,是因为获取了一项签名级别的高危权限INJECT_EVENTS。当晚,豆包手机助手运营团队回应称,拥有该权限许可,是实现跨屏、跨应用模拟点击,完成自动操作的前提,并强调已向用户明确披露了该权限的情况,并且只有在用户主动授权后,它才可以被调用。
豆包手机助手披露的权限使用相关情况。
需要进一步探讨的是,如果用户授权AI助手开启某些特殊操作,是否应该被限制?比如有网友称,羊毛党发现手机AI助手的隐藏玩法,后台挂机自动刷短视频极速版赚钱,并表示,“如果这套逻辑被大规模用在水军刷评、刷弹幕上,那效率简直不敢想。”
为了平息“AI操作手机”的质疑,豆包手机助手于12月5日再发声明,称将进一步限制部分使用场景——包括限制刷分、刷奖励,部分游戏类使用场景,暂时下线操作银行、互联网支付等金融类应用的能力。同时表示,正在积极寻求与各应用厂商的深度沟通,希望推动形成更加清晰、可预期的规则。
豆包手机助手宣布下线部分应用能力。
“读屏+模拟点击”模式为何引发隐私担忧?
事实上,类似豆包手机助手引发的隐私安全争议,以及操作App遇阻的经历并不新鲜。
最近两年,AI功能成为各大手机厂商的新卖点。荣耀、华为、小米、vivo、OPPO等头部厂商纷纷推出AI手机。此番豆包与中兴通讯合作,为AI手机赛道添了一把火。AI手机“丝滑”操作,有赖于用户交出一些个人信息和获取特定系统级别权限,由此引发了用户体验与隐私安全之争。
根据豆包的声明,目前该行业的AI助手,均需要使用INJECT_EVENTS的权限(或与其类似的无障碍权限)才能提供操作手机的服务。
据汉华飞天信安科技有限公司总经理彭根介绍,所谓无障碍权限,最初是为残障人士提供的辅助功能——目的是解决用户无法视物、手指点击不顺畅等问题,如今被用于增强智能体能力实现自动化操作。与传统权限针对单一功能不同,无障碍权限的控制对象是整个智能手机,它在读取屏幕文本、图像内容,监视和记录所有操作的基础上,替用户点击、长按、滑动屏幕,完成手机操作。
至于INJECT_EVENTS,网络安全专家曲子龙发文指出,这是Android上的一个允许应用向系统模拟用户输入事件的权限,大部分的手机提供商都会默认禁用这个权限,用来防止恶意应用模拟用户行为做出一些非法用途。而如果所设计的业务存在自动化测试、远程链接、脚本执行这些场景,则一定需要该权限。
据南都·隐私护卫队了解,要赋予AI智能体模仿人类操作的本领,如果不和第三方App厂商合作获取API接口,就只能采取“纯视觉”路线:通过AI智能体读屏和模拟用户点击完成操作。
北京理工大学智能科技法律研究中心研究员王磊表示,“读屏+模拟点击”实现一系列自动化操作的重要前提,是AI助手深入手机操作系统底层,获得了大量系统级别权限。该模式下,AI能充分理解用户指令和屏幕上的内容,无需经过第三方App许可调用其功能;与此同时,大量用户数据处于“暴露”状态,容易引发隐私保护担忧。
走出去智库高级合伙人陆俊秀认为,上述技术方案使安卓操作系统的“沙箱”数据隔离机制失效,智能体在不同App之间流转时,能不受限制地转移用户数据。被转移的用户信息一旦被串联起来,拼凑出画像,可能进一步提高营销、诈骗的精准度。
高危敏感权限有无被滥用风险?
正是因为其高危敏感度,当用户授予相关权限时,各大系统会出现单独的安全提醒,告知相应的风险。保障用户知情的同时,不少业内人也担忧权限被滥用问题。
在王磊看来,这种权限滥用可能导致隐私泄露和恶意操作。如果智能体遭到入侵,攻击者能够轻易获取和操控用户所有数据;无障碍模式下处于“暴露”状态的用户数据可能被存储或上传,如果遭到恶意注入或篡改,存在违背用户指令或在其没有充分知情时执行支付、转账等敏感操作的可能。
面对隐私质疑,也有大模型厂商抛弃了无障碍权限路线。今年8月,智谱推出最新智能体AutoGLM 2.0,新版最大的变化在于,智能体自主任务执行的方式从手机终端迁移到云端:无需索取手机终端的系统敏感权限来操作第三方App,而是采用云手机服务,直接调用云端手机桌面的App完成任务。
南都·隐私护卫队注意到,针对用户关心的隐私安全问题,豆包手机助手在其《隐私安全⽩⽪书》强调,⽆论是⾖包助⼿开启时,还是启⽤其他应⽤时,都会向⽤户阐释数据处理规则。只有在获得⽤户同意后,相关功能才会正式启⽤。以AI操作⼿机为例,当涉及可能影响⽤户重要权益的操作时,助⼿会主动征求⽤户的确认,确保操作符合⽤户的真实意图。在用户数据管理方面,⾖包⼿机助⼿在⼿机本地部署了一部分AI模型,包括OCR模型、多模态大模型等,以实现数据仅在设备本地处理的⾼敏感隐私数据保护功能。
据白皮书披露,豆包手机助手在手机本地部署的部分AI模型名单。
与此同时,行业也在积极推动相关标准的建立,不过目前尚未就无障碍授权问题彻底达成共识。上半年,《移动互联网服务可访问性安全要求》和《智能体任务执行安全要求》相继发布,两份团体标准对于智能体利用无障碍权限操作App的态度存在明显差异,前者主张有条件允许,后者禁止。
12月2日,云计算标准和开源推进委员会联合中国信息通信研究院发布《端云协同智能体交互双重授权安全指引》,其中提到,智能体在访问第三方应用时,应遵循核验规则,不得通过模拟用户行为、伪造交互事件等方式绕过验证。
AI代理操作,如何确保是依据用户真实意愿?
南都·隐私护卫队关注到,豆包手机助手首发同日,摩根士丹利研报指出,尽管豆包演示版本展现了丰富的功能生态系统,但其落地执行面临重大挑战。这种深度的系统级整合需要修改操作系统,直接触动了手机厂商的利益核心。
对于多数App而言,用户与应用之间的交互越多,其商业变现路径就越丰富。一旦用户交互行为被AI代替,App失去作为流量入口的价值,依靠广告分发、收佣金、用户停留时长赚钱的App或无法立足。
AI智能体与App争夺流量入口的背后,关乎利益分配和商业模式的重构。而这样的博弈,不只发生在国内。
近期,亚马逊因无法忍受AI伪装成用户在平台购物,将人工智能初创公司Perplexity AI告上法庭。亚马逊认为,使用该公司的浏览器智能体Comet AI代替用户购物,降低用户体验,引入了隐私漏洞,要求禁止此类行为。
Perplexity则表示,亚马逊此举并非为了保护用户利益,而是增加广告收益。
Comet AI在用户授权下执行任务,与用户本人拥有同样权限,无需额外标明身份,亚马逊无权干涉用户选择哪一款AI代理。它还强调,Comet AI的凭证仅存储在设备本地,主要代替用户完成点击、输入等操作。
二者的回复不约而同指向“保护用户利益”,由此延伸出一个问题——当智能体在网络上行动时,如何证明它能代表用户的真实想法?
在对外经济贸易大学法学院教授、数字经济与法律创新研究中心主任许可看来,智能体访问行为的合法性基础来自用户的授权。如果智能体真实准确地理解用户,并且不存在恶意操作的情况,其行为具备合法性和有效性。
不过,这种做法带来的两方面法律问题值得探究:一是如何保证用户授权行为是在合法自愿的情况下作出,智能体需要清晰、准确告知用户相关情况,不存在欺诈、胁迫等行为;二是智能体能否准确理解用户意图,不存在故意曲解、恶意操作等,“这两点都存在不透明性,我们没办法知道它会不会做手脚。”
还有观点提出,这类AI代理行为,仅用户同意就够了吗?在亚马逊与Perplexity与纠纷中,显然前者不这么认为。亚马逊坚持,AI代理购物时必须表明身份,而不能绕开其风控、反爬虫和隐私审查等关键环节。
在一篇分析亚马逊诉Perplexity案的署名文章中,许可指出,AI智能体彻底改变了数据的命运轨迹。一旦获得授权,它就能以自动化方式系统地批量获取可机读数据,并可能抓取用户信息以外、关涉他人权益和企业权益的其他数据。
也有专家指出,AI手机在为用户带来便捷智能体验的同时,改变了移动互联网时代的数据生态,打破了应用间数据相互隔离的格局,强化了终端厂商和模型服务提供商对数据的控制能力,多元主体竞争博弈下数据安全和隐私保护的责任问题变得更加复杂模糊。
多主体数据收集和处理会引发责任认定困境。“往常处理问题的逻辑是‘谁干的谁负责’,但是这个链条不支持这种思路。如果没有明确的责任规制制度,出了问题没人承担,这项技术是走不远的。”陆俊秀说。
不难发现,AI“接管”手机后,如何在用户体验、平台规则、隐私安全之间找到平衡,将成为决定这一技术生态未来走向的关键。而这道必答题,还需手机厂商、App、用户等共同来解。
采写:南都N视频记者 樊文扬