全国服务热线 4001334566
语言
关于我们

Company Profile

[技术前沿]谷歌携PaLM2迎接大模型准备反击

05-12

据天华中威科技小编了解,近日,美国加利福利亚山景城,谷歌在今年I/O开发者大会上,没有过多展示Android及手机硬件技术,反而将人工智能技术放在了重点。不仅推出了全新的大语言模型,还如微软一样,谷歌将这项AI技术融入到了旗下各种产品当中,如搜索、电子邮件、翻译。

最引人注意的是,做为全球最大的搜索引擎公司,也是AI行业的领军企业,但从去年底开始随着OpenAI发布ChatGPT这项可能改变人们消费和创建信息方式的AI技术以后,谷歌的业务从根本上受到了威胁。此次的I/O开发者大会,也被视作为谷歌的反击。

从语言模型开始

2022年4月,谷歌推出了该公司的高级语言学习模型PaLM,并将其应用于许多不同的生成式AI应用程序,包括聊天机器人Bard。但在Bard发布之初,其糟糕的表现以及错误百出的回复,让人们对谷歌的AI技术表示怀疑,而此次的I/O开发者大会,也是谷歌证明自己的时刻。


图片

图源:谷歌

此次谷歌宣布推出PaLM 2,并将其作为OpenAI的GPT-4的直接竞争对手。谷歌CEO桑达尔·皮查伊表示,得益于广泛的逻辑和推理培训,PaLM 2模型在逻辑和推理方面更强大,它还接受了跨越100多种语言的多语言文本训练。

据谷歌高级研究主管Petrov透露,PaLM 2在一系列基于文本的任务上表现更好,包括推理、编码和翻译,与PaLM 1相比,有了显著的改进。

Petrov还现场展示了 PaLM 2如何能够理解不同语言的成语,当输入德语短语“Ich verstehe nur Bahnhof”,不仅回复其字面意思是“我只理解火车站”,还能表示出实际意思是“我不明白你在说什么”。甚至谷歌工程师认为,目前 PaLM 2系统的语言熟练程度,已经足以教导人们学习该语言。

与其他的大语言模型一样, PaLM 2与其说是一个产品,不如说是一个系列,该系统有四种版本可选,从小到大分别命名为 Gecko、Otter、Bison和Unicorn,分别针对消费者和企业环境。

如在演示中,一个接受健康数据训练的 PaLM 2版本,谷歌方面表示它可以回答类似于美国医学执照考试中的问题,不准确的推理减少了9倍,已经媲美专家水平;而另一个受网络安全数据训练的 PaLM 2版本则可以发现潜在恶意脚本的行为,并帮助检测代码中的威胁。

而最轻的版本 Gecko可以在智能手机中本地运行使用,每秒能够处理20个Token,大约相当于17个单词。这种语言模型的小型化意义重大,因为在云端运行成本极高,如果可以实现本地化,不仅可以极大地降低成本,并且还能保护个人数据安全。

目前 PaLM 2已经被用于支持25种功能和产品,包括聊天机器人Bard。让Bard的编码能力得到显著提升,可以帮助进行代码调试、协作和探索,还支持20种以上编码语言,能够自动进行代码引用。

与其他生成式AI相比,谷歌表示,使用 PaLM 2的Bard即将推出新的视觉功能,在回答时能够包含图像、表格或地图。并且Google Lens也将登陆Bard,允许用户将照片上传至Bard并询问有关照片的提示。这也意味着,Bard拥有了识图能力。

同时,谷歌还宣布正在开发一项名为Universal Translator的实验技术,该技术可以将视频从一种语言翻译成另一种语言,同时保留整体基调和氛围。工作流程是首先检测单词并进行翻译,随后它会检查说话者的语气以及他们强调的内容,结合这两个方面,来生成目标语言的语音。最后,会根据生成语音的发音同步视频中说话者的口型。

不过谷歌考虑到这项工具可能会被滥用来创建虚假视频,因此限制了普通人对这项技术的访问,并且只有谷歌授权合作伙伴才能将其用于建设性项目。

用AI,谷歌将“搜索”转向“对话”

值得注意的是,在此次大会上,皮查伊表示,谷歌正在重新构想所有的核心产品,包括搜索。对于一家以搜索引擎起家的企业而言,近期被微软的New Bing压制,也让谷歌迫切的想要证明自己。

大会上,谷歌推出了的搜索机器人——SGE。新的搜索将由AI技术驱动,可以为用户提供简洁的信息查询以及丰富的对话式答案。不过为了避免生成式AI过剩的创造力,谷歌对其进行了严格的选择,从而防止AI谈论自己的感受。

图片

图源:谷歌

新的谷歌搜索与New Bing的Chat对话类似,当进行搜索查询时,会得到一大段由AI生成的文本,这些文本便是所要寻找的信息,从网络上不同的来源收集而来,并以类似人类的语气编写。与New Bing一样,回答的文本会提供信息来源,同时也会在一旁显示出与搜索内容相关的链接。

这也是谷歌20多年以来对搜索引擎进行的最大改变,将过去的“搜索”转向了“对话”。但目前这些生成式AI在进行回复时,可能会生成错误或者编造的答案,这类现象被称为“幻觉”(hallucination),这类错误也是大型语言模型所遇到的常见问题。

为了解决这一问题,谷歌搜索副总裁Liz Reid表示,目前已经对SGE进行了培训,因为SGE是谷歌旗舰产品的核心部分,应该具有更低的误差幅度。

一个值得注意的点是,谷歌表示,如果对其来源的可信度或涉及某些主题的可信度存疑时,如医疗剂量建议、正在发生的当下新闻事件等,SGE便会选择不回答查询。目前这一技术正在小范围测试当中。

尽管谷歌方面强调,目前SGE还只处于实验性质,但他们也认为,这对用户的搜索方式将造成一个颠覆性的改变。

从微软到谷歌,目前看到这些企业都开始不约而同的选择将搜索向AI对话模式发展,可以认为这一趋势也代表了搜索引擎未来的发展方向。但问题在于,尽管目前的问答回复都给出了原文的链接,不过由于AI直接给出了答案,久而久之,会打击人们在网络上进行分享的动力,比如旅游推荐、游戏攻略、食谱等。

并且对于搜索引擎公司而言,搜索栏中的广告占其收入的重要组成部分,如果搜索内容都被对话式回复取代,那么广告形式也将发生巨大的改变。这种改变对企业营收而言,是好是坏犹未可知。

最后

当然,在这次大会上,谷歌还发布了Android 14以及首款折叠屏手机Pixel Fold,其中搭载自研Tensor G2芯片,还发布了Pixel 7a和Pixel Tablet平板电脑,同样搭载手机同款自研芯片。但在AI的映衬下,这些产品显得有些黯淡。

本次的I/O开发者大会可以看到谷歌正在全面拥抱AI,作为当前全球最具影响力的搜索引擎企业,谷歌引入AI对于搜索方式的改变将是深刻的。从目前New Bing的应用来看,对话式的搜索方式也极大可能成为未来搜索的发展趋势。

但这种搜索方式显然会对众多原创内容平台或者创作者造成不利影响,也将打击原创者的创作积极性,甚至可能有一定侵权的风险。尽管谷歌的高管们表示,他们的方法是在推广由人们创建的网站的同时,以深思熟虑的方式来使用新技术。同时谷歌方面的研究表明,用户仍然希望访问外部网站并听取其他人的意见。

Copyright © 2011-2023  北京天华中威科技有限公司 版权所有 京ICP备2023011416号-1 All Rights Reserved