IT研究中心
继往开来,创新无限

360版的GPT,好用吗?


比尔盖茨的评价,给本就火爆的GPT再加了一把火。


“这种人工智能技术出现的重大历史意义,不亚于互联网和个人电脑的诞生。”


从商界到学界,观点和产品都在井喷,这似乎昭示着AI时代已真正开启。 一众美国公司纷纷加入到这场竞赛之中,对于处在同一跑道的国内公司来说,如果未来一两年之内,自己的产品还没有被AI技术所重构,或许就意味着淘汰。 


热度正当时,市场也出现了别样声音。埃隆·马斯克等千名科技人士发出公开信,呼吁立即暂停训练比GPT-4更强大的AI系统,为期至少6个月。360集团创始人周鸿祎对此也隔空喊话,称不发展GPT才是最大的不安全,而就在前一天(3月29日),他现场展示了还处在实验阶段的360版GPT产品。 


重塑千行百业,不专属大公司


虽然现阶段GPT看起来只是个陪聊的玩具,但这只是它“亲民”的伪装,之所以能在短期成功破圈,是因为GPT使用SaaS化的方式提供了服务,让不熟悉AI的人也触手可得。实际上,GPT的终极目标是重塑千行百业,掀起新一轮的工业革命。 


首先是与搜索引擎和各种软件相结合,为人节省了大量筛选信息的时间;之后其背后的通用AI技术逐渐取代现有AI技术,就比如说,用GPT的通用AI技术帮助自动驾驶实现跨越L3;最后,当通用AI技术愈发成熟,它就能走向机器人、自动驾驶、制药等各种领域,解决各种问题,让每个人都能享受到AI技术所带来的红利。 


未来,GPT的成就也许会超越互联网,甚至超越蒸汽机,引领新的工业革命。打个比方来说,GPT就像发电厂,把大数据加工成电,传输到千行百业,届时所有的软件和商业模式都将被重塑。 


目前,中国的GPT技术和GPT-4的差距在2年左右,不过我国具有工程化能力和人口红利两大优势,未来并不遥远。 对于国产厂商来说,发展GPT具有三个难点:一在数据层面,英文数据是天然的训练语料,英文搜索数据更是适合GPT训练,国内小公司很难拥有完备的预训练数据集;二在算法层面,国内与当下海外的先进算法具有代际差异,不过这更多是工程学问题,随着人员交流和更多算法开源,会逐渐缩小;三是目前国内建设形态有些偏执,存在重复建设、重复投资的现象。[1]    


重重难点下,现阶段能够布局GPT的厂商少之又少,当全球厂商都紧张地投入在这一场军备赛时,国内大多数人也非常关注360的布局进度。 


坐拥国内市占率最高的浏览器、市占率第二大的搜索引擎以及第一大PC安全产品,360本身拥有大量优质中文语料,加之对全球数据的抓取能力和对垃圾信息的判别清洗能力强,每天筛选上万亿网页,可以使用更好的数据训练模型。 


2023数字安全发展与高峰论坛上,周鸿祎表示,为了满足大家好奇心,“提前把孩子抱出来给大家看看”,他所展示的是一套360搜索与360 AI(目前尚未正式命名的GPT产品)结合的产品雏形,并在现场随机选择问题进行提问。那么这款产品表现如何? 


▊ 01-表现较为出色 


从国际到国内,之所以每个厂商都不遗余力地把搜索引擎与GPT结合在一起,是因为长期以来搜索引擎存在大量无用或重复信息,GPT可以帮助我们归纳总结,节省在成千上万页的内容中筛选答案的时间。 


但相对应的,GPT偶尔也会编出林黛玉倒拔垂杨柳这样无中生有的故事,假若显示的结果不准确普通人很难验证准确性,所以这就对搜索引擎与GPT的配合提出了更高要求。 


从360的现场演示来看,作为一款GPT产品,360 AI具备初步的推理能力,每一次生成答案时都使用不同的逻辑重新表述答案。当被问及“卡塔尔世界杯冠军是哪个国家“时,360 AI输出结果基本正确,也能提供部分增量信息。 



把同样的问题抛给其它引擎时,GPT-3.5和GPT-4无法给出回答,不过毕竟两款模型没有接入搜索引擎,知识量存在限制;New Bing则也能够得出正确的结论,不过在判断问题的重点上与360 AI有所分别,数据信息更为详细准确。



在“周鸿祎为什么总爱聊GPT“问题中,360 AI指出了周鸿祎公开发言的前后矛盾点,证明了它的确存在逻辑推理能力。 



面对同样的问题,New Bing则不能察觉到前后的信息差,只能罗列和堆叠搜索到的信息,但整体表述也准确无误,不存在胡言乱语的情况。  



▊ 02-跟得上热点 


既然已经将GPT接入到了搜索引擎,那么生成结果的时效性就显得尤为重要了。这不仅需要搜索引擎足够强大,还需要GPT拥有强大的搜罗信息的能力。 


从现场演示中来看,360 AI能够找到当日上午刚刚被海外新闻媒体所报道的新闻(即马斯克叫停GPT-5的新闻),并能生成逻辑较为通顺、语句较为简洁的结果,同时能够初步推理预测马斯克等科学家的立场。  



由于缺乏接入信息,GPT-3.5和GPT4只能生成一些不相干的内容,此处暂且不讨论。New Bing则与360 AI不相上下,均可找到最新发生的信息,生成准确简洁的答案。  



▊ 03-越答越聪明 


以往搜索引擎没有加入GPT时,会根据用户的搜索频次、点击量等信息,归纳出相关度最高、质量最高的链接,并放在靠前位置。GPT则能通过每次与用户交流、交互、反馈过程中不断学习改进。 


现场演示中,就发生了颇为有意思的一幕。在第一次被问及“周鸿祎为什么老爱穿红衣服“时,360 AI的结果并没有完美地解释出“周鸿祎”被人们错称为“周鸿伟”。 



而当选择重新回答时,360 AI便重新生成了带拼音标注的结果,同时也生成了更多信息来解释这个问题。  



New Bing的回答则更为简洁,能够用最少的字数总结问题所在。不过相对来说,New Bing缺乏一定的增量信息。  



▊ 04-有情商 


国外厂商是GPT的先行者,迄今为止,大多厂商的产品也更贴合英文语境,这些产品来到国内偶尔会存在水土不服的现象。中文语境非常复杂,国产厂商更懂国人,所以国产GPT更要扎根本土化。 


现场,周鸿祎问了360 AI一个职场问题,它不仅指出了问题所在,还推理揣测了领导的心情,建议人们要以专业的态度和能力应对这种情况,就像一个驰骋职场多年的老油条。有意思的是,周鸿祎还曾使用360 AI生成过开场白。 



对比起来,GPT-3.5、GPT-4、New Bing生成的结果更像机翻,很难理解中文语义中更深层的意味。



人人都用得上的GPT


演示现场,周鸿祎多次提及360 AI还像一个没有满月的孩子,仍有很多缺点,需要多多宽容和支持,可谓是求生欲满满。此外,他也分享了自己对GPT商业化前景的看法。 


一是GPT拥有着无限的潜力,它会越来越智能。 


现在市场上充斥着两种声音,一种认为GPT是通过预训练而来的填空机,写得一手文章但不知所言,另一种则认为GPT拥有自主推理能力的智能。但其实,GPT是拥有智能的,只不过工作原理与人脑不同,就像飞机借鉴了鸟的飞行原理,但却不会扇动翅膀。 


人类的一大弱点是知识传承太慢,比如说人类总共写了大约1亿本书,而人类一辈子平均只能读到2万本书。反观ChatGPT现在已拥有相当于 300万~500万本书的训练量,GPT-4大约是4000万本。GPT能够实现了对人类所有知识的再次编码、解码、存储、推理,同时拥有无限的记忆力和全人类的知识成果,而这种智能相当于赋予每个人一个数字大脑,让知识源源不断地传承下去。 


二是GPT将是辅助人类的最佳工具,人类不会和工具竞争。 


一两年后,AIGC可以根据自己输入的关键词生成视频,很多人有天赋但没专业技能的人,也能将自己的想法变成产物。再向后五年,大多企业的数据都可以通过GPT构建为知识大脑,赋能整个公司。展望更远的未来,每个人都将拥有自己定制化的GPT产品。 


具有感知甚至是情感的GPT对人类来说并非智能神话或悲歌,GPT会不断辅助人类进一步提升生产力。而在这次革命中,会被淘汰的人是不会用GPT、不会问问题和对未来没有感知的人。 


对于这样的商业化前景,360的目标是让每个行业、企业、个人都拥有自己的定制化GPT,换言之,就是让技术触达每一个人。 


为了实现这样的目标,360将沿用“技术+场景两翼齐飞”的发展战略,计划推出一系列类GPT应用产品,实现商业化场景落地计划: 


  • 一是ToC端,借鉴New Bing的模式,将生成式AI与“360浏览器”“360搜索”相结合,用搜索引擎解决GPT乱说话的问题,同时解决搜索引擎现有的“链接鱼目混珠,竞价排名”的问题,利用智能搜索重获移动流量入口;此外,推出AI个人助理,为安卓手机加入智能Siri。 

  • 二是ToSME端,将生成式AI与ToB 即时通讯APP“推推”和“苏打办公套件”相结合,推出相关垂类应用。 

  • 三是ToG&B端,将国内最完整的安全大数据及最强大的安全专家能力赋能给360安全AI,实现定制化模型开发。 


总结 


纵览整场演示,虽然360 AI还像一个没有满月的孩子,仍有很多缺点,但效果已经超出预期,在特定情况下,有着接近GPT-3.5的水平。 


展望未来,360的大模型将会以2周一次的频率进行大版本迭代,在这样的更新频率下,360 AI也会不断进化。虽然我们无法判断AI未来将发展到哪个程度,但当浪潮来临,没有上车的只会被淘汰。 


[1] 本段难点分析由360AI提供特别策划




——转载自虎嗅APP微信公众号2023年4月2日发布文章