含金量如何?将如何改变社会?.....四问AI大模型“竞赛”

日期:2023-10-17 14:58:36 / 人气:110

含金量如何?它将如何改变社会?.....关于AI大模型“比赛”和“百模型大战”的四个问题正在如火如荼的进行中。
今年以来,生成大模型的热情越来越盛,国内企业和科研机构也告一段落。3月,百度“文易欣言”拉开帷幕,4月,阿里云“依桐钱文”、复旦大学“莫斯”、360“360智脑”上线。与此同时,科大讯飞、商汤等AI(人工智能)公司相继进入市场,百川智能等大模特创办的公司也开始涌现。据不完全统计,截至目前,国内公开的大型模型已经超过230种。
8月31日,首批通过备案的生成式人工智能大模型开始陆续向公众开放。当大型机型正式进入应用阶段,此时此刻,人类社会是否已经如英伟达创始人黄仁勋所说,迎来了人工智能的“iPhone时刻”,还是未来将证明这只是一个“泡沫”?等风退了,潮退了,盲目跟风进大模的公司才知道自己在裸泳?
大模特目前的“含金量”如何?
大部分都不是真正的创新。
到目前为止,国内发布了多少大型机型?这一点众说纷纭,但大机型数量超过100款已经成为行业共识。
5月28日,中国科学技术信息研究所所长赵志庚在中关村论坛上发布《中国人工智能大模型图谱研究报告》称,据不完全统计,全国已发布大模型79个,从地区来看,北京和广东最多。腾讯研究院副秘书长王洋表示,今年7月,中国大型模特的数量已增至116个。优客德首席执行官季昕华在2023年世界人工智能大会上表示,中国有130家公司在开发大型模型。
另一方面,越来越多的大型机型选择开源。7月19日,Meta携手微软宣布LLaMA 2正式开源商用。9月25日,阿里云开源问140亿参数模型Qwen1B及其对话模型Qwen-14B-Chat,免费商用。
几款大型机型的开源意味着,如果你想进入“百款大战”,技术似乎不是问题。
“现在外面公开发布的大型号很多,真正拥有自主研发创新技术的可能不超过十个。”9月25日,某研究院一位负责为企业提供大型模型落地服务的AI从业者告诉贝壳财经记者,“如果你想买大型模型,只需要‘复制’我们的模型就可以了。”
在她看来,企业客户的大模型能否在风起云涌的大模型热潮中与众不同,取决于企业自身的数据质量以及基于此的大模型微调。
采访中,很多企业家和专家都认为,大模特本身的存在已经不再稀奇,这可能是“百模大战”能够出现的原因。在这种情况下,如何“利用”大模型,相当考验智慧。
创新工场执行董事、前沿科技基金总经理任对贝壳财经记者表示,虽然目前很多企业都在投资建设大型模型基座,但“百款大战”最终会有几家头部公司胜出,包括技术产品出色的巨头和初创企业。对于AI初创企业来说,应用层和中间层的创业机会更多。
在他看来,“百模大战”中有很多大型的模型技术,基本都是企业自己用,或者给行业内其他人用。“‘百款大战’不是只有豪门才有门票的比赛。战争的结果很可能是巨头和初创企业中为数不多的科技产品领域的领导者。”
印象研究院负责人常程告诉贝壳财经记者,时至今日,大语言模型的基础算法早已开源。GPT4之所以能达到现在的高度,并不是它在模型中掌握了多少“独门秘籍”,而是在模型训练过程和训练数据处理中积累的多年经验。"这些经验所涉及的技能是从大量失败的实验中积累起来的."
被《时代》杂志评为“全球100大AI人物”之一的中科院自动化所研究员曾毅在接受贝壳财经采访时表示,中国绝大多数的大模型仍然没有真正的创新,绝大多数的努力仍然在工程优化上。因此,未来还需要一系列的努力来提高基础模型处理复杂问题的泛化能力,真正做到在数据规模上能耗更少,但表现出更高的智能,在模型算法结构和系统上实现协同创新,而不仅仅是提升用户体验。
为什么要做大模型?
在交互方面的优势无与伦比。
“我们从去年年底开始关注ChatGPT(OpenAI开发的OpenAI聊天机器人程序)。我们发现大模型与我们的研发路线和我们需要解决的一些产品问题有很多共同点。”9月21日,融AI研究院院长刘杰告诉贝壳财经记者。
刘杰说,大型模型技术的落地其实并不复杂。“大比例模型的技术方案是比较清晰的,但是还有一些技术细节,包括我们用什么规格的模型,如何实现并行多机多卡训练,需要多少数据,什么样的数据,数据质量。我们在工程细节上花了很多时间。其中一些技术细节需要反复摸索和调试。之后,如何将大的模型和具体的业务场景结合起来,做出更好的匹配,才是我们下半年需要重点关注的。”
“为什么这一波大模特这么火?因为真的实用,大模型在交互上的优势是无与伦比的,ChatGPT已经证明了这一点。另外,上一代人工智能,比如计算机视觉,落地成本很高。需要配备摄像头,软硬件,不容易落地。相比之下,大模特在很多行业都有落地场景。”上述AI从业者表示。
她告诉贝壳财经记者,国内企业一定要发展自己的大模型的另一个原因是,国外能开源的大模型“肯定不会是最好的”,要求不高的业务可以承接,但很难走得更远。此外,还可能存在数据安全问题。
在刘杰看来,大型号技术确实可以转化为生产力。“大模型可以升级企业现有的AI能力,例如更高的图像识别精度和更好的文本生成。大模型有很好的基础知识和能力,只需要很少的数据训练就可以应用到新场景和新业务中。我们有了AI大模型后,很多之前做得不够好的能力都可以在产品中实现,比如灵活问答、上下文理解等。在业务逻辑上,我们不断深化AI能力与服务的紧密耦合,最终必须实现真正的AI原生智能产品。”
对于“百款大战”行业的现状,刘杰认为,竞争态势既然存在,就是合理的。“在一项技术或者一个商业模式进入完全成熟之前,大家可能对它有很好的预期,希望在战略上抓住机会,于是就从各个角度切入,进行探索。事实上,从AI技术发展的角度来看,如果谷歌和微软没有从不同的角度探索技术架构,他们可能看不到现在的AI大模型。所以‘兄弟爬山,辛苦了’,从不同的山坡向山顶进发,探索不同的方向。也是有意义的。”
为什么产品要和大模型联系在一起?
AI产品爆发前夕。
贝壳财经记者注意到,截至目前,已有不少公司在产品中接入了大模型的能力。
9月26日,果壳财经记者打开百度搜索首页时,发现搜索框下最左边的选项不再是“网页”,而是“AI对话”。点击进入后,他可以切入“AI助手”的界面,直接向大模型提问。记者发现,如果进入“AI助手中心”,用户甚至可以用AI创建“高清逼真图片”或“模拟恋爱体验”。
8月22日,钉钉总裁叶军公布了钉钉全面智能化的最新进展:17个产品线、55个场景已全面接入大模型,完成智能化再造;钉钉同时向生态伙伴和客户开放智能基础AI PaaS(平台即服务),表示将“用大模式帮助生态重新做产品。”早在四个月前,叶军就在京展示了钉钉入驻大模型后的一系列功能,包括使用AI生成推广文案、使用画图创建应用、在视频会议中生成总结等。
Evernote也是悄然推出大模型能力的产品之一。早在4月21日,果壳财经记者就发现,通过App的“新超级笔记”功能,可以使用AI进行总结、续写和翻译文档。在交互设计方面,AI的很多功能都标明了具体的场景,比如“写作文”“面试提问”。
“我们不希望用户把大语言模型当成事实核对的知识库系统,因为它本质上是一个统计模型。我们应该把大模型当成一个推理工具。如果要写采访稿,大模型可以胜任一步推理,但对于特别专业的问题,用户至少要能判断出结果的好坏,不能单纯指望语言模型完全代替用户自己。当然,我们会继续调优印象AI模型。”Evernote董事长兼CEO唐毅告诉果壳财经记者。
很多受访者表示,目前,我们还处于AI产品爆发的“前夜”。或许现在的生成式大模式已经开始改变人们的生活,但这一切都是悄然发生的,就像iPhone出现后智能手机的普及过程一样。值得注意的是,8月31日首批通过备案的生成式人工智能大模型开始对外开放后,多个大模型的访问量整体上升。
方正证券发布的研报显示,百度文心伊彦、讯飞星火、商汤讨论认为,8月底一波访问量上升,主要是政策批准的大模型商业化。百度文新伊彦的流量增长最为明显,这可能是由于百度在搜索引擎的流量优势。具体来说,“文新伊彦和讯飞星火的浏览量明显高于其他三家厂商。同时注意到,商汤协商的平均访问时长更长,主要是商汤模型编程、图像生成、模型预标注等功能吸引了更专业的用户。字节豆包的浏览量和平均访问停留时间一度激增,但随后有所下降。”
百度9月22日发布的首份《文颜用户使用报告》显示,其最大的用户群体是一线和超一线城市的中青年农民工,占比最高的两个行业是IT互联网和教育,前三大使用场景是知识问答、文字创作和代码能力,24小时每分钟都有人问文词。从行业分布来看,IT互联网、教育、社会公共管理、医药卫生、能源、矿业化工、金融保险、日用品等七大行业占比超过50%,其中IT互联网和教育用户占比最高,每4个用户中就有1个工程师和教师。
目前一些数据可以大致看出未来不同大模型之间可能存在的差异。方正证券研究报告数据显示,从受众兴趣云图来看,讯飞星火、文新伊彦、字节豆包、依桐钱文在新闻资讯、门户、检索方面的用户兴趣较高。字节豆包在书签吧、互联网、电视剧等感兴趣的领域占有较大比重。商汤讨论的用户兴趣包括产品经理、数据库、互联网工具、云计算等。可见以工作为目标的用户相对较多。
大模型将如何改变社会?
将引领一场新的工业革命。
今年以来,由于越来越多的观点认为大模式将从根本上改变现有的行业和主流产品,大模式变得炙手可热。正如英伟达创始人黄仁勋所说,就像iPhone的出现改变了手机市场一样,AI也到了它的“iPhone时刻”。
创新工场董事长兼CEO李开复也是这一观点的赞同者之一。早在今年3月,创新工场就将“Project AI 2.0”放在官网首页,并表示将在全球范围内寻找AI大模型、语言生成模型、多模态等领域的优秀技术人员和研究人员。
李开复在中关村论坛上表示,大的模式改革不仅仅是人工智能,还会在公司之间产生巨大的平台差距。脱颖而出的公司一定是“无AI大模式”,即“AI第一”。在他看来,AI大模型是一个绝不能错过的历史机遇。这将是有史以来最大的平台,比windows和Android大10倍。它将重写每一个应用,重构人类的工作,将人的智能放大10倍甚至更多,取代大量的重复性工作。
对此,任表示,“我们将AI 2.0生态系统分为基础模型层、中间层(工具层)和应用层。相对来说,应用层和中间层的创业机会更多。AI 2.0的平台生态一旦建立,市场规模将比Windows和Android大十倍。我个人是PC时代出生的。在当时的互联网时代和之后的移动互联网时代,我接触新事物的能力还可以,但现在很多孩子都是AI时代出生的,他们的教育模式和职业选择都需要创新,但好消息是孩子接受新事物的能力会强很多。AI 2.0的创业者也可以大胆琢磨,在应用端开发一些聚焦年轻一代需求的新应用。”
9月25日,360在给果壳财经记者的采访回复中表示,大模式不是风口,也不是泡沫。大模型作为新一代生产力工具,将引领新的工业革命,赋能行业数字化发展。未来不会只有一个大模型,而是会像数据库一样成为每一个数字系统的标配。
360方面表示,目前国家的重要战略之一就是产业数字化。因此,中国的发展模式也要抓住产业机遇,赋能数百个产业,推动工业数字化向智能化升级,达到数字化的巅峰。但一般的大模型无法直接用于企业级场景,存在商业深度不足、无法“理解”企业、数据安全隐患等六大问题。因此,大模型未来的发展趋势是“垂直化”,这也将成为中国在全球大模型技术竞争格局中的又一条突破路径。
“目前大模型是一个可以放大人的能力的工具,就像互联网是一个很好的提供信息的工具。大模型是一个很好的智能工具,可以帮助我们处理信息,与外界进行交互和响应,有很多应用场景。它的表现如何从根本上取决于使用工具的人和它所处的场景。在很长一段时间内,行业仍然要专注于如何开发和设计大型模型,然后以合理的成本将其应用到合适的场景中。”刘杰说。
新京报壳牌财经记者罗一丹
编辑张兵校对贾宁”

作者:杏彩娱乐




现在致电 8888910 OR 查看更多联系方式 →

COPYRIGHT 杏彩娱乐注册登录平台 版权所有