AI 二次开发如火如荼,商业化应用雏形显现论文

2024-05-09 09:10:53 来源: 作者:xieshijia
摘要:ChatGPT给这个世界带来的冲击是巨大且深远的。比尔·盖茨称GPT是“40多年来最革命性的技术进步”,阿里张勇也说:“所有行业都值得用大模型重做一遍”。
ChatGPT给这个世界带来的冲击是巨大且深远的。比尔·盖茨称GPT是“40多年来最革命性的技术进步”,阿里张勇也说:“所有行业都值得用大模型重做一遍”。
随着百度文心一言、阿里通义千问等同类产品陆续开放接口,面向企业提供服务,一场巨头的AI大模型竞赛已轰轰烈烈地展开。这些AI大模型何时可以应用于产业,首先会落地哪些行业和场景,成为人们关注的焦点。
现在得到最普遍认同的,是AI可以在办公软件、社交文娱、营销广告、家庭助理四大方向得到率先应用,而且当前AI应用创业已经热起来了。
辅助办公与代码掀起效率革命
2023年3月,微软正式将GPT-4接入到Office工具,推出了AI版Office“全家桶”。在此之后,协同办公平台、办公软件工具、用户管理系统、代码编程及数据分析应用都掀起了接入类ChatGPT技术的潮流,以较低的月费实现办公智能化。
首先来看看AI版Office“全家桶”。Word中,AI能秒出草稿,并根据用户要求增删文字信息和配图;PowerPoint中,AI能快速将文字转换成专业水准的PPT;Excel中,AI将数据分析变得轻松高效,能快速提炼出关键趋势;Outlook中,AI能给邮件分类加精,并自动撰写回复内容;协同办公时,AI能总结规划成员的工作进展、调取分析数据、做SWOT分析、整理会议核心信息。
紧接着在2023年4月,钉钉接入阿里通义千问,用户输入一个“/”就能调动10余种高能AI能力,包括自动生成群聊摘要、辅助内容创作、总结会议纪要、草图变小程序等,为2 300万家企业提供智能转型抓手。
同样在4月,百度官微宣布文心一言在百度内部全面应用在智能工作平台“如流”上,助员工在思路构建、协作沟通、方案策划、代码编写等方面提升效率;金山办公也正式推出具备大语言模型能力的生成式AI应用“WPS AI”,包括文本生成、多轮对话、润色改写等功能,计划嵌入金山办公全线产品。
“AI+办公”不仅是大厂的游戏,也是众多中小办公软件公司的机会,包括文档协同软件公司Notion、知名写作辅助工具Grammarly、热门文档编辑工具ChatPDF、知名PDF服务商福昕软件都推出了大模型应用产品,从更具体的切入点帮人们提高效率。
早在2023年2月底,Notion就推出了基于ChatGPT的企服工具Notion AI,每个用户每月只需支付10美元,就可以让AI辅助总结会议记录、修改优化内容、生成表格清单、起草电子邮件等。Notion官方公告称,内测发现用到AI生成稿件的用户相对较少,AI改善写作功能被调用得更多,就像是美图领域的一键美颜一样。
知名写作辅助工具Grammarly最近推出了一款名为GrammarlyGo的生成式AI工具。它可以扫描电子邮件内容,对其进行总结并根据选定的语气起草回复,包括“有说服力的”“友好的”“外交的”等多种语气可供作者选择。用户每月可以免费获得100次提示,每月支付30美元或年支付144美元,可以获得每日500次提示服务。
ChatPDF是另一个同期热门类GPT应用。用户将200页以内的PDF文档拖入,ChatPDF马上就能“读懂”整个文章的内容。首先它能够生成一个摘要,大致总结文档的要点,然后用户可以在对话框进一步追问更多问题,ChatPDF能根据文档内容进行回答。这一应用面向三类场景:一是面向学生提供帮助,包括回答教科书、讲义及演示文稿中的问题,节省学习时间;二是面向工作群体,包括对财报、项目业务方案书、法律合同等文档快速提取所需信息;三是面向有奇思妙想的人,包括从历史文献、诗歌和文学作品中发现新见解和答案,开阔视野。
国内PDF文件行业也有类似动向。福昕软件宣布基于ChatGPT的新功能已处于部署阶段。还有一些细分赛道,国内玩家走在了前面,比如国内电子签约SaaS提供商上上签推出行业首款AIGC工具“哈勃”。哈勃基于智谱AI自研的千亿参数大模型GLM-130B打造,能通过连续对话帮客户实现电子签约合同的检索、执行概况解读、重点识别、筛选标识、分类归纳功能。
ChatGPT不仅触及了一般办公市场的大蛋糕,更潜入了互联网、金融等行业的办公赛道。比如在互联网领域,微软旗下Copilot X、亚马逊CodeWhisperer,国内的华为云CodeArts Snap、硅心科技的aiXcoder XL等,都利用AI大模型算法辅助程序员编程,大大解放了程序员。
在这一赛道,国内创企也成果初现。比如aiXcoder就比Github推出的Copilot更早,并于2022年6月推出了国内首个代码生成预训练模型产品aiXcoder XL,支持由自然语言输入到完整编程语言的输出。
尽管互联网赛道是离ChatGPT最近的,但垂直办公赛道接入ChatGPT的机会还有很多,包括金融、政府、法律等各个垂直办公领域都有可能出现更多新应用。
社交文娱是AI落地的绝佳场景
搜索引擎是一个相对较传统的行业,随着全球第二大搜索引擎微软Bing在2023年3月接入ChatGPT,这一行业迎来了划时代时刻。
在AI版Bing中,用户可以输入最长1 000个字符的问题或想查询的内容,它就会以聊天的方式,直接将答案或建议回复给用户。这使得搜索引擎谷歌面临25年来的最大威胁。
在国内,百度搜索、360搜索引擎等都在加速与AI结合。比如360集团就推出了自己的大语言模型360GPT及360智脑服务。而在垂直搜索领域,比如知乎平台也联合大模型企业面壁智能推出了“知海图AI”中文大模型,已运用于知乎的“热榜摘要”,有望进一步应用到搜索框。
AI版搜索引擎将成为互联网巨头的必争之地,虽然国内搜索引擎巨头都还没有正式动作,但每一家都明白AI大模型已经改变了原有的搜索引擎游戏规则。
影视和游戏是两块大蛋糕,无疑是生成式AI落地的绝佳场景。从游戏社区的聊天助手,到游戏素材的AIGC,再到文本生成视频,多模态AI有望带来游戏影视领域的效率革命。
2023年3月,知名游戏聊天社区Discord推出了基于ChatGPT的聊天机器人Clyde,它可以被用户召唤到对话中,实时多轮回答用户的问题,还可以向频道发送GIF动图,推荐音乐及其他内容。
在国内,米哈游正准备加入国内知名大模型创企MiniMax的新一轮融资;腾讯的AI Lab已经将AIGC技术应用于王者荣耀等旗舰游戏;众多游戏公司都在招聘网站挂出寻找AIGC工程师及美术设计师的公告。
在影视领域,图像及视频工具大厂Adobe发布公告,宣布旗下的视频创作应用Premiere Pro将发布新AI功能。这是Adobe发布AIGC创作功能“萤火虫(Firefly)”后的最新动作,支持用户像编辑文字一样处理视频,届时有望引起影视创作领域的革命。
国内企业也已有布局,创立于2020年的计算美学(Nolibox)是清华大学孵化的科技企业,目前已推出了全球首款可商用视觉设计数据集,旗下核心产品包括AIGC工具“画宇宙”、智能设计引擎“图宇宙”,下一步计划推出AI设计创意平台Yeahpix。AI大模型正在影响人类艺术,正如计算美学联合创始人黄晟昱所说:“智能设计之于设计行业,正如自动驾驶之于交通行业。”
营销与广告已感受到失业的威胁
20年前,互联网技术改变了人们买东西的方式,现在,ChatGPT将消费变革再向前推了一步。智能客服、商品推荐、广告策划、直播卖货、客户管理等各个环节都将被极大改变。
首先ChatGPT将改变从前“傻瓜机器客服”这一情况。让智能客服真正理解客户的需求,基于客户诉求创作营销内容,根据数据分析营销效果,真正的智能客服能做的事远不止向客户介绍产品。
采用ChatGPT,Shopify一方面升级智能客服功能,帮商家与客户沟通更顺畅;另一方面,商家可以通过ChatGPT获取平台商品评论数据分析、标题及关键词优化、营销文案撰写、网站智能化开发编程等多项服务,提升运营效率。智能客服作为ChatGPT最直接能落地的领域,一定会很快入驻各大电商平台,让一批不具备更多技能的客服被替换掉。
ChatGPT还有一些营销场景应用围绕垂直领域展开,革新推荐算法的逻辑,让产品卖点更精准地触达目标客户。比如,海外生鲜电商平台Intacart的食物搜索工具,其基于ChatGPT推出了面向食物推荐的应用,与来自75 000多零售合作商店的产品数据结合起来,帮助客户找到购物的灵感。
当下国内众多电商的推荐算法都还是基于传统技术,因此也会出现“买过的东西依然推荐”的傻瓜做法,AI大模型有望彻底改变这些业态。
在直播电商领域,数字人的智商会慢慢变得更高,让人分不清它是人还是机器。智能数字人已成为众多上市公司和创企扎堆进入的领域。比如天娱数科的虚拟数字人已经接入ChatGPT等模型;虚拟技术提供商世优科技目前已将ChatGPT技术接入数字人产品当中;智能内容生成平台来画也在3月底正式接入ChatGPT,短短几十秒就能生成一篇高质量视频文案,并推出数字IP+直播模式。
再看看更深层次的客户关系管理环节,GPT技术依然是无孔不入,进化为智能咨询角色。
客户关系管理领域SaaS巨头Salesforce推出基于ChatGPT的CRM生成式AI产品“Einstein GPT”,据称可用于帮助企业销售人员、客户服务专员和市场营销人员高效率完成本职工作。比如可以帮销售人员撰写电子邮件,结合过往案例生成知识文章,为客服人员生成客户提问的特定答案。
同时,Salesforce旗下的办公协作软件Slack也推出了基于ChatGPT的应用,Slack将其应用积累的数据与ChatGPT相结合,为客户提供他们所需的信息,包括提供即时对话摘要、研究工具和写作辅助等,帮助数百万公司更高效地工作。
在生成式AI最擅长的内容环节——广告策划,已经有人感受到了失业的威胁。已有国内公关大厂决定“无期限全面停止创意设计、方案撰写、文案撰写、短期雇员四类相关外包的支出”。
其他产业链玩家也闻风而动。由大模型驱动的AI产品“加我智能”支持图文推广和活动策划两大场景,能自动生成推广图文,并理解活动目的,生成跨产品和功能的营销活动。谷歌也计划在未来几个月内将生成式AI引入其广告业务。
可以看到,无论是互联网广告商、广告公关代理龙头还是SaaS服务商,他们都在加快接入AI大模型的步伐。如果能将广告人从众多重复的机械化工作中解放出来,大卫·奥格威理想中的广告创意或许会离我们更近一步。
ChatGPT大多数时候主要作用于线上,但在线下消费场景也显示出潜力。
2023年2月底,国内服务机器人企业穿山甲机器人推出了首款接入ChatGPT的迎宾机器人,据称其支持超100种场景应用方案、百万级知识库和超140种语言选择,同时穿山甲机器人还将其他系列机器人也接入ChatGPT。国内AI服务器机器人领军企业猎户星空也已经行动了,计划在近期推出接入大模型的服务机器人产品。
GPT-4发布使得世界要变了。这个“变”指的是什么?一是交互的革命。2007年,乔布斯发布iPhone时就是一个交互革命,触摸键盘由此替代了物理键盘,软件定义了不同键位的形态和用法,现在随着GPT-4的到来,触摸键盘将可能进一步被语音交互替代;二是社会生产力变革,生产效率会大大提升。其中前者对机器人领域影响较大,而后者对内容产业影响力较大。
不过,实体机器人是从软硬件开发到工程化落地运营链条更长的载体,如何让产品真正解决场景刚需,是这个赛道玩家面临的重要问题。实体服务机器人企业能否找到刚需场景,一整套机器人技术链能否支撑其实现产品化十分关键。
AI技术正在切入个人智能生活
在ChatGPT刚发布时,就有开发者试验将Siri接入ChatGPT,而后一些企业也迅速行动起来。比如智能语音服务商Josh.ai宣布已开始使用ChatGPT进行原型集成。在一段概念验证视频中,当用户说:“孩子们回家的时间快到了,天快黑了,你能确定一切都准备好了吗?”语音助手就能打开走廊上的灯,开始预热烤箱,拉下窗帘,做好所有准备工作。
Josh.ai的联合创始人卡佩克拉特罗认为,新一代聊天机器人系统将使语音助手变得更加高效有用,如果不采用ChatGPT类技术,像Josh一样的企业一年之内就将不复存在。
家庭还是教育的园地。国外教育应用平台Quizlet率先采用了ChatGPT,推出了一款基于ChatGPT的家教软件,名为“Q-Chat”。不同于许多企业希望ChatGPT来帮其回答问题,Q-Chat通过有趣的聊天体验,根据相关学习材料提出可选问题吸引学生。其从Quizlet的大量教育内容库中提取知识,能够测试学生学习情况,提出深入的问题,帮助学生学习语言,鼓励学生养成健康的学习习惯。
美国教育平台多邻国(Duolingo)上的新Roleplay机器人已经可以与法语和西班牙语学习者聊天,纠正他们的错误并提出建议以提高他们的词汇量。公司对大语言模型进行了二次开发,使其以教师身份出现,应用发现没有两次对话是相同的,教师会随着学习者的进步变得更高级。
美国可汗实验学校的Khanmigo基于GPT-4等模型开发了个性化学习工具,比如“辅导我”模式和针对不同科目的测验模块。首席学习官Kristen DiCerbo说:“GPT-4对于K12主题的问题回答最准确,但对于小众主题则不太准确。”
国内也有一些教育领域企业采取了措施。比如国内知名教育机构学而思传出正在自研数学大模型MathGPT,将于年内推出基于该自研大模型的产品级应用;科大讯飞发布了认知大模型成果,并演示了“大模型+AI学习机”的功能,包括批改作文、模拟口语老师实景对话等。
汽车越来越成为很多家庭必不可少的工具,也是大模型渗透进家庭场景的最佳载体之一。2023年3月,通用汽车率先宣布引入ChatGPT,将基于Azure云服务和OpenAI技术来开发一款新的虚拟汽车助手。通用汽车副总裁Scott Miller称,ChatGPT可以帮助车主获取车辆使用的相关信息,或从日历中整合日程安排提醒车主待办事项。例如,聊天机器人可以在仪表板上出现诊断灯时建议驾驶员采取什么行动。
另外,ChatGPT还可能用于汽车功能以外的语音控制。比如从“打开我的车库门”到“计划一条去医生办公室的路”,再到“为我预留一个充电点”,诸如此类语音控制都可以实现。
而在近期的车展中,GPT大模型“上车”成为热门话题,包括阿里通义千问、百度文心一言、商汤“日日新SenseNova”等在内的大语言模型落地了数十款热门车型。
可以看到,教育、出行等都成为AI大模型落地个人消费场景的重要切入点,实际上不止于此,人们还有更广泛的运动、医疗、美容、法律咨询等方面需求,这些都有望成为AI大模型挥动“魔法棒”的领域。
短短两个月里,企业侧对大模型的引用已从简单的API接入进化到了基于场景需求的二次开发,从简单的对话功能升级为了结合语音、图像等多模态多终端的复杂交互。尽管还有很多产品和商业模式都不成熟,但也有不少应用展现出了商业化的雏形。
