原阿里大数据专家,做了旅游Chat-GPT|天天通讯

发布时间:   来源:环球旅讯  

自去年10月至今,由OpenAI所引爆的通用大模型竞争越演越烈,国内外主流大厂都加入到这场“AI大爆炸”中。


(资料图片仅供参考)

视旅科技的技术团队在2022年5月就关注到相关学术研究,受到10月Chat-GPT海外引发热烈讨论以及12月初NeurIPS学术峰会的激励,其联合创始人兼CTO惠芃瑞便率团队开始研究通用大模型的垂类训练。

由飞猪前总裁李少华创立的视旅科技,定位为“面向目的地的数字化超级旅行社”,专注于面向目的地的旅游数字化创新,聚焦改变两件事情:一是改变传统旅行社的获客方式,以内容获客为主;二是重构目的地的产品和组织,通过DSP产品(目的地超级套餐)将消费者自由行的需求和目的地确定性的资源和服务进行有效匹配,消费者可以依托数字化整合的资源自行组合可落地的目的地行程,使转化效率提升、履约更有确定性。

在视旅科技的核心团队里,技术人员的比重很大,其中不乏从阿里等大厂离开的高P人才。惠芃瑞就是其中的代表,他是美国特拉华州立大学的数学博士,曾是阿里技术中台高级风控专家、飞猪数据智能高级专家。

惠芃瑞表示,结合成立至今视旅科技对目的地的持续深度布局,包括并购多家地接社等,通用大模型的进化和迭代让视旅科技看到了做旅游垂类Chat-GPT的可能。

“目前在应用层面,我们已经有产品在多个旅游场景落地。正是由于视旅科技前期在消费者个性化旅游产品、端到端业务系统、大数据及AI算法和目的地智能履约上的一体化投入,GPT应用才能脱出兴趣问答式的噱头,真正实现从需求互动到智能供给与履约的全面落地。这也坚定了我们做一家AI旅行社的信念。”

01

智能线路、一键成片

数字人直播……

想知道视旅科技应用垂类大模型的结果如何?用户已经可以上手测试了。

在视旅科技的面向C端的流量矩阵中,今年5月初至今,每天均有千余名用户打开乐派、金熊猫旅行的微信小程序,或者是打开欢萌旅行APP,体验旅行GPT、旅游AIGC等创新功能的产品交互和应用,目前上述应用只面向国内的香港、四川、云南,以及东南亚的新加坡和泰国等五个目的地产品。

在欢萌旅行APP首页,就可以清晰看到上方导航栏中的智能旅拍和底部导航栏的Chat旅行管家。

如果将Chat-GPT中最为用户广泛讨论的兴趣对话交互标准定为10分的话,环球旅讯实际体验欢萌旅行的Chat旅行管家发现,该垂类功能或许只能打到6分,但已经超出了预期。

当环球旅讯将旅行目的地设为香港,与Chat旅行管家沟通行程时,发现一些“有意思的细节”。

这份香港的两天一夜的行程可谓中规中矩,但行程可谓密集,适合首次去香港打卡的“旅游特种兵”等用户。

当再问及如何从广州到抵达香港时,Chat旅行管家给出了高铁、长途巴士、飞机三种方式,但当进一步询问哪种方式更好时,Chat旅行管家展示出“端水大师”的本领,提到三种方式各有各的好处,请君自行判断。

随后,环球旅讯向其提出第一天行程更改为香港迪士尼,Chat旅行管家还不忘结合大交通的需求,提到可以先到广州南站坐高铁到香港,并将香港迪士尼的行程整为一天的行程。

在每一回合的问答之后,Chat旅行管家都会给出相应行程建议和预订方案,用户点击定制行程即可按步骤预订,也可自行替换行程中的POI再进行预订。

值得一提的是,由于视旅科技目前尚未开展大交通类业务,欢萌旅行APP仅提供目的地酒店、门票、 巴士票等的预订。

而另一个用户可以直接体验到的功能,则是AI智能旅拍,用户可以自行上传自己的人像,自动产生AI造型、VLOG和AI旅行。这三个功能用户可以随时随地使用,即便不在旅行目的地。

而AI旅行“穿越时空”功能应用到的“换脸”技术,作为前高级风控专家,惠芃瑞表示视旅科技采用了更高级的风控和存储标准,确保“换脸”的内容不会触犯用户的肖像权和隐私权,同时也确保上传的人像非公众人物等,严格遵守各项法规。

而综合应用大模型及AIGC项目之一,则是数字人直播。

据惠芃瑞介绍,数字人直播底层有多维驱动,在广义语言建模的基础上,投喂旅行领域的语料,生成GPT式对话,再结合语音拟人生成和数字人建模技术,最终生成可以24小时不间断直播的数字人。

而视旅科技直播间的实时背景,则要归功于视旅科技在核心目的地的核心景区所安装的高清摄像头。在经授权、不侵犯肖像权的前提下,视旅科技对丽江古城、日照金山、香港迪士尼等目的地实景进行捕捉后,结合数字人技术,可以将直播间完全线上化,大大降低了直播间的运营成本。

惠芃瑞指出,在相关技术应用后,以往需要主播、场控、推流等人员的直播间,现在已经简化为一个人、一台电脑同时操作三个数字人直播间的效果;同时该项目技术成熟之后,不排除将直接向其他商家输出该解决方案。

02

旅游垂类大模型

需要突破的关键

事实上,在海内外互联网大厂纷纷发布自家的通用大模型之后,各类创业型公司已经借大厂的大模型底座,开始训练自己的垂类大模型。视旅科技也是其中一员。

需要注意的是,没有通用大模型的成熟,垂类大模型是无根可依的。

通用大模型需要过人的算力、大规模的数据、高规格的人才团队,大厂通常以亿元为投入单位进行开发竞争,更侧重于技术实力;而垂类大模型,则借通用大模型的技术实力,进行深度的场景定制开发,侧重点是场景应用和找准商业模式,其开发、训练成本和试错代价要远远小于通用大模型。

而视旅科技训练的旅游垂类大模型,可以总结为“GPT+行业专家”的模式,虽然训练模型的技术成本降低了,但是对行业场景、数据的应用理解的成本大大提升。

惠芃瑞提到,总的来看,视旅科技通过以下三个环节,完成了旅游行业领域GPT模型产品的构建。

1. 基于OpenAI的通用型语义大模型,进行旅游行业的领域模型设计和预训练。目前,视旅科技的领域模型参数在百亿规模,并初步完成了旅游行业的LLM(Large Language Model,大语言模型)知识学习。

2. 针对半封闭训练场景,即特定目的地的旅游相关问答场景,视旅科技通过获取特定目的地文本型攻略数据(每个目的地至少1万篇有标记且结构化文本笔记),训练 TravelGPT 旅游行业领域模型,从而完成行业场景适配。

3. 基于TravelGPT领域模型,关联视旅科技专有数据库,包括:数字化商品库、结构化行程库、标准化客服问答库,进行算法应用层的训练和学习。最终以多模态(multi-model)的方式输出文本问答、DSP行程产品、文图攻略推荐、短视频应用生成等四部分交互结果。

通过以上三个环节的算法架构设计,视旅科技针对用户行前种草、咨询、预订,行中咨询、互动、内容生成,行后体验分享、内容分发、产品分销等多个场景,将结构化用户需求与数字化行程库、商品库、内容库进行了关联打通和整体训练学习。

对于旅游业来说,一切的技术应用都要基于线下履约的真实性,只有确实可靠的POI信息,完整的产品链和真实的用户需求,才能反哺于垂类大模型的训练。

创立至今,在供给侧,视旅科技通过并购在多个目的地拥有自营旅行社,拥有一手的POI和产品信息,并对旅行场景有深度的了解。据此前环球旅讯统计,视旅科技已整合了乐派网、成都金熊猫、甘孜黑牦牛、云南假日、香港乐派王国以及北京、广州等地的旅行社。而在用户端,视旅科技目前已服务数十万C端用户,拥有较为完整的用户数据。

据惠芃瑞透露,视旅科技深度布局的目的地,都有专门的目的地领域模型输出。未来,视旅科技也会加大投入,针对重点目的地进行更细致的产品设计和更深入的算法研发。

不过,在训练大模型的过程中,视旅科技还是不可避免地遇到了诸多挑战。其中之一便是专业行业语料较少、 中文旅行场景资料缺失。

“原模型的语料库语言是英文,语料来源是外网的公开资料,并且语料的互动性和真实性较弱。”惠芃瑞提到,这就需要视旅科技先解决语言的难题,再根据具体的场景进行语料的补充和模型学习,以更好地匹配中文旅行者的交互习惯。

“过去,视旅科技在语料的积累和打标上,做了大量的工作。应用了GPT大模型之后,对于用户的特定需求理解和自然语言结构化表达和信息抽取有了长足提升。”

03

通用大模型的旅游垂类故事

才刚刚开始

Chat-GPT的面世,让人类看到了一种全新的生产力;对于各行各业来说,垂直大模型也将是一种全新的生产力,甚至可能对行业的生产逻辑造成颠覆性的改变。

据悉,从去年12月开始,视旅科技成立了相关团队,召集了6名数据算法工程师以及15名前后端研发工程师及产品经理,针对旅游场景进行垂类大模型的研发。目前视旅科技已经完成旅游GPT用户产品的研发及上线,并将在6月底发布下一个版本应用。

值得一提的是,各类通用大模型也推出相应的企业级大模型生产平台,给垂类大模型训练提供了更便利的措施。比如说百度等大厂推出的大模型服务,可以帮助客户改造产品和生产流程;企业也可以基于任何开源或闭源的大模型,开发自己的专属大模型。

除了自行训练模型,与通用大模型合作在旅游领域更加常见。例如,早在百度文心一言面世时,携程、中青旅便宣布成为百度文心一言首批生态合作伙伴力图在旅行智能规划、旅行内容渗透等多个领域展开深化合作,为用户打造在线旅游服务场景人工智能解决方案。

而Chat-GPT和旅游企业的合作也是相似的。不过,Chat-GPT还对开发者开放了插件功能,用户可以安装插件来完成各种各样的任务,包括在 Chat-GPT上订酒店、订航班,据悉,Expedia以及Booking集团旗下元搜索品牌Kayak和餐饮预订品牌OpenTable成为第一批启用插件的平台,携程旗下Trip.com近期也启用了插件。

无论是在大模型的开源模型上训练垂类模型,还是与大模型合作调用API做产品,对旅游企业来说,只是刚刚看到了通用大模型的冰山一角。真正的大模型训练或应用,这个故事才刚刚开始。

相关文章Related

返回栏目>>