近日,【全球人工智能开发与应用大会】发布了一份名为《电商大模型及搜索应用实践》的行业研究报告。这份报告由京东技术总监翟周伟主讲,深入探讨了电商行业的发展和技术演进,分析了大模型在电商场景下的应用问题,并提出了电商大模型的关键技术和解决方案。报告还详细讨论了电商搜索大模型的应用实践,以及对下一代AI电商搜索的展望。这份报告内容丰富,不仅涵盖了电商行业的技术挑战和优化目标,还提供了对电商大模型技术优势和应用问题的深刻见解,对于理解电商领域的AI应用和未来发展具有很高的参考价值。
电商行业的迅猛发展和技术的不断演进,正在重塑我们的购物体验。过去十年,网上零售额的高速增长,电商模式从货架电商向内容电商并存的局面转变,技术的进步降低了商品流通成本,提升了零售效率。电商用户的消费决策链可以分为购前、购中、购后三个阶段,其中搜索是决策的关键环节。电商搜索的核心是基于用户需求的商品分发,优化的目标是GMV和UCVR,这与传统的信息搜索有着本质的区别。
在电商搜索技术的发展中,我们看到了从规则引擎的应用到基础文本检索技术,再到统计NLP为核心的用户意图理解和商品理解,以及基于ML的CTR/CVR建模等技术的演进。这些技术的发展,不仅提升了商品分发的准确率,也推动了搜索交互方式的革新,如文本+语音+图像的新搜索交互方式,以及ANN语义召回和多模态召回技术的应用。
大模型在电商场景下的应用,展现出了强大的语言理解和生成能力,广泛的知识总结和归纳能力,以及显著的迁移学习和多任务能力。然而,电商场景下的应用问题也随之而来,如通用大模型商品知识专业性不足、图像商品理解差、效果和个性化挑战、时效性问题、成本和速度问题以及安全性问题。为了解决这些问题,电商大模型解决方案应运而生,包括Prompt+SFT/DPO/PPO等技术的应用,以及电商知识图谱和用户画像的整合。
数据和预训练是电商大模型关键技术之一,核心在于站外和站内商品相关数据去噪音,提升专有数据的电商知识密度。通过基于知识继承的增量学习框架,我们可以在成本和效率上进行优化。通用对齐和领域对齐学习的目标是优化通用指令遵循,同时在电商领域增强对齐。安全性方面,从被动安全和主动安全两个维度进行考量,确保大模型生成的内容是安全可控的。
在电商搜索场景下,大模型的应用实践包括搜索交互、电商用户意图理解和文案创意生成。搜索交互通过query引导,提升了搜索交互效率和转化率。电商意图理解的目标是解决用户需求表达和商品的语义对齐问题,提升商品召回的相关性和多样性。文案创意生成则利用大模型的生成能力,降低商品素材的成本,提升营销转化效率。
电商搜索相关性的核心问题是用户需求和商品的匹配问题,转化为sim(query, sku)的相关性,同时优化考虑CRT和CVR为目标。主流的基于NN的语义相关性模型分为孪生网络和交互式匹配两大类,各有特点和挑战。下一代AI电商搜索将是以搜推技术驱动,结合语音、文本、视觉和空间技术,以大模型+Agent/AGI技术驱动,实现多模态直接结果。
这篇文章的灵感来自于一份深入探讨电商大模型及搜索应用实践的报告。除了这份报告,还有一些同类型的报告也非常有价值,推荐阅读。这些报告我们都收录在同名星球,可以自行获取。
以上为节选样张,关注公众号【蝉鸣报告】回复领取PDF完整电子版(无广告)。
【蝉鸣报告】每日更新最新硬核报告,覆盖产业报告、全球化、经济报告、趋势等全领域。