7月13日,京东言犀大模型与言犀AI开发计算平台亮相2023京东全球科技探索者大会暨京东云峰会。言犀大模型融合了70%通用数据与30%数智供应链原生数据,瞄准零售、物流、金融、健康、政务等业务场景,着力解决真实产业问题。
中国证券报记者从现场了解到,京东言犀大模型预计从明年上半年开始向产业全面开放。“在内部充分实践后,京东会将技术能力以组件化、模块化方式对外输出。”京东集团CEO许冉表示,京东制定了大模型“三步走”规划,分别是内部打造通用大模型、内部产业场景大规模实践、价值得到内部验证后开放给合作伙伴。
大模型具备“产业基因”
目前,越来越多科技企业选择研制专用和特定场景的大模型,而非通用大模型。在许冉看来,创造产业价值是大模型的目标。京东为此提出了一个大模型价值公式:算法×算力×数据×产业厚度的平方。“除了追求技术的先进性,京东格外关注产业厚度——看重技术能在多少产业场景中切实应用。”许冉说,“纵观过去人工智能技术的发展,数次达到应用爆发的边缘,但很多都没有创造出很大价值,技术没有在产业端形成扎实的应用是重要原因之一。”
许冉表示,京东在零售、物流、科技、健康、工业等多个领域拥有丰富的产业实践,为京东积攒起每年数百亿条的优势交互数据。训练京东言犀大模型的数据库,就由70%通用数据与30%数智供应链原生数据组成。这些产业数据和行业经验,使京东的大模型天然具备“产业基因”,成为京东做大模型的核心优势。
“过去20年里,京东深入工厂车间、农户羊圈和山区果园,熟悉千行百业的产业场景。如今,这些场景成为大模型的核心战场,大模型价值将迎来真刀真枪的检验。”许冉说。
许冉认为,创造明确的价值应当是技术的目标。当产业效率和产业边界拓展得到质的提升后,大模型才会有更重要的实际价值和意义,将不亚于又一次工业革命。
为夯实产业应用,京东还推出支撑大模型研发的基础设施——言犀AI开发计算平台,预计今年8月上线。该平台既具备行业知识库,沉淀了京东自己的零售、物流、健康、金融等行业经验,又具备100多种训练和推理优化工具,能将通用模型迅速转化为专业模型。
当然,京东言犀大模型的问世并非一蹴而就,京东早有布局。2021年,京东推出十亿级模型K-PLUG,2022年推出百亿级模型Vega,再到现在千亿级的大模型“言犀”。
大模型实践分“三步走”
目前,京东对大模型的实践已取得阶段性成绩。在京东内部,大量业务场景都在探索将大模型结合自己业务流程的方式。比如,用大模型提升智能客服水平、编写代码、强化关联商品推荐等。
在很多行业领域,京东也拿出了实践案例。例如,京东健康发布的京医千询大模型建立在京东言犀通用大模型基础之上,能快速完成在医疗健康领域各个场景的迁移和学习,从而实现产品和解决方案的全面AI化部署,能为远程医疗服务提供坚实的技术底座;京东云AIGC内容营销平台使每套图的制作成本降低90%,制作周期从7天缩短到半天;在大模型的加持下,京东物流一站式数智化供应链数据管理平台“京慧3.0”的销量预测、库存、供应及补货计划方面更具表现力,其交互式供应链控制塔能够帮助用户快速定位并解决供应链问题,实现降本增效。
另外,京东正与合作伙伴在供应链优化、用户体验、营销降本增效等方面持续探索,共建零售行业大模型创新应用;同时,在金融客服、智能选基、智能营销等方面创新服务体验,探索金融行业大模型创新应用。
“智能化优先在数字化领先的行业发生”,京东集团副总裁、京东科技产品与解决方案总裁高礼强表示,在零售、金融、城市、物流等多个场景,京东都发布了全新的智能化解决方案,借助大模型能力实现服务能力升级。
对大模型所需的计算资源,京东做了充分准备。在重庆太阳岛,京东全国首个超算中心——天琴α集群持续运转,推理速度较过去提升6.2倍,推理成本节约90%。
按照大模型实践“三步走”规划,从现在到今年年底,京东将经由高复杂场景大规模锤炼迭代出扎实的产业服务,预计在2024年初,会将大模型能力向外部开放。目前,京东已经走到第二步。