日前,陕西省西安市烟草专卖局(公司)在行业内率先建成人工智能320G高性能算力中心,并在模数双驱动的人工智能中台及行业特征语言大模型研究与应用工作中取得了阶段性成果。
在陕西省烟草专卖局(公司)的指导下,西安市烟草专卖局(公司)依托人工智能320G高性能算力中心,构建了一套“统一人工智能模型编码、统一行业特征数据训练、统一人工智能算力输出、统一研发管控对接标准”的模数双驱动人工智能中台,建立了具有行业特征属性的语音语义识别、图像识别、认知情感分析、文本差异提取等AI能力模型,实现了各业务智能化场景的集中AI能力输出、调用、训练和管控,从而促进各业务系统智能交互,实现人工智能与新型基础设施的融合。
在此基础上,西安市烟草专卖局(公司)自主研发基于人工智能语言大模型的“智能客服”软件。以烟草行业特征预训练语言大模型为技术基座,在微信公众号上分别研发部署了两个自然语言交互智能机器人软件,实现了面向零售客户的24小时在线智能交互服务。该软件能够自我管理、自我调节,精准适应客户习惯,深入理解用户意图、情感和语气,生成自然、流畅的语言回应和智能化的回答建议。该软件的广泛应用,可以及时获取零售客户和消费者情绪变化,从而靶向施策,有针对性地开展客户服务,提升客户满意度。同时,他们着手试点人工智能中台与一体化平台专卖子系统对接,完成一体化平台专卖子系统现场勘验、简易案件处理等功能与人工智能中台的对接测试,实现了图像识别、语音识别、语音转文本等能力对接。
此外,依托人工智能320G算力中心,他们对Llama3、通义千问、星火等开源模型的计算速度、内存占用、识别精度等指标分别进行训练、对比和分析,测试其在中文自然语言处理领域的应用潜力,选择模型体量最为合适且效果最好的模型作为基础模型。随后,按照数据采集、数据清洗和预处理、特征工程、模型训练和微调、模型评估和应用等步骤,对基础模型进行行业数据语料训练,研究形成了具有行业特征的预训练语言大模型。该成果将融入行业现有各平台建设中,有效提升行业新质生产力的应用能力和业务处理的智能化水平。