移动端


当前位置:兴旺宝>资讯首页> 企业动态

高质量数据集典型案例 | 中国移动人时空三元组高质量数据集

2025-09-26 08:36:42来源:国家数据局 阅读量:15854 评论

分享:

  通信信令数据蕴含着大规模群体7×24小时连续的动态位置信息,在交通运输等领域具有重要应用价值。针对当前原始信令数据质量较低、质量评估不足、语义信息缺失、敏感等级较高的问题,本案例构建了“质量增强-质量评估-语义标注-管理运营”四位一体的数据治理技术体系,形成了一套高质量的人时空三元组数据集,并基于此数据集训练形成了具备出行分析、区域洞察等能力的行业大模型,可支撑交通调查、客流预测等需求。
 
  方案和成效
 
  一是构建体系化数据质量增强技术,夯实高质量数据底座。针对原始信令数据质量较低的问题,从位置异常、数据缺失等层面,以多规则综合判别与深度自监督学习相结合的技术路线,提升数据准确性与完整性,形成超3000亿条约50TB合格率达98%的高质量人时空三元组数据。
 
  二是设计多元化数据质量评估体系,全方位评估数据质量。针对信令数据质量评估不足的问题,结合行业标准和数据特性,设计一套定制化指标和通用性指标相结合的多元化质量综合评估体系,并开发2大类评测算子,实现对人时空三元组数据的全方位质量评估。
 
  三是打造专业化时空信令标注工具,生成多维度数据标签。针对信令数据语义信息缺失的问题,打造一款可视化、智能化标注平台,支持对出行方式、职业画像等信息的高效标注,自动化率达70%,辅助生成1套出行语义标注数据集,并联合打造1个省级数据标注基地。
 
  四是形成全周期数据管理运营机制,保障数据安全与流通。针对信令数据敏感等级较高的问题,建立覆盖数据全生命周期的安全管理运营机制,形成从数据采集到智能处理再到场景化输出的生态闭环,赋能北京交通委、东莞交通局等10余家单位的出行调查、流量监控、交通规划等20多种业务场景。
 
  创新点
 
  一是技术创新驱动数据质量增强。首创基于深度自监督学习的异常信令修复和轨迹路径重构方法,实现对异常数据的修复、缺失数据的插补以及数据准确性的提升,将原始信令数据转换为可准确反映群体出行特征及人地交互关系的高质量人时空三元组数据集。
 
  二是工具打造赋能标注效率提升。打造专门面向时空信令数据的轨迹语义标注平台,综合考虑信令数据的时空动态性和专业性,以地理信息可视化结合交互式引导的方式,实现对信令数据背后所蕴含的活动语义的高效标注,降低标注难度和标注成本。
 
  三是机制建设促进数据流通利用。构建数据安全合规审查体系和数据飞轮管理运营机制,并形成产业生态闭环,实现数据全生命周期的安全合规、顺畅流转与价值释放。
 
版权与免责声明:1.凡本网注明“来源:兴旺宝装备总站”的所有作品,均为浙江兴旺宝明通网络有限公司-兴旺宝合法拥有版权或有权使用的作品,未经本网授权不得转载、摘编或利用其它方式使用上述作品。已经本网授权使用作品的,应在授权范围内使用,并注明“来源:兴旺宝装备总站”。违反上述声明者,本网将追究其相关法律责任。 2.本网转载并注明自其它来源(非兴旺宝装备总站)的作品,目的在于传递更多信息,并不代表本网赞同其观点或和对其真实性负责,不承担此类作品侵权行为的直接责任及连带责任。其他媒体、网站或个人从本网转载时,必须保留本网注明的作品第一来源,并自负版权等法律责任。 3.如涉及作品内容、版权等问题,请在作品发表之日起一周内与本网联系,否则视为放弃相关权利。
我来评论

昵称 验证码

文明上网,理性发言。(您还可以输入200个字符)

所有评论仅代表网友意见,与本站立场无关

    相关新闻