2022年3月4日至6日,2022年IEEE*第七届大数据分析国际会议(ICBDA* 2022)在广州圆满召开。在本次会议上,日立中国研究院主任研究员俞松以《Healthcare Simulation Data Generation Program(医疗健康模拟数据生成程序)》为题进行了发表,并荣获本次会议软件设计和系统开发分会场的最佳口头报告奖。
ICBDA颁发“最佳口头发表奖”证书
因数据收集困难导致样本数不足,是医疗健康领域大数据分析的一大难题。俞松通过该发表,向与会者详细介绍了健康医疗模拟数据生成的逻辑。俞松和他的团队针对不同的数据类型建立不同的模型,针对少量数据通过机器学习后可生成大量符合原始数据特征的模拟数据。测试中,基于日本收集到的64项健康医疗指标的300条真实原始数据,通过此方法模拟生成10万条数据,且模拟数据与真实原始数据的吻合精度达80%以上。
当数据样本数量足够且数据特征符合真实情况时,可将大量可信样本导入相关预测模型进行训练,以提升模型的预测效力。该医疗模拟数据生成的方法还能应用于医学相关数据分析、模型的训练及性能检测,对健康医疗领域的数据分析发展有积极的推动作用。
此次发表的论文将收录在ICBDA 2022论文集中出版,并被收录在IEEE在线数据库中,可以通过EI核心和SCOPUS等检索原文。