1.命题方向
智能计算
2.题目类别
应用类
3.题目名称
医疗保险欺诈识别监测模型
4.背景说明
【整体背景】
社会医疗保险是国家通过立法形式强制实施,由雇主和个人按一定比例缴纳保险费,建立社会医疗保险基金,支付雇员医疗费用的一种医疗保险制度,它是促进社会文明和进步的重要手段。但是,有些人为了获得不当利益,利用各种途径收集医疗保险参保人员的医保卡,通过医保卡到医院进行虚假诊疗,或通过编造病历、诊疗过程,套取医保基金,不仅危害社会,也让自己走上犯罪的道路,终是害人害己。
【公司背景】
东软面向全球市场提供IT驱动的创新型解决方案与服务,致力于推动社会的发展与变革,为个人创造新的生活方式,为社会创造价值。公司创立于1991年,目前拥有近30000名员工,在中国建立了8个区域总部,10个软件研发基地, 16个软件开发与技术支持中心,在60多个城市建立营销与服务网络; 在美国、日本、欧洲、中东、南美设有子公司。东软是中国第一个上市的软件公司,也是最先通过CMM5和CMMI(V1.2)5级认证的中国软件公司。
【业务背景】
在大数据和人工智能领域,东软依托UniEAP业务基础平台、SaCa云应用平台、RealSight大数据高级分析应用平台,快速构建行业解决方案,开拓基于大数据的新型业务模式与应用,帮助企业实现互联网化转型。
5.项目说明
【问题说明】
开发一套医疗保险欺诈识别监测模型,帮助医保部门实现对各类医疗保险基金欺诈违规行为的准确识别,以进一步丰富现行医保智能监控的医保规则和医学规则,提高医保智能监控的针对性和有效性。
【用户期望】
(1)对给定的16000条数据集进行分析处理,并进行多维特征信息分析,提取出能够描述影响医疗保险欺诈的特征因子集合。
(2)利用特征因子的成果,结合AI相关算法,构建医疗保险欺诈识别模型,强调模型的准确性和可解释性。输出本训练数据中医疗保险欺诈的结果。用于模型训练的特征因子越少越好。
(3)尝试从业务实践角度描述模型提供的业务价值,并结合领域知识探索拓展和丰富系统的附加价值。
6.任务要求
【开发说明】
(1)对给定的16000条数据集进行分析处理,并进行多维特征信息分析,提取出能够描述影响医疗保险欺诈的特征因子集合。
(2)利用特征因子的成果,结合AI相关算法,构建医疗保险欺诈识别模型,强调模型的准确性和可解释性。输出本训练数据中医疗保险欺诈的结果。用于模型训练的特征因子越少越好。
(3)尝试从业务实践角度描述模型提供的业务价值,并结合领域知识探索拓展和丰富系统的附加价值。
【提交材料】
(1)项目概要介绍;
(2)项目简介PPT;
(3)项目详细方案;
(4)项目演示视频;
(5)企业要求提交的材料:
①需求分析文档完整;
②系统设计文档完整;
③测试案例完整;
④测试报告完整;
(6)团队自愿提交的其他补充材料。
【任务清单】
(1)模型的概述与简介,对算法模型有充分的认识理解,切不可只会套用;
(2)特征降维的方法和过程;
(3)模型的参数调优过程(如果包含调优过程)。
【开发工具与数据接口】
自选
7.其他
无
8.参考信息
无
9.评分要点
赛题评分要点见附件一:A 类企业命题初赛统一评分标准。