菜 单

大数据在抗疫中发挥哪些作用?确诊病例15连降折射出的信号

2020-03-11 12:00:00 本站 154

19日,《工业和信息化部办公厅关于运用新一代信息技术支撑服务疫情防控和复工复产工作的通知》发布,支持运用互联网、大数据、云计算、人工智能等新技术服务疫情监测分析、病毒溯源、患者追踪、人员流动和社区管理,对疫情开展科学精准防控。新冠肺炎疫情防控期间,大数据不仅助力政府在公共卫生管理领域科学决策、资源优化配置,也能让公众及时了解疫情发展情况,积极科学防疫。那以大数据为代表的新技术,能预测抗疫之战的时间表吗?



15连降折射哪些信号



国家卫生健康委新闻发言人、宣传司副司长米锋19日表示,除湖北以外,全国新增确诊病例总数已连续15天下降,新增死亡病例数一直保持在较低水平。2月18日,湖北除武汉以外地区新增治愈出院病例已连续4天大于新增确诊病例;同时2月13日至今新增确诊病例数呈显着下降,累计确诊病例数增幅趋于平缓。



那专家是如何看待这些数据的呢?耶鲁大学全球健康政策与经济学助理教授、美国中国卫生政策与管理学会会长陈希19日对《环球时报》记者表示,目前湖北以外的情况比较乐观,但还不能掉以轻心。有分析认为,目前还存在一个隐形的上升点,仍然需要根据复工进度再观察几日。



陈希表示,不过讨论湖北、尤其是武汉拐点仍然有些早。第一,钟南山院士18日坦承武汉人传人的现象还未彻底根除,严格封闭小区的策略刚刚得以最严格的实施,还需要观察数日;第二,目前虽然湖北和武汉每日新增确诊和疑似病例都在下降,但新增占用的医疗设施和资源仍然大于治愈患者后新释放出的医疗设施和资源,也就是说医疗资源的紧张仍然在加剧,医务人员还在打攻坚战。



陈希分析称,其他几个数据也需要重视。第一,19日累计确诊病例数环比增长大约还在2.4%左右,这一数字需要降得更低,最好趋近于0。第二,目前从绝对数量上看,每日新增疑似量还较多,需要再连续下降方才可以判断是转折点的信号。第三,疑似病例在累计确诊病例的比例,如果能从目前下降到5%以下,才可以认为疫情比较稳定了。



大数据在抗疫中发挥哪些作用



近来,全国手机用户陆续收到来自国内三大运营商中国电信、中国移动和中国联通发来的短信,提示可以免费提供本人到访地短信查询服务。据工业与信息化部介绍,目前我国手机用户均可通过以上短信方式查询本人前14天内到过的、停留4小时以上的到访地,可查询到具体地市。



这一功能虽然看似简单,背后却隐藏着一个覆盖数亿人群的大数据网络。据工信部信息通信管理局局长韩夏介绍,工信部已组织行业专家开展大数据咨询,紧急建立疫情电信大数据分析模型,组织基础电信企业大数据统计全国特别是武汉和湖北等地区的人员流动情况,助力各地联防联控部门精准施策。



“现有的公众通信网每日产生的电信数据约数千亿条,在人员流动性高的情况下,数据量会更大。”中国信息通信研究院院长刘多在日前工信部举行的发布会上表示,通过电信大数据,可以统计分析人员动态流动情况,分析预测确诊、疑似患者及密切接触人员等重点人群的动态流动情况,为疫情防控提供精细化数据支持。



工信部透露,疫情发生以来,工信部连续向有关部门和地方推送流动人员态势分析等。利用这些数据,地方联防联控机制相关部门比对当地旅游、出行等数据,可以摸排出重点人员,为基层防控筛查提供精细化数据支持。



据韩夏介绍,对全国用户流动情况进行的分析可对疫情防控起到支撑作用,比如有助于对人员返程、企业复工复产、地区物资资源等进行分析和判断。随着节后返程高峰,工信部还启动了对重点城市的人员流动分析,为诸多大城市的疫情防控工作提供参考。



此前,国家卫生健康委高级别专家组成员李兰娟院士在接受媒体采访时曾提到,专家正利用大数据技术梳理感染者的生活轨迹,追踪人群接触史,锁定感染源及密切接触人群,为疫情防控提供宝贵信息。



在疫情防控中,来自大数据的分析也成为市民及时了解信息的重要渠道。2月8日,国务院办公厅电子政务办公室、国家卫生健康委员会与中国电子科技集团有限公司共同推出了“密切接触者测量仪”(公众版)。在国家卫生健康委员会、交通运输部、铁路总公司和民航局等多家部委的数据资源支持下,市民在该平台输入姓名和身份证号码,就能知道自己是不是密切接触者。



在浙江,该省正在省内全面推行“健康码”。通过支付宝平台,浙江居民就可以申报个人健康信息,后台大数据会对申报人在一段时间内,是否到过疫情严重地区等风险进行多方面分析审核,并自动生成个人专属的二维码。如果是绿色二维码,则可以在各个场合凭借此码顺利通行,但如果红色或黄色二维码,则证明存在风险,需要集中或居家隔离。



大数据的应用往往是和人工智能、云计算等其他科技结合,才能在防控疫情中发挥最大作用。据阿里巴巴方面近日透露,其旗下的达摩院联合阿里云针对新冠肺炎临床诊断研发了一套全新AI诊断技术,这一技术正是基于大量的患者CT影像大数据而开发的。



疫情感染人数正在攀升,围绕新型冠状病毒感染的病原学、流行病学、发病机制、疾病防治等研究迫在眉睫,正在与时间竞速赛跑,需要强大的计算力作为科技支撑。据《环球时报》记者了解,中科曙光等中国超算企业共同向相关科研机构免费提供超100PFlops算力的强大计算资源,助力新型冠状病毒肺炎防治的科研攻坚。同时,曙光还将为疫情数据的实时监测和态势分析提供数据平台与技术支撑。此外,依托中科院北京基因组研究所建设的国家基因组科学数据中心,1月22日即发布了2019新型冠状病毒资源库,助力科研人员利用这一资源库,开展新型冠状病毒基因组变异分析,该数据中心计算资源由中科曙光提供。



能否预测疫情走势



除了在日常防控疫情方面起到的作用,公众对于何时出现拐点,疫情何时能过去,普通人的生活何时能恢复正常等问题的答案充满期待。大数据能在预测疫情走势方面发挥什么样的作用呢?



根据目前公开报道,备受关注的大数据分析预测系统主要是由中科院计算所团队和清华AI团队研发的。中国科学院计算技术研究所大数据研究院院长王元卓不久前撰文介绍,大数据的两个主要作用就是感知现在和预测未来。他们通过“中科天玑”疫情数据分析系列系统,融合所采集的开源网络数据,通过智能模型的学习,来预测疫情走势。



根据国家公布的疫情数据,清华AI团队构建了动力学模型来预测全国新冠肺炎疫情的扩散情况及其高峰期。



一位不具名的互联网专家19日接受《环球时报》记者采访时表示,相比17年前的非典,互联网尤其是大数据的作用,在本次战疫的过程中尤为明显,但大数据收集、应用需注意保护个人隐私。早在本月9日,中央网信办公开发布《关于做好个人信息保护利用大数据支撑联防联控工作的通知》,明确为疫情防控、疾病防治收集的个人信息,不得用于其他用途。任何单位和个人未经被收集者同意,不得公开姓名、年龄、身份证号码等个人信息。



上述专家提醒称,由于此次疫情,不少部门和机构收集了大量数据用于分析使用,但配套的安全防护并不一定完善,应该严格防止因受黑客攻击而出现信息泄露。同时,管理部门在数据使用过程中也要避免数据泄露。



延伸阅读:



健康医疗大数据助力战“疫”,行业协同治理存法律难题



与17年前的SARS相比,这次疫情防治有了大数据技术的应用和支撑,大数据在疫情态势研判、传播路径分析、精准防控及后续治理中发挥了重要作用







2020年春节期间,一场始料未及的新型冠状病毒肺炎首先在武汉爆发,继而席卷全国。



与17年前的SARS相比,这次疫情防治有了大数据技术的应用和支撑,大数据在疫情态势研判、传播路径分析、精准防控及后续治理中发挥了重要作用。



比如,百度地图迁徙大数据为政府部门和研究机构提供了疫情防控的关键数据支撑;电商平台大数据为医疗防护等各种物质调配提供了精准信息(300099,股吧);人工智能医疗数据为疾病诊断和新药研发提供了重要依据;浙江省杭州市还推出个人健康码,对红黄绿不同颜色群体采取类型化精准管理……



5P大数据时代的医疗行业



这次疫情发生后,在2月3日举行的中央政治局常委会会议上,中共中央总书记习近平主持会议并发表重要讲话。会议强调要推动相关数据和病例资料的开放共享,加快病毒溯源、传播力、传播机理等研究,及时完善防控策略和措施。同日,国家卫健委下发通知要求各地积极运用互联网+、大数据等信息技术强化数据采集分析应用。



之后,多个省份卫健委官网推出疫情专属网页或者管理平台,运用大数据展示病例数据、疫情分布、疫情走向等关键数据。2月4日,国际顶级期刊《Nature》也发表社论,呼吁所有冠状病毒研究人员保持数据共享,数据开放。



近十年来,随着生物信息技术的进一步融合发展,全球医疗行业正进入以预防(Prevention)、预测(Prediction)、精准(Precision)、个性化(Personalization)、参与(Participatory)为主要特征的5P大数据时代。



尤其是2012年联合国发布《大数据促进发展:挑战与机遇》白皮书之后,更多的健康医疗数据通过“健康+医疗”的互通融合形式得以采集、存储和关联分析。



健康医疗大数据是人们在疾病防治、健康管理等过程中产生的与健康医疗相关的数据,覆盖电子病历、医学影像、临床检验、健康监测、医学文献等数据资源。这些数据资源是持续高增长的多态复杂数据,既包括可以互联共享的一般个人数据也包括敏感度极高的个人隐私信息。



大数据的真正意义不在于数据量大,而在于通过数据分析、比对、挖掘等发现新知识、创造新价值、提升新能力,其核心价值在于数据共享。健康医疗大数据共享不仅能够降低医疗成本、提升医疗服务质量、改善人口健康指标,更为重要的是,健康医疗信息共享可以辅助政府和医疗机构作出明智决策,切实发挥大数据在疾病精准防治中的作用。



数据利用面临可及性差、可用性低困境



西方国家一直将医疗信息共享作为医改和数据治理的重要内容,在技术研发、可信数据体系、数据共享、安全和隐私保护等方面作出了明确规定。



美国把大数据作为国家战略,重点发展精准医疗,强调健康医疗大数据的开放和共享,鼓励社会积极挖掘健康医疗大数据,同时在“精准医疗计划”中制定《隐私与信任原则》,以此来规范不同行业的医疗数据使用行为。



英国的数据共享政策中倡导公共利益最大化和公共损害最小化原则,通过建立健康医疗大数据平台来实现数据的集中与共享分析,并积极发展个性化医疗,探索建立世界最大的癌症数据库,以此为个性化癌症治疗提供基础。



欧盟的《通用数据保护条例》不仅明确界定了“基因数据”“生物学识别数据”和“健康相关的数据”概念,还规定了社会组织如何处理数据,并试图通过赋予公民数据控制权来降低隐私风险。这部被称为史上最严、保护最全的个人数据保护法,将个人数据权作为公民基本权利给予保护,但它仍允许国家基于重大公共利益等事项对此项权利加以克减,因为公共卫生属于国家重大公共利益,同时传染病监测还构成重大生命利益,因此,该条例对个人数据处理的合法性基础、特殊数据处理方式、数据主体权利限制等方面予以特别规定。



我国将健康医疗大数据视为国家重要的基础性战略资源,政府一直大力推动健康医疗大数据的互联融合和开放共享。《促进大数据发展行动纲要》中提出优先推动医疗等民生领域政府资源向社会开放,使更多的优良医疗资源可以通过大数据实现共享,并渗透到社区与乡镇,解决日益增长的医疗需求与医疗资源不足的矛盾。《关于促进和规范健康医疗大数据应用发展的指导意见》也明确提出,通过建成互通共享的国家、省、市、县四级人口健康信息平台,推动健康医疗大数据应用,探索形成健康医疗服务新模式。



尽管全世界医疗、研究、监管机构及数据企业都希望能够共享个人健康医疗数据,然而,现实中能够共享的个人数据量却十分有限。



因为,健康医疗大数据除了具备通用的大数据特点之外,还具备多态性、隐私性、时序性、不完整性、冗杂性等医疗特性,医疗数据的纷繁复杂造成了医疗数据的可及性差和可用性低。



可及性差表现为数据不开放、信息碎片化以及新数据不断产生;可用性低表现为数据不准确、数据不完备、结构化程度低,且缺乏有效的数据质量评价方法。数据的可及性差和可用性低加大了数据共享和数据处理的难度,涉及技术、标准、制度、伦理及法律责任等系列问题。



专家呼吁立法保障关键数据及时公开共享



这次疫情中,正因为武汉市未能及时掌握并提供确诊病例、居家患者、人员流动等准确数据,导致无法对疫情发展作出准确预判并采取及时有效的应对措施。



正如中国科学院院士赵国屏教授在1月26日接受采访时所指出的,“我国科研与传染病防控缺乏从平时到战时的协同,在我国的传染病防治体系之中,科研(包括流行病学研究、临床医学研究和基础医学研究)也没有有机地整合在一起,应尽快建立和统筹包括疾病控制部门、医疗部门以及社区与公安部门之间的信息合作体系”。



中国工程院院士陈薇在接受《中国科学报》采访时也同样指出,关键数据的及时公开、共享有利于各方力量齐心协力做好疫情防控,这是一个需要重点关注并通过立法保障的问题。



事实上,健康医疗大数据的行业协同治理是全球一致的呼声,数据共享的理念只有通过协同治理的方式才能实现。行业协同治理是把各个相对独立的部门用某种机制或约束使其形成一个临时的整体,在此基础上进行资源共享和协调运作,从而达到组织化的目标。



互联网的去中心化、平民化及平台化等特点给健康医疗行业带来了颠覆性的创新变革。医疗与其他行业必须进行开放合作,构建多方共赢的数据资源配置平台及共创共享机制,才能促进数据资源的有效利用。



对此,西方学者提出根据共享数据类型和制度约束强度来选择不同治理安排的组织间协同治理模式;还有学者提出利用区块链技术的多中心化、时序数据、集体维护等特点来实现医疗数据的分布式协同和远程协同。







这次新型冠状病毒防治过程中,政府和科研机构都意识到了信息合作的重要性。



2月3日,国家卫健委下发的《关于加强信息化支撑新型冠状病毒感染的肺炎疫情防控工作的通知》中特别提出,强化与工信、公安、交通运输等部门的信息联动,形成公路、铁路、民航、通讯、医疗等疫情相关方多源数据监测、交换、汇聚、反馈机制。2月6日,中国医疗影像国家新一代人工智能开放创新平台联合中国人工智能学会(CAAI)等多家医学人工智能企业、医疗器械厂商、医疗机构、科研院校等部门,共同发起了“加强医学影像人工智能行业合作,协同阻击新冠肺炎疫情”的倡议。



可以预见,未来的健康医疗大数据共享将以行业协同治理的方式得到进一步的发展。



来源:环球时报,法治周末