行业动态

原创: 2020-03-25 14:11:59

美国公开新冠数据集欲借力AI,人工智能如何参与全球战“疫”?

原创: 2020-03-25 14:11:59

截至北京时间3月22日6时,全球累积确诊病例超30万,死亡病例近13万,这场来势汹汹的疫情在世界范围内持续蔓延。国内“重灾区”湖北已连续4天无新增病例,而世界的防疫战争才刚刚开始。

欧洲已成世界新冠疫情中心,意大利累计确诊过5万,政府同意派遣军队进入伦巴第大区协助抗疫;美国的情况也不容乐观,特朗普宣布疫情严重的纽约州出现“重大灾难”,这场防疫战已然成为世界人民共同的“健康守卫战”。

美国公开新冠数据集欲借力AI,人工智能如何参与全球战“疫”?


前几日,美国白宫与微软、谷歌等公司合作,汇编了最大的新冠病毒学术论文库,呼吁研究人员用AI技术分析这近3万篇学术论文,期望发现人类可能错过的重要问题。

除此之外,预测研判、检测诊疗、疫情防控,这套AI“组合拳”还亮出了不少花式操作。

发布病毒数据集,激活全球AI力量

根据美国白宫官网报道,3月16日,艾伦AI研究所、微软研究院、美国国立卫生研究院下属国家医学图书馆、白宫科学技术办公室等联合发布了COVID-19开放获取数据库,其中包含了有关COVID-19、SARS-CoV-2及冠状病毒家族的学术论文。

美国公开新冠数据集欲借力AI,人工智能如何参与全球战“疫”?


这一数据库向全球研究人员开放,并会随着同行评议新研究的发表不断更新。数据集的发布当然不只是为了整理和存档,挖掘更有用的信息才是目的所在。这是目前可用于数据和文本挖掘的最全面的新冠文献机读数据库。白宫号召全美的人工智能专家行动起来,运用AI技术分析这些论文,帮助解答新冠病毒最紧迫的疑难问题。

数据库一经开放,谷歌云旗下的机器学习和数据科学社区Kaggle立即发起了CORD-19数据集文本挖掘竞赛。Kaggle在官网上发布了10个问题,涵盖冠状病毒特性、新冠病毒危险因素、病毒传播和诊疗、疫苗、非药物干预、信息共享和跨部门合作以及社科伦理等方面,每项问题中最符合评估标准的人员将获得1000美元的奖金。

美国公开新冠数据集欲借力AI,人工智能如何参与全球战“疫”?


正如艾伦AI研究所所长Oren Etzioni所说,人工智能本身不能解决问题,但能帮助人们更快速地发掘问题的答案。美国首席技术官迈克尔·克拉希欧斯也表示,他们希望计算机能够比人类更快地扫描研究结果,发现人类可能错过的东西。AI已经成为科学家重要的左膀右臂。

机器学习技术在大量文本中提取摘要,有时需要分析数百万个相似的内容项才能得出结论。想要发挥数据集更大的作用,自然语言处理(NLP)技术的进步不容忽视。例如,艾伦AI研究所的语言模型ELMO和AllenNLP,能够分析不同论文之间的关系;阿里达摩院将NLP技术用于病历文本分析,这个模型也被评为全球性能最强的NLP系统。

美国公开新冠数据集欲借力AI,人工智能如何参与全球战“疫”?


此外,NLP技术的作用还体现在疫情预警上。12月30日,波士顿儿童医院的自动健康地图系统发布了境外关于新冠病毒的首次公共警报。31日,加拿大AI创业公司Blue Dot也向客户发出了疫情警告——“避开武汉等危险区域”,早于CDC和WHO的通报。

Blue Dot的健康监控平台对数十亿个数据点进行分析,找出相关词汇短语,从而预测传染病的爆发,还可以预测病毒的传播。据《华尔街日报》报道,其信息来源包括:国内外每日新闻稿10万+、官方报告、卫星气候数据、航班信息和包括人口数据、医疗力量和可传播传染病的昆虫数据在内的政府资源。这不是Blue Dot第一次预测成功,利用类似的AI技术,他们还曾准确预测了埃博拉病毒和巴西寨卡病毒的迁移。

海量数据+最强大脑,AI技术让病毒无处遁形。

美国公开新冠数据集欲借力AI,人工智能如何参与全球战“疫”?