向善而生的AI助盲,让AI多一点,障碍少一点******
有人说,盲人与世界之间,相差的只是一个黎明。在浪潮信息研发人员的心中,失去视力的盲人不会陷入永夜,科技的进步正在力图给每一个人以光明未来。
AI助盲在人工智能赛道上一直是最热门的话题之一。以前,让失明者重见光明依靠的是医学的进步或“奇迹”。而随着以“机器视觉+自然语言理解”为代表的多模态智能技术的爆发式突破,更多的失明者正在借助AI提供的感知、理解与交互能力,以另一种方式重新“看见世界”。
新契机:多模态算法或将造福数以亿计失明者
科学实验表明,在人类获取的外界信息中,来自视觉的占比高达70%~80%,因此基于AI构建机器视觉系统,帮助视障患者拥有对外界环境的视觉感知与视觉理解能力,无疑是最直接有效的解决方案。
一个优秀的AI助盲技术,需要通过智能传感、智能用户意图推理和智能信息呈现的系统化发展,才能构建信息无障碍的交互界面。仅仅依靠“一枝独秀”超越人类水平的单模态人工智能比如计算机视觉技术还远远不够,以“机器视觉+自然语言理解”为代表的多模态算法的突破才是正确的新方向和新契机。
多个模态的交互可以提升AI的感知、理解与交互能力,也为AI理解并帮助残障人士带来了更多可能。浪潮信息研发人员介绍说,多模态算法在AI助盲领域的应用一旦成熟,将能够造福数以亿计的失明者。据世卫组织统计,全球至少22亿人视力受损或失明,而我国是世界上盲人最多的国家,占世界盲人总数的18%-20%,每年新增的盲人数量甚至高达45万。
大挑战:如何看到盲人“眼中”的千人千面
AI助盲看似简单,但多模态算法依然面临重大挑战。
多模态智能算法,营造的是沉浸式人机交互体验。在该领域,盲人视觉问答任务成为学术界研究AI助盲的起点和核心研究方向之一,这项研究已经吸引了全球数以万计的视障患者参与,这些患者们上传自己拍摄的图像数据和相匹配的文本问题,形成了最真实的模型训练数据集。
但是在现有技术条件下,盲人视觉问答任务的精度提升面临巨大挑战:一方面是盲人上传的问题类型很复杂,比如说分辨冰箱里的肉类、咨询药品的服用说明、挑选独特颜色的衬衣、介绍书籍内容等等。
另一方面,由于盲人的特殊性,很难提取面前物体的有效特征。比如盲人在拍照时,经常会产生虚焦的情况,可能上传的照片是模糊的或者没有拍全,或者没拍到关键信息,这就给AI推理增加了难度。
为推动相关研究,来自卡内基梅隆大学等机构的学者们共同构建了一个盲人视觉数据库“VizWiz”,并发起全球多模态视觉问答挑战赛。挑战赛是给定一张盲人拍摄的图片和问题,然后要求给出相应的答案,解决盲人的求助。
另外,盲人的视觉问答还会遭遇到噪声干扰的衍生问题。比如说,盲人逛超市,由于商品外观触感相似,很容易犯错,他可能会拿起一瓶醋却询问酱油的成分表,拿起酸奶却询问牛奶的保质期等等。这种噪声干扰往往会导致现有AI模型失效,没法给出有效信息。
最后,针对不同盲人患者的个性化交互服务以及算法自有的反馈闭环机制,同样也是现阶段的研发难点。
多解法:浪潮信息AI助盲靶向消灭痛点
AI助盲哪怕形式百变,无一例外都是消灭痛点,逐光而行。浪潮信息多模态算法研发团队正在推动多个领域的AI助盲研究,只为帮助盲人“看”到愈发精彩的世界。
在VizWiz官网上公布的2万份求助中,盲人最多的提问就是想知道他们面前的是什么东西,很多情况下这些物品没法靠触觉或嗅觉来做出判断,例如 “这本书书名是什么?”为此研发团队在双流多模态锚点对齐模型的基础上,提出了自监督旋转多模态模型,通过自动修正图像角度及字符语义增强,结合光学字符检测识别技术解决“是什么”的问题。
盲人所拍摄图片模糊、有效信息少?研发团队提出了答案驱动视觉定位与大模型图文匹配结合的算法,并提出多阶段交叉训练策略,具备更充分的常识能力,低质量图像、残缺的信息,依然能够精准的解答用户的求助。
目前浪潮信息研发团队在盲人视觉问答任务VizWiz-VQA上算法精度已领先人类表现9.5个百分点,在AI助盲领域斩获世界冠军两项、亚军两项。
真实场景中的盲人在口述时往往会有口误、歧义、修辞等噪声。为此,研发团队首次提出视觉定位文本去噪推理任务FREC,FREC提供3万图片和超过25万的文本标注,囊括了口误、歧义、主观偏差等多种噪声,还提供噪声纠错、含噪证据等可解释标签。同时,该团队还构建了首个可解释去噪视觉定位模型FCTR,噪声文本描述条件下精度较传统模型提升11个百分点。上述研究成果已发表于ACM Multimedia 2022会议,该会议为国际多媒体领域最顶级会议、也是该领域唯一CCF推荐A类国际会议。
在智能交互研究方面上,浪潮信息研发团队构建了可解释智能体视觉交互问答任务AI-VQA,同时给出首个智能体交互行为理解算法模型ARE。该研究成果已发表于ACM Multimedia 2022会议。该研究项目的底层技术未来可广泛应用于AI医疗诊断、故事续写、剧情推理、危情告警、智能政务等多模态交互推理场景。
眼球虽然对温度并不敏感,但浪潮信息的研发团队,却在努力让盲人能“看”到科技的温度,也希望吸引更多人一起推动人工智能技术在AI助盲、AI反诈、AI诊疗、AI灾情预警等更多场景中的落地。有AI无碍,跨越山海。科技的伟大之处不仅仅在于改变世界,更重要的是如何造福人类,让更多的不可能变成可能。当科技成为人的延伸,当AI充满人性光辉,我们终将在瞬息万变的科技浪潮中感受到更加细腻温柔的善意,见证着更加光明宏大的远方。
政策转换与春运叠加是否会加大疫情风险?卫健委回应******
今天(1月8日)开始,我国新冠病毒感染正式实施“乙类乙管”。目前全国新冠病毒感染疫情的总体态势如何?政策转换与春运叠加是否会加大疫情风险?我国的医疗资源准备兜不兜得住老百姓的就医需求?就公众关心的问题,总台央视记者独家专访了国家卫生健康委医政司司长焦雅辉。
总台央视记者史迎春:实施“乙类乙管”以后,不再进行大规模的核酸检测了,这样老百姓对于整个疫情情况的了解只是来源于身边的感受。从全国来看,现在我们疫情形势到底是什么样子的?
国家卫生健康委医政司司长焦雅辉:2022年12月中旬,全国发热门诊的就诊量进入了一个快速上升的阶段。到12月下旬和2023年元旦的时候,急诊量进入了一个高峰期,急诊高峰意味着重症救治的高峰也同步到来。从现在全国的情况来看,全国主要的城市,也就是直辖市、省会城市,包括一些计划单列市,这些中心城市正在渡过或者已经渡过感染的高峰。现在从这些大城市的情况来看,急诊和重症的高峰,尤其是急诊也出现了回落的迹象,重症救治是处在一个高位平台期。在春运之前,中小城市和农村地区实际上也已经迎来了感染的一个高峰。根据这个趋势来看,在春运期间有可能会迎来这些中小城市和农村地区急诊和重症的一个发病高峰。
总台央视记者 史迎春:“乙类乙管 ”提出把新冠肺炎更名为新冠病毒感染,但从老百姓实际的感受看,肺炎的人数并不少,为什么会出现这样的情况?
国家卫生健康委医政司司长焦雅辉:在之前每一版的诊疗方案里,轻型是有发热、咳嗽、咽痛这样一些症状,但是轻型是没有肺炎表现的。普通型就是出现了肺炎了,从2022年我们国家的奥密克戎临床病例的分型情况来看,出现肺炎,也就是普通型的占比还是相当低的,不到10%,大概是8%左右。现在因为感染的基数大了,出现肺炎的绝对数值一定是大的,因为我们国家人口基数大,再低的比例,变成绝对值,都是一个不小的数目。
总台央视记者史迎春:在春运的背景下,我们1月8日开始实施“乙类乙管”,您觉得这个高峰会不会超过前面的高峰?
国家卫生健康委医政司司长焦雅辉:因为我们国家人口主要还在这些大城市,人口数量大、密度也大。这些直辖市、省会城市和主要中心城市已经渡过了感染的高峰。现在有一些中小城市,包括农村,应该说感染率也已经达到了一定程度。所以我认为在春运期间、春节前后不一定是一个感染的高峰,但是有可能会出现急诊和重症的高峰。
焦雅辉介绍,从去年12月到今年年初以来,全国三级医院,包括地市级医院、县医院急诊和重症监护室的床位使用率快速增长。记者在梳理官方公布的数据时发现,截至去年12月25日,全国二级以上医院重症床位使用率约为54%,而目前,全国二级以上医院重症床位的使用率达到了约为80%。城市和农村同时出现感染率增长的局面,我国的新冠病毒感染医疗救治任务面临前所未有的挑战。
焦雅辉介绍,早在去年上半年,国家卫生健康委就已经印发了应对奥密克戎大规模感染要做好准备的工作方案。去年11月下旬,国家卫生健康委再次印发了要求各地加强医疗资源准备工作的方案。方案指出,各地要抓住窗口期,加快推进各项准备,二级以上医院和基层医疗卫生机构发热门诊和发热诊室,要应设尽设、应开尽开,所有的医疗机构都要接诊发热患者,配备常用退烧药、中药,要求把方舱医院升级改造成亚定点医院,对各级医院的重症床位的比例、人员培训都提出了非常明确的要求。
实施“乙类乙管”后,我国疫情防控工作重心从预防转向救治,围绕“保健康、防重症”的目标,刻不容缓做好医疗资源准备。
1月7日,一年一度的春运拉开帷幕。1月8日,我国正式实施新冠“乙类乙管”。对于即将迎来的大规模人员流动,焦雅辉表示,在春节期间,更大的考验在于农村的重症救治压力。农村地区急救体系相对薄弱、救治资源包括人员药物等相对缺乏,其中最大的挑战是农村的重症病人能不能及时转上来。
总台央视记者史迎春:上一次您在接受采访时说“药能下去,人能上来”,这个“人上来”是怎么安排的,有没有一些准备?
国家卫生健康委医政司司长焦雅辉:中组部、民政部、农业农村部、国家卫健委几个部门也牵头专门制定了一个农村的疫情防控方案,并且提出要按照脱贫攻坚的五级书记抓脱贫这样一个模式,由五级书记来抓农村的疫情防控。特别是要求基层的党组织、村里的两委,包括县乡的党政组织,要组织车辆、组织运力,在出现农村重症患者的时候,快速协助把这些重症患者转运。首先最起码要转到县医院,如果超出县医院救治能力,如果患者还能够转运,那就转到城市的三级医院。我们要求市县之间建立这种转诊的绿色通道,如果转不了,那就三级医院的专家团队带着设备下来驻点到县医院,来帮助开展重症患者的医疗救治。
总台央视记者 史迎春:从整个疫情防控来看,您觉得这三年发生了什么样的变化?
国家卫生健康委医政司司长焦雅辉:我们从体系上、能力上、人员队伍上、应对的心态,各个方面都表现出了很大的不同。从临床上看到的病情来讲,虽然大家感觉现在肺炎比较多,但是从临床上反馈过来的信息看,同样是肺炎,现在的肺炎和三年前的肺炎,影响程度是不一样的。现在的肺炎绝大多数经过及时治疗和干预,是可以拉回来的,也就是说可以治好的。而且波及的人群也不一样,三年前在武汉波及的人群主要是青壮年比较多,现在波及的人群更多的是脆弱人群,就是高龄的、有基础疾病的,最重要的是没有接种疫苗的这些人员,受波及影响的范围更大。所以我觉得变化是体现在方方面面的。“曙光就在前头”,我觉得我们一定能取得胜利。
(总台央视记者 史迎春)
(文图:赵筱尘 巫邓炎)