释放医疗文本大数据价值,森亿智能看好医保和药企潜在需求

发表于 讨论求助 2022-06-25 15:43:31

家用扫地机

中国人口全球第一,每年诊疗人次接近 80 亿,积累下来的医学文本信息可以用海量来形容。如何挖掘这些信息数据的潜在价值并寻找合适的应用场景,是森亿智能一直思考的问题。

森亿智能是一家专注于利用人工智能进行医学文本自动分析和数据二次应用的公司,其人工智能系统使用自然语言处理技术,批量抓取病历、病理学报告、文字版医学影像报告等文本中的关键信息,并按照不同的信息维度生成一个结构化数据库,输出不同的分析结果。

森亿智能CEO张少典直言对于医疗文本信息的解析并不局限于辅助医生进行诊断,医疗类人工智能企业未来的盈利点更可能是保险公司和药企,比如对于保险公司来说,如何通过信息解析帮助他们发现并减少过度医疗行为,对于药企来说则是如何帮助他们监控新产品的安全性。

但在相关市场成熟之前,医疗类人工智能公司需要做的更多是增加数据处理量,优化算法模型的精度。这就绕不开医院以及和涉及到医疗数据的企业。

张少典告诉36氪,数据处理都是需要算法模型+训练数据的。在算法模型方面,他们首先是建立了一个全科室的算法模型,这种全科室算法模型可以看做是一条通用流水线,可以在满足精度的条件下处理比较常见的病种,处理精度也随着数据量的增加而提高。但是通用流水线也会遇到特殊的“产品”,某些病种若依然使用这种全科室的算法模型进行处理,即使有足够大的数据量也达不到精度需求。因此森亿智能会根据不同的病种特性对这条通用流水线上的的算法参数进行增补以及调试。

这种做法的好处在于,一旦搭建好了某个病种的算法架构,在之后的项目合作中就可以不断地复制和粘贴。现在森亿智能的合作流程已经基本标准化,森亿智能将模型和解析流程接入医院的私人平台,医院将电子文本信息录入模型中。张少典表示完成模型接入和数据录入基本需要5天左右的时间,比传统依靠人力进行整合和分析在效率上提高了千倍。而森亿智能人工智能系统文本信息处理的精度基本能和医院的具备普通经验的医生持平,达到92%-93%的水平,对于一些数据量比较大的病种,精度可以达到95%-96%。

在训练数据方面,从去年4月成立至今,森亿智能已完成了百万份以上的病历处理,主要来自合作的三甲医院以及医疗相关的企业,比如医疗IT和医疗大数据企业。张少典表示病历作为医院的核心资产是比较私密的,而森亿科技并不会接触到这些核心数据,正如上文所提整套模型和解析流程会接入医院的私人平台,而病历数据的录入也是由医院人员来完成,保障了这些核心资产的安全性。

而我国各地的三甲医院实现电子病历已经十年多,这些海量的病历数据在算法模型的训练和优化中起到了至关重要的作用。张少典告诉36氪,现在森亿智能已经拥有其院级客户3、4家,科室级客户十多个,以及十余家企业客户。张少典表示和三甲医院的合作多以项目制进行收费,企业级客户则多是以系统资源调用次数来进行收费。

其实除了文本信息,医疗影像的处理也被创投圈普遍看好,并衍生了多家创业公司,比如iDoctor、医众、微云等。但是做文本信息处理的创业公司则比较少见,张少典告诉36氪,一方面图像的应用场景往往更直接,更容易产品化,而自然语言处理流程更多、涉及到技术细节也更琐碎,同时医学自然语言处理由于是交叉学科,人才储备更少。森亿智能在人才方面同时具备医疗和算法团队,森亿智能CEO张少典哥伦比亚大学医学信息学博士,曾在微软研究院、微软亚洲研究院、纽约长老会医院等从事医疗数据挖掘研究。

森亿智能已于去年底完成天使轮近千万的融资,领投方为真格基金,由华岩资本和树兰医疗跟投。

发表
26906人 签到看排名