我们如何利用多模型、多模态的人工智能系统与人类协同工作,为十多家财富500强医疗保健客户提供真正的效率提升。


在医疗保健领域自动化行政电话并非易事。Infinitus自动化的福利验证和前期授权查询可能需要一个小时,涉及数百次来回交互,要求我们的AI能够跟踪上下文。而且由于这些电话是打给人类的,我们的AI代理必须几乎即时地做出响应,以避免让另一端的人感到困惑或沮丧。


在过去的五年里,无限自动化了超过300万次这样的电话,为医疗后台节省了近7500万分钟的时间,同时实现了显著的成本节约。这些电话代表美国超过80,000个供应商拨出,获取的数据比同等人工拨出的电话至少准确10%。利用Infinitus平台帮助供应商避免了错误的保险索赔拒绝和其他药物获取延迟。


今天,我们很高兴地揭晓这些进展的细节。我希望这种额外的透明度能够揭示问题的复杂性、方法的独创性以及为什么我们对显著改善现状充满信心。

A multi-model, multimodal AI system


当我们于2019年创立Infinitus,旨在自动化复杂的医疗后台电话呼叫,这些呼叫通常持续一个小时或更长时间,涉及数百次来回交互时,许多人认为我们试图解决这个科学问题是在最难以销售的行业之一,这是疯狂的行为。当时,尖端的自然语言处理系统既没有足够大的上下文窗口,也没有足够的知识库来应对如此特定领域的行话、复杂性和标准操作程序。


五年过去了,我们的多模态、多模式平台正在越来越出色地完成更复杂和更具挑战性的任务。上个季度我们处理的通话时长最长达到了3小时15分钟,包含306个对话回合。我们的平台使用了超过100种模型,从高性能的浅层模型到定制微调的自有音频和文本模型,再到大型语言模型(LLM),这些模型使我们能够在呼叫的不同阶段优化用户体验。我们的模型参数范围广泛,从浅层模型的几十个参数以最小化延迟,到我们自有的大型模型拥有1亿个参数,再到我们使用的生成式人工智能模型高达10万亿个参数。


当我们为十多家财富500强企业提供价值时,我们发现仅仅通过在最新的变压器(GPT、Gemini等)模型上简单地包装来确保安全和合规性是远远不够的。


其中一个例子是我们的实时多模态对话崩溃模型。许多会话AI崩溃点只能通过音频信号或音频和文本信号的交集检测到,因此仅使用纯文本模型会导致糟糕的接收者体验和较低的数据质量。


多模态架构解决对话中断问题:

A graphic chart depicting multimodal architecture to solve dialogue breakdowns.


使用和未使用多模态对话崩溃模型的会话轮次示例集:

A chart illustrating an example set of conversational turns with and without the multimodal dialogue breakdown model.


这得益于我们世界一流的人工智能科学家、研究员和工程师团队。以下是我们研究组发表的一些论文:


  • 2024年:面向会话式人工智能模型的多模态情境对话崩溃检测

  • 2024年:用于复杂电话通话中下一步行动预测的图集成语言变压器

  • 2023年:利用显式程序指令提高数据高效的动作预测能力


人类与人工智能协同运作


像大多数现代人工智能系统一样,我们也从人类反馈中学到了很多东西。我们在医疗后台呼叫的人类反馈语料库是巨大的:它跨越了超过3亿个话语,这些话语已经进入了我们的基础平台,现在自动化了大部分时间花费在任务上的过程。


无限人生在每个呼叫之前、期间和之后都采用了人类参与的机器学习技术。这不仅使我们能够提供比同等人工呼叫者更高的准确性,而且还允许我们不断改进我们的系统的能力和自主能力。


我们的目标始终是向那些从我们系统接收电话的人提供无缝体验,同时为使用我们服务的人提供无与伦比的品质水平。人类在实现这一目标方面扮演着许多角色,无论是我们的对话设计师,他们利用我们在经验中制定的最佳实践和标准操作程序来配置对话,还是我们的AI培训团队,他们在“破窗”时刻被路由到通话中来帮助我们的AI代理导航通过一个尚未遇到的边缘案例,或者是我们的质量保证团队,他们可以听取呼叫片段并根据需要纠正输出。


在我们组建这个团队的过程中,我们代表了所有我们服务或希望服务的客户角色(提供者、支付方、药店、制药公司)。虽然改进我们的AI系统是这个团队的主要责任,但为新型AI系统提供一个值得信赖的指导方针也是我们的客户非常看重的。

A chart showing the involvement of humans in Infinitus's call process.


履行质量承诺


在一项内部研究中,我们对一组代表性的大型医疗和PBM支付方患者样本进行了为期四天的双重福利验证任务,每个患者进行了两次验证。我们的目标是查看我们收到的结果的一致性。我们发现,这些平行呼叫中有30%至少有一个关键数据元素,由支付方代理报告给我们的值不同。


为了应对这一挑战,我们的AI系统借鉴了一个强大的内部知识图谱,其中包含了我们从数百万个呼叫、EDI访问、支付方API和政策文件中收集到的最新的支付方规则和指南情报。我们平台这个部分的影响得到了客户的高度评价,因为它减少了下游拒绝,同时也受到了支付方合作伙伴的赞赏,因为它提供了一定程度的实时质量保证,从而减少了更正回呼。


以下是我们知识图谱为我们的系统提供的两个示例:

video preview image of blue and aqua gradients


为医疗保健创造时间


在无限健康公司的愿景一直是让医疗服务“无需等待”。我们相信人工智能拥有“无限”的可能性来解决复杂问题,帮助我们实现为医疗保健腾出时间的使命。我们的系统使我们能够在数十个治疗领域和数百种专科药物、手术和检测中创建多个标准化的呼叫流程。我们正在提高收集数据的准确性和透明度,同时减少治疗时间,保持灵活性,这是我们的客户经常强调的一个好处。


如需了解更多关于无限或我们的定制AI系统的信息,请观看演示视频或联系我们团队的一名成员。