摘要: 在Google的梯度支持下,Send AI提供了一个可自定义的文档处理平台,该平台使用AI进行数据提取。
荷兰初创公司Send AI获得Google Gradient Ventures支持
荷兰一家新兴初创公司Send AI近日获得了Google Gradient Ventures的支持,该公司致力于帮助企业从大量复杂文件中提取数据,确保准确性和安全性。
Send AI的定制化平台可以帮助公司调整人工智能模型,以满足其特定的数据提取需求。与UiPath、Abbyy、Rossum和Kofax等已有的文档处理公司相比,Send AI正在挑战这个领域的老牌公司。
对于在高度监管的保险行业等领域运营的公司来说,处理各种格式的文件可能是一项挑战,包括PDF文件、纸质文件以及手机拍摄的照片。这些非标准的“非结构化”数据类型即使对人类来说也很难解析,而完全依靠机器的方法可能导致错误的索赔拒绝或报销以及行政上的麻烦。
与通常的现成文档处理软件不同,Send AI允许公司训练计算机视觉模型识别特定的文件,并使用单独的语言模型提取和验证相关数据。如果有任何疑问,人类可以通过Web界面进行控制和审查。
Send AI成立于2021年,最初名为Autopilot,总部位于阿姆斯特丹。它之前从一家大学毕业生校友基金筹集了10万美元的投资,现在通过由Google Gradient Ventures和Keen Venture Partners共同领投的一轮预种子融资筹集了220万欧元(240万美元),还有一些来自DeepMind等公司的天使投资者参与。
Send AI如何帮助公司从文件中提取数据
公司可以通过API访问Send AI的基于云的软件,该软件可以从通过电子邮件发送的文件中提取数据。Send AI在接收到文件后,会对其进行视觉增强,然后将其发送给语言模型进行分类和提取。
在目标市场方面,Send AI主要针对大型企业,因为它们“最需要处理文件”,但实际上任何处理大量文件的企业都可以使用这项技术。
除了市场上已经存在的一系列文档处理工具之外,Send AI还面临着一批基于强大的新型大型语言模型构建的服务的新兴初创公司的竞争,比如OpenAI使用GPT-X进行的工作。然而,Send AI的创始人兼首席执行官Thom Trentelman承认,这些产品在需要“主观上好”的得分,如摘要或回答问题的情况下效果很好,但在需要对大量文件进行高度准确的处理时情况就不同了。
Send AI的技术基于较小的开源模型,客户首先通过手动处理一小批文件来训练这些模型,然后再处理新的文件,并有人类提供纠正意见。
在定价方面,Send AI采用基于信用的基本计划,客户按处理步骤付费。Trentelman表示:“这样,我们可以区分处理50页PDF文件和处理单个文本片段的费用。我们的模型价格便宜、快速、可靠,因此我们可以按照每个客户的需求部署它们。这样,客户可以控制自己的数据和性能,这也是我们在健康保险和政府等受监管行业做得很好的原因。”
客户掌控自己的数据
Send AI声称其技术将吸引高度监管的行业,因为它赋予客户对其数据的控制权。然而,尽管所有数据都存储在Send AI的云端,但Trentelman指出,OpenAI等公司的典型大型语言模型是如何工作的,即将多个不同客户的训练数据混合到一个模型中,这可能会导致敏感数据泄露的风险。这正是为什么出现了一系列承诺在基于大型语言模型的软件中保护私密数据的初创公司。
Send AI通过为每个客户部署小型的、隔离的开源转换模型来解决这些问题。
Trentelman表示:“我们使用各种模型来完成工作,初始状态下它们并不令人印象深刻,但一旦通过高质量数据进行训练,它们就变得强大而精确。”
因此,虽然模型和相关的训练数据仍然存储在Send AI的云端,但使用隔离的模型意味着它可以准确地定位数据存储的位置,并在请求时删除数据。Trentelman表示,这足以使Send AI成为“首选候选人”,并且有助于说服注重数据隐私的公司,他们并不仅仅局限于本地部署的选择。
目前,Send AI处于私人测试阶段,但已经拥有一些令人印象深刻的客户,包括保险巨头Axa。公司计划在全面商业化推出之前,在今年的一整年时间里将员工人数翻倍。
暂无评论内容