FormX.ai怎么用
功能简介:FormX.ai是一款基于人工智能技术的在线数据提取工具,它能够从文档照片中提取信息并以JSON格式返回结构化数据对。通过OCR、Regex和AI技术,FormX.ai能够将物理文档中的信息转换为Excel等结构化数字数据,简化数据处理流程。
FormX.ai怎么用简介:
FormX.ai使用指南
FormX.ai是一款基于人工智能技术的在线数据提取工具,它能够从文档照片中提取信息并以JSON格式返回结构化数据对。通过OCR(光学字符识别)、Regex(正则表达式)和AI技术,FormX.ai能够将物理文档中的信息转换为Excel等结构化数字数据,简化数据处理流程。它适用于需要处理大量数据、希望减少重复性劳动的开发者和企业用户,如金融机构、房地产公司、律师事务所等。
操作步骤
一、创建新的提取器
登录FormX.ai平台
首先,访问FormX.ai的官方网站(https://formx.ai),并使用您的账号登录平台。如果您还没有账号,可以先进行注册。
进入“提取器”页面
登录后,在平台首页或导航栏中找到“提取器”页面,并点击进入。
创建新的提取器
在“提取器”页面中,点击“创建新的提取器”按钮。此时,您需要选择想要提取的文档类型,如“收据”、“发票”、“身份证”等,并为提取器命名。
二、上传样本图像并训练模型
上传样本图像
在创建新的提取器后,您需要上传0-100个样本图像以供FormX.ai进行训练。这些样本图像应与您想要提取的文档类型相匹配,并包含您需要提取的数据。
标记数据
上传样本图像后,FormX.ai将自动进行初步的数据识别。此时,您需要手动标记数据以训练新的机器学习模型。标记过程通常包括选择带有锚点的区域(所有文档都相同的部分)和带有数据的区域。
训练模型
标记完数据后,点击“训练模型”按钮。FormX.ai将使用您提供的样本图像和标记数据来训练新的机器学习模型。训练过程可能需要一些时间,具体时间取决于您的样本数量和复杂度。
三、测试并提取数据
测试提取器
模型训练完成后,您可以进入“测试”标签页,拖拽一张与训练样本相似的文档照片进行测试。FormX.ai将自动提取照片中的信息,并以JSON格式返回结构化数据对。
查看提取结果
在测试完成后,您可以查看提取结果并与原始文档进行比对。如果提取结果准确无误,您可以继续使用该提取器进行批量数据提取。
批量提取数据
如果您需要批量提取数据,可以将多张文档照片上传到FormX.ai平台,并选择之前创建的提取器进行批量处理。FormX.ai将自动提取每张照片中的信息,并将结果导出为Excel等结构化数字数据。
四、自定义提取规则
进入自定义规则页面
在FormX.ai平台中,您还可以根据自己的需求自定义提取规则。进入“自定义规则”页面,您可以设置特定的提取条件、数据格式等。
设置提取规则
在自定义规则页面中,您可以根据文档的特点和需求设置特定的提取规则。例如,您可以指定某个字段的提取范围、数据类型、默认值等。
保存并应用规则
设置完提取规则后,点击“保存”按钮。此时,您可以选择将该规则应用到之前创建的提取器中,或者创建一个新的提取器并应用该规则。
注意事项
确保样本图像质量
在上传样本图像时,请确保图像清晰、完整且没有遮挡物。低质量的图像可能会影响模型的训练效果和提取结果的准确性。
合理设置提取规则
在自定义提取规则时,请根据您的实际需求合理设置提取条件和数据格式。过于复杂或不必要的规则可能会增加处理时间和出错率。
定期更新模型
如果您的文档类型或数据格式发生变化,请及时更新您的提取器和模型以适应新的需求。定期更新模型可以提高提取结果的准确性和效率。
保护数据安全
在使用FormX.ai平台时,请注意保护您的数据安全。避免将敏感信息上传到平台或在不安全的网络环境下使用平台。同时,定期备份您的数据和提取器以防止数据丢失。