蝉镜

FormX.ai怎么用

功能简介:FormX.ai是一款基于人工智能技术的在线数据提取工具,它能够从文档照片中提取信息并以JSON格式返回结构化数据对。通过OCR、Regex和AI技术,FormX.ai能够将物理文档中的信息转换为Excel等结构化数字数据,简化数据处理流程。

网站详情 ( 由智搜AI导航站提供技术支持 )

FormX.ai怎么用简介:

FormX.ai使用指南

FormX.ai是一款基于人工智能技术的在线数据提取工具,它能够从文档照片中提取信息并以JSON格式返回结构化数据对。通过OCR(光学字符识别)、Regex(正则表达式)和AI技术,FormX.ai能够将物理文档中的信息转换为Excel等结构化数字数据,简化数据处理流程。它适用于需要处理大量数据、希望减少重复性劳动的开发者和企业用户,如金融机构、房地产公司、律师事务所等。

操作步骤

一、创建新的提取器
  1. 登录FormX.ai平台

    首先,访问FormX.ai的官方网站(https://formx.ai),并使用您的账号登录平台。如果您还没有账号,可以先进行注册。

  2. 进入“提取器”页面

    登录后,在平台首页或导航栏中找到“提取器”页面,并点击进入。

  3. 创建新的提取器

    在“提取器”页面中,点击“创建新的提取器”按钮。此时,您需要选择想要提取的文档类型,如“收据”、“发票”、“身份证”等,并为提取器命名。

二、上传样本图像并训练模型
  1. 上传样本图像

    在创建新的提取器后,您需要上传0-100个样本图像以供FormX.ai进行训练。这些样本图像应与您想要提取的文档类型相匹配,并包含您需要提取的数据。

  2. 标记数据

    上传样本图像后,FormX.ai将自动进行初步的数据识别。此时,您需要手动标记数据以训练新的机器学习模型。标记过程通常包括选择带有锚点的区域(所有文档都相同的部分)和带有数据的区域。

  3. 训练模型

    标记完数据后,点击“训练模型”按钮。FormX.ai将使用您提供的样本图像和标记数据来训练新的机器学习模型。训练过程可能需要一些时间,具体时间取决于您的样本数量和复杂度。

三、测试并提取数据
  1. 测试提取器

    模型训练完成后,您可以进入“测试”标签页,拖拽一张与训练样本相似的文档照片进行测试。FormX.ai将自动提取照片中的信息,并以JSON格式返回结构化数据对。

  2. 查看提取结果

    在测试完成后,您可以查看提取结果并与原始文档进行比对。如果提取结果准确无误,您可以继续使用该提取器进行批量数据提取。

  3. 批量提取数据

    如果您需要批量提取数据,可以将多张文档照片上传到FormX.ai平台,并选择之前创建的提取器进行批量处理。FormX.ai将自动提取每张照片中的信息,并将结果导出为Excel等结构化数字数据。

四、自定义提取规则
  1. 进入自定义规则页面

    在FormX.ai平台中,您还可以根据自己的需求自定义提取规则。进入“自定义规则”页面,您可以设置特定的提取条件、数据格式等。

  2. 设置提取规则

    在自定义规则页面中,您可以根据文档的特点和需求设置特定的提取规则。例如,您可以指定某个字段的提取范围、数据类型、默认值等。

  3. 保存并应用规则

    设置完提取规则后,点击“保存”按钮。此时,您可以选择将该规则应用到之前创建的提取器中,或者创建一个新的提取器并应用该规则。

注意事项

  1. 确保样本图像质量

    在上传样本图像时,请确保图像清晰、完整且没有遮挡物。低质量的图像可能会影响模型的训练效果和提取结果的准确性。

  2. 合理设置提取规则

    在自定义提取规则时,请根据您的实际需求合理设置提取条件和数据格式。过于复杂或不必要的规则可能会增加处理时间和出错率。

  3. 定期更新模型

    如果您的文档类型或数据格式发生变化,请及时更新您的提取器和模型以适应新的需求。定期更新模型可以提高提取结果的准确性和效率。

  4. 保护数据安全

    在使用FormX.ai平台时,请注意保护您的数据安全。避免将敏感信息上传到平台或在不安全的网络环境下使用平台。同时,定期备份您的数据和提取器以防止数据丢失。

网址设置

网址样式切换

详细

网址卡片按钮

显示

布局设置

左侧边栏菜单

展开

页面最大宽度

1900px