币游国际平台

OCR文本检测提取

最新更新:Jan-23-2024

云化云型服务提供端对端图像和视频管理解决方案,包括上传、存储、变换、优化和交付提供丰富的图像变换能力,包括裁剪、叠加、图形改进和各种特效

OCR文本检测提取Google视觉API与云形上传变换功能无缝整合从图像提取所有检测到的文本,包括多页文档,如TIFFs和PDFs

可直接为各种目的使用提取文本,例如组织或标签图像外加,您可以利用特殊OCR变换,如模糊化、像素化或用简单变换参数覆盖所有检测文本上的其他图像也可以使用附加文本确保重要文本在裁剪图像时不切除

可使用正常模式加载图片或其他图形图像内或内捕获文本元素文档获取稠密文本模式,如文档扫描期望图像包含非拉定字符时,可指令加载分析图像语言类.

下示例使用OCR常量加像素文本

原创性原创性 像素解析像素解析

开始启动

使用OCR文本检测并提取附加程序前

  • 一定有云型账号万一你还没有,你可以注册免费帐户

  • 注册加载 : 确定您登录到您的账号后再转到增量页码更多附加注册信息见注册添加.

  • 记住本页上的许多例子使用SDKsSDK安装配置细节见相关SDK向导

  • 如果你是新云人,你可能想看一看如何整合云化应用行进基础创建并搭建您的账号,与SDKs合作,并上传、转换并交付资产

重要点
默认时使用此加法的交付URL 签名热切生成.可选择删除此需求 允许无签名附加变换安全性控制台设置页面古典书院 演示文集产品环境应用此设置使页面示例更容易读试

提取检测到文本

JSON响应中图像文件检测到的所有文本都可返回上传更新打个电话

退出内容包括所有退出文本摘要和全抓取文本绑定框坐标加逐文本元素分解(单词或无空格的其他字符集)和绑定框

请求提取文本(加载/更新方法)

请求输入检测文本响应上传更新方法调用设置ocr参数切换adv_ocr图片或图片包含文本元素adv_ocr:document文本重图像最佳效果,如扫描文档

例举上传法使用时

小技巧
可使用 上传预置集中定义一组上传选项,包括加载运算应用,而不是在每次上传调用时具体说明这些选项可定义多上传预设并应用不同预设可创建新上传预设 上传页面 控制台设置或使用 上传_预置管理API方法从 上传控制台设置页面中,您也可以选择默认上传预设集用于图像、视频和原API上传(分别)以及通过媒体库UI执行的图像、视频和原上传预设集

学习更多:上传预置

或使用更新法时

JSON响应解析文本

时分上传图像或执行更新操作)加ocr参数集adv_ocradv_ocr:documentJSON响应中ocr节点下信息库段内

上头ocr响应节点包括以下内容:

  • OCR引擎名称加载adv_ocr)
  • 状态OCR操作
  • 检测到文本定位
  • 外界矩形包含所有检测到文本
  • A级描述性列表检测到文本内容全新字符汉城分行文本组
  • 多页文件类PDFs节点表示包含页
  • 单个检测文本元件和单行矩形描述性单个元素(文本内容)

举例说 节选ocrJSON响应段扫描餐厅接收图像 似似似此

使用提取文本处理图像

提取文本响应后,可依据响应结构访问文本

从图像提取文本方法例子如下:

开工写出检测到文本文件 :

下例中从图像提取文本保存到文件系统图像文本子文件夹使用文件名结果_ .txt .

二叉图像有文本时,用不同的公共标识路径存储

下例中重命名方法用于更新公共图像标识无文本路径并修改公共标识图片文本带_text路径选择

3级标签图文检测

举个例子 恢复扫描到职业网站 检验词是Clusinary、MBA或algorithm如果是,用相关关键字标记恢复文件

模糊或像素检测到文本

多图像可能有文本,如手机号、网站地址、车牌或其他个人或商业数据,而您不希望在交付图像中可见模糊或像素图中检测到全部文本时,可使用云性嵌入式ixelate区域模糊区域效果学并发重力参数集ocr_text.比方说,我们模糊了智能手机上的品牌和模型名

原创性原创性 模糊标识文本模糊标识文本

小技巧
模糊或像素隐藏内容时,你可能想利用其中之一 访问控制选项禁止用户访问非卷发或非分解图像版本

叠加检测成像文本

覆盖基于OCR文本检测的图像类似于进程叠加图像在其他假设中:您指定图像叠加、叠加宽度和重力(定位)叠加时指定ocr_text重力下,每个检测到的文本元自动覆盖指定图像

在大多数情况下,它最有效指定相对宽度,而不是覆盖绝对宽度相对宽度调整叠加图像相对于检测到文本元素大小的大小要做到这一点,只需添加fl_region_relative标志转换,并指定叠加图像宽度为文本元素百分数(1.0=100%)。

举例说,假设你运行房地产网站 个人或公司可以列表家庭出售税赋识别关键是列表不显示私人电话号或其他房地产组织电话号取而代之的是,用网站联系信息叠加图像覆盖上传图像中检测到的任何文本

带图像覆盖文本
原创签名原创签名 签名文本叠加签名文本叠加

文本裁剪

确定图像中文本保留在作物变换期间时,可指定ocr_text成像重力高山市g_ocr文本内URLs)

举例说,下例显示结果itsSnacktime.com下图文本中,如果裁剪成方形并预设重力裁剪汽车重力裁剪或ocr_text重力裁剪:

原创性原创性
默认重力默认重力
(cent)
自重力自重力
(聚焦最突出元素)
ocr_text重力ocr_text重力
(侧重于文本区域)

变换代码最后图像看起来像这样 :

换句话说,在文本仅考虑裁剪优先级时,可设置重力参数切换汽车并发ocr_text选项g_aut:ocr文本高优先级检测文本, 并优先级图像脸部和其他非常突出元素

避免文本

最小化文本裁剪图像的可能性,设置重力参数切换汽车并发ocr_text避免选项g_auto:ocr_text_avoid内URLs)

举例说,在下方图片中,你可能不想要显示花店名称

原创性

使用g_aut本身令商店前端点,但如果使用g_auto:ocr_text_avoid中显示相片侧不显示文本

g_autg_aut g_auto:ocr_text_avoidg_auto:ocr_text_avoid

签名 URLs

云化图像变换URL是敏捷网络移动开发的强工具然而,由于客户访问应用OCR文本检测或提取功能的非计划动态URL的潜在成本,图像转换附加URL需要使用云化认证API签名或可选择热切生成请求衍生图像使用云化认证API

创建签名云式URL时设置sign_url参数真实性构建 URL或图像标签

例举,应用模糊效果生成签名URL

生成云式URL下显示包括签名组件s-BDETEJNU-)唯一带有效签名并匹配请求图像变换的URL将核准即时图像变换和交付

更多签名URL细节见签名交付 URLs.

注解
  • 可选择删除签名URL默认需求允许无签名附加变换安全性云型设置页面
  • 无OCR机制可辨识所有图像中文本的100%结果可能受字体、颜色、文本与后台对比、文本角等等的影响
  • OCR引擎需要图像最小分辨率为1024x768

语言支持

默认时附加支持latin语言可指令加载用非拉定语言执行文本检测adv_ocr值除以冒号举个例子,如果你期望图像包含俄国字符, 定值为adv_ocr:ru.注意,当输入语言代码时,响应结构分解与免响应不同全表支持语言和语言代码.

反馈发送

评分本页 :