基于AI通用文字识别的分布式应用畅想
头像 Tiechui.Wang 2021-05-25 10:00:00    发布
2148 浏览 0 点赞 0 收藏


日常工作中,我们经常会遇到需要将图片上的文字信息提取出来,进行拷贝或者编辑的情况。比如身份证信息录入、快递订单填写、课堂笔记图片整理成文档等等。如果对照图片进行打字输入,频繁切屏、分屏的操作会让人不胜其烦。


HarmonyOS基于AI的通用文字识别功能


可以帮助我们有效解决这些难题


基于AI通用文字识别的分布式应用畅想

什么是基于AI的通用文字识别?


通用文字识别的核心技术是OCR(Optical Character Recognition,光学字符识别),是一种通过拍照、扫描等光学输入方式,把各种票据、卡证、表格、报刊、书籍等印刷品文字转化为图像信息,再利用文字识别技术将图像信息转化为计算机等设备可以使用的字符信息的技术。


基于AI的通用文字识别,将OCR技术和AI分词技术集成,可以对图像信息进行文字检测、识别和关键信息提取,并根据分析结果提供翻译、搜索等相关服务,例如:


基于AI通用文字识别的分布式应用畅想

基于AI的通用文字识别的应用场景


基于AI的通用文字识别可用于图片中的文本区域检测、文本内容识别场景。应用场景包括但不限于:


1、进行文档翻拍、街景翻拍等图片来源的文字检测和识别,然后根据识别结果进行翻译、搜索等。


2、处理来自相机、图库等多种来源的图像数据,提供一个自动检测文本、识别图像中文本位置以及文本内容功能的开放接口。


3、可以用于身份证、驾驶证、银行卡、发票、订单、火车票等卡证的识别,以及表格识别、文档转换、相册管理等应用场景。


基于AI的通用文字识别实例演示


官网已经发布了基于AI通用文字识别的相册搜索Codelabs。它的图片集就是我们日常拍摄的照片,样式各异,基本囊括了文本倾斜、拍摄角度倾斜、光照条件复杂、文本背景复杂等常见特点。


输入关键词“龙山街垃圾分类”,程序通过分词技术提取文本的关键信息后,对图片集进行检测、识别、匹配,筛选出包含“龙山街”或者“垃圾“这两个关键信息的图片。


基于AI通用文字识别的分布式应用畅想


我们知道,HarmonyOS最显著的特点是面向全场景的分布式能力。多种设备之间实现硬件互助、资源共享,依赖的关键技术包括分布式软总线、分布式设备虚拟化、分布式数据管理、分布式任务调度等。基于AI的通用文字识别,加上HarmonyOS的分布式能力,可以设计出怎样有趣的应用呢?


扫描全能王


2020年12月30日,在上海举办的“华为开发者日暨 HarmonyOS 2.0手机应用开发者 Beta活动“现场,扫描全能王展示了适配HarmonyOS系统后的全新特性。


扫描全能王是一款专注于移动扫描的APP。用户用手机扫描纸质文档,通过HarmonyOS的AI通用文字识别功能和多屏流转特性,实现在大屏上展示、缩放、涂鸦等各种操作,还可以多人接收,同时编辑。这是HarmonyOS的分布式数据管理技术。用户数据不再与单一物理设备绑定,业务逻辑与数据存储分离,跨设备的数据处理如同本地数据处理一样方便快捷。


快递信息智能提取,集中处理


目前,通用文字识别技术在快递行业得到了广泛运用。快递人员仅需要使用手机扫描快递单,系统后台会自动执行拍照,图片文字识别和提取,订单信息上传三步操作。相比手工录入,效率大幅度提高。但是受手机性能和网络信号等因素的影响,录入快递单仍会话费较长时间,1单需要10秒左右。特别是中大型快递代收点,对快递单录入的效率,有更高的要求。


如果搭载HarmonyOS操作系统,就可以进一步提高快递单的录入速度。HarmonyOS的分布式设备虚拟化技术融合多种设备形成一个超级虚拟终端。用户需要执行某项业务时,系统选择合适的设备去执行,充分发挥不同终端的能力优势。


回到快递单录入的需求,快递员扫描快递单,手机后台仅需执行拍照操作,文字识别提取和信息上传的业务流转到其它终端(如计算机)执行,如此可大大缩短订单录入的时间。


基于AI通用文字识别的分布式应用畅想


团队寻宝


基于分布式场景拥有的方位信息,我们还可以构思一个团队寻宝类游戏。将现实中的场地,如办公楼作为游戏地图。在办公楼内的门牌、指示牌、广告牌等地方埋入寻宝线索。


通关游戏需要合理利用每人的方位信息,以最快速度寻找相关指示文字,用手机识别出寻宝线索,并共同思考推理宝藏的埋藏方式与取出方式。


大家可以尽情开展脑洞,畅想一下还有哪些新奇有趣的分布式玩法。点击→参加论坛活动,分享你的分布式应用构思,赢取HarmonyOS定制礼品!


下载HUAWEI DevEco Studio,体验HarmonyOS跨设备应用的高效便捷开发,构思属于你的分布式爆款应用吧!


扫描二维码注册华为帐号


开启HarmonyOS应用开发之旅


基于AI通用文字识别的分布式应用畅想

©本站发布的所有内容,包括但不限于文字、图片、音频、视频、图表、标志、标识、广告、商标、商号、域名、软件、程序等,除特别标明外,均来源于网络或用户投稿,版权归原作者或原出处所有。我们致力于保护原作者版权,若涉及版权问题,请及时联系我们进行处理。
分类
其它
地址:北京市朝阳区北三环东路三元桥曙光西里甲1号第三置业A座1508室 商务内容合作QQ:2291221 电话:13391790444或(010)62178877
版权所有:电脑商情信息服务集团 北京赢邦策略咨询有限责任公司
声明:本媒体部分图片、文章来源于网络,版权归原作者所有,我司致力于保护作者版权,如有侵权,请与我司联系删除
京ICP备:2022009079号-2
京公网安备:11010502051901号
ICP证:京B2-20230255